Hizkuntzalari Euskaldunen I. Topaketa

Arrakastatsua izan da Hizkuntzalari Euskaldunen I. Topaketa. UEUko Hizkuntzalaritza Sailburuak diren Itziar Aduriz eta Ruben Urizar IXAkideek balorazio oso positiboa egin dute bilkuraz.

Lau izan dira bilkuran Ixa Taldearen aldetik aurkeztu diren lanak:

  • Euskarazko testuen sinplifikazio automatikoa. Itziar Gonzalez Dios
  • EPEC corpusa predikatu mailan etiketatzeko eta ustiatzeko oinarriak: BVI, EPEC-RoISem eta e-ROLda. Ainara Estarrona
  • Ezagutza linguistikoa Ingelesa-Euskara itzulpen automatikoko sistemen garapenean. Nora Aranberri
  • BASYQUE: hizkeren arteko aldakortasun sintaktikoa aztertzeko aplikazioa. Gotzon Santander, Xan Aire, Larraitz uria eta Ricardo Etxepare (CNSR-IKER / UPV-EHU, IXA)

Zorionak, hizkuntzalariok!

Edurne Elizondoren albistea Berrian
(Arg.: A. Canellada, ARP)

TC3 aldizkarian argitaratu dugu Berbatek proiektuko uzta

TC·_2013_BerbatekTranslation: Computation, Corpora, Cognition (TC3) aldizkari berriak itzulpengintzako lanak argitaratzen ditu modu elektronikoan eta atzipen libreko filosofiarekin.

TC3 aldizkari honek argitaratu berri du gure artikulu bat non ETORTEK deialdiko Berbatek proiektuan sortu genituen demoak deskribatzen ditugun. Proiektuaren garapenean darabilgun filosofia ere azaltzen dugu artikuluan.

Hiru demo hauek prestatu eta aurkeztu genituen prentsaurreko batean:

Artikulua TC3 aldizkariko ale berezi batean atera da:
Vol 3, No 1 (2013): Special Issue on Language Technologies for a Multilingual Europe
Hau da: Europa eleaniztunarentzako Hizkuntza Teknologiak.

Beraz… ondo kokatuta dago gure artikulu hori 🙂

The BerbaTek project for Basque: Promoting a less-resourced language via language technology for translation, content management and learning
Translation: Computation, Corpora, Cognition (TC3) journal. Vol 3, No 1, pp: 119-135 (2013). http://www.t-c3.org/index.php/t-c3/article/view/24/34

Eman eta zabal zazu

 

 

Ahora! Euskara lantzeko tresnak, robot bertsolariak eta Kilometroak2013 jaia

BerriaIxaLaskorain

2013ko Kilometroak jaiaren harira, erronka bitxia izan dute atzo Tolosako Laskorain ikastolako neska-mutilek Donostiako Informatika Fakultatean: robotekin aritu dira bertsotan.

Fakultateko Ixa Taldeak eta Robotikako ikertaldeak euskararekin lotu dituzte teknologia berriak eta ikerketa.

 

Horrela jaso dute gaur Berrian (hainbat zuzenketa egin dizkiegu bertan esandakoei):

Euskara sarean hizkuntza praktikoa bihur dadin, Ixa taldeak hizkuntzaren morfologia, sintaxia eta semantika landuko dituzten aplikazioak asmatu ditu.

[…]Gaur egun euskararekin lan egiteko oso eraginkorra bilakatu den Xuxen zuzentzaile ortografikoaz gain, OpenTrad itzultzaile automatikoa, Euskal WordNet sarea eta ZT eta EPEC corpusak sortu dituzte, eta etorkizunera begira PATHSNewsReaderREADERS eta  OpeNER proiektu europarrak aurrera ateratzeko ari dira lanean.

Berria_Ixa_Laskurain_Kontrazala

[…]Horrekin batera, Ixa taldea Herrialde Katalanetako zein Galiziako informatikariekin ari da lanean OpenTrad izeneko programa aurrera ateratzeko; programa horrek esaldi osoak itzultzeko gaitasuna dauka. Jada Google Translator programa baino eraginkorragoa bilakatu da.

[…]Baina aisialdiarekin lotutako aplikazioetan ere sartu dira, eta, adibidez, sakelakoetan erabiltzen den Angry Words  (edo Apalabrados) euskaraz ere jokatu ahal izatea bideratu dute.

[…]Baina sortutako gailu eta tresna guztien artean, bi robotek bereganatu dute ikasleen arreta: Tartalo robot bertsolaria eta Nao jostailu itxurako robot hiztun eta ibiltaria. Nao-k txundituta utzi ditu ikasleak mahaitik altxatu eta ongietorria eman dienean, eta hitz egiteko, mugitzeko eta gizakien keinuak imitatzeko gai dela erakutsi die aho zabalik begira zeudenei. Bi ikaslek Tartalorekin bertso lehiaketa egiteko aukera izan dute, Naok saioa aurkeztu ondoren. Tartalo gogor saiatu arren, argi gelditu da oraindik hezur-haragizko bertsolariek robotek baino hobeto menderatzen dutela hizkuntza.

[…]Aitzol Astigarraga ikerlariak,  Robotikako taldekoak,  azaldu duenez, robot horiek soEITBkulturaIxa_Laskurain_Bertsoakrtzeko helburua gailuei komunikatzen irakastea da. «Tartalo-k eta Nao-k erakusten dute posible dela robotei hizkuntzaren logika erakustea pixkanaka». Robotika taldearen eta Ixa taldearen elkarlanaren helburua roboten autonomia handitzea eta komunikatzeko gaitasunak garatzea da, ondoren, medikuntzan edota irakaskuntzan lagungarri izateko. «Robotek ikertzen jarraitzeko aukera ematen digute, eta, beharbada, etorkizunean elkarrizketak izateko gai izango dira».

Ikusi  bideo hauek ere bai:

Itzulpen Automatikoko Europako Elkartean partaide instituzionala da Ixa Taldea

European Association of Machine Translation elkartean hamaikagarren partaide instituzionala bihurtu da Ixa Taldea 2012 urtean.

EAMT elkartearen helburua itzulpengintza automatikoan eta itzulpen-tresnagintzan interesa duten ikertzaile, garatzaile eta erabiltzaileentzako zerbitzuak eskaintzea da. Besteak beste, bi urterik behin EAMT eta MT Summit konferentziak antolatzen ditu, eta MT-List lista eta Compendium of Translation Software  biltegia kudatzen ditu.

EAMT elkartea mundu mailako International Association for Machine Translation (IAMT) elkartearen barruan dago. Maila berean mugitzen dira Amerikako elkartea (Association for Machine Translation in the Americas, AMTA) eta Asiakoa (Asia-Pacific Association for Machine Translation, AAMT).

Ixa_EAMT_corporate-memberGuztira orain hamaika gara EAMTko elkartearen bazkide bereziak, instituzioak edo enpresak garenok:

 

Euskararen inguruko itzulpen automatikoa pil-pilean

Pasa den otsailaren 28an Eusko Jaurlaritzak aurkeztu zuen 2008an Lucy enpresari enkargatu zion itzultzailea.

Horren harira hainbat iritzi plazaratu dira gero. Eztabaidaren erreferentzia nagusia Sustatuko albistea izan zen. Tartean dago Ixa taldeko iritzi bat (#8).

Geroago Berria-n Mikel Peruarenak Zubi bat ulermenera.net erreportajea argitaratu zuen parte gehienen iritzia bilduta.

Beste erreferentzia asko ere egon dira, horien artean azpimarratu daitezke Nerea Azurmendi-k Diario Vasco-n eta Joseba Abaituak Translema blogean azaldu dituztenak.

Lehengo asteburuan Zazpika-ko Julene Larrañagak gaiari heldu zion eta Ixa taldeko lanari buruz beste zehaztasun batzuk ere eman zituen. Argazkia Conny Beyreuther-ena da.

Euskal Wikipediaren edizio-maratoia Durangoko Azokan

Urrian wikizale batzuk bildu ginen Matxin itzultzaile automatikoa eta Euskal Wikipedia hobetzeko asmoz, OpenMT-2 eta Euskal Wikipedia  proiektuaren haritik. Wikipedian itzulpen automatikoaren bidez hainbat artikulu gehitzeko.

Orain Durangon egingo dugu beste saio bat Euskal Wikipediakoekin batera 10. urteurrena ospatuko dela eta. Orokorrean wikipediako artikuluen edizioa egingo da, baina gure itzulpen laguntzaren berri ere emango dugu.

Gaia: Euskal Wikipediaren 10. urteurrena. EDIZIO-MARATOIA.
Tokia:  Durangoko Azokan.
Antolatzaileak: Euskal Wikipedia, UEU eta Ixa taldeko OpenMT-2  proiektua.
Eguna: Abenduaren 6an (ez dago klaserik)
Ordua: 10:00-19:30

Ordubete beharko duzu Wikipedian artikulu txiki bat itzuli eta gehitzeko. Edo ordu  batzuk artikulu ertain bat sortzeko. Hiru aplikazio ezagutuko dituzu: Matxin itzultzailea, Wikipedia, eta itzulpen memoriak erabiltzeko OmegaT sistema.

Wikipediako jakintza-alor bateko artikuluen zerrenda atera dezakegu, hutsuneak detektatzen laguntzeko.

  1. Erderaz dauden artikulu eta edukien berri ere eman dezakegu.
  2. Edukiak automatikoki itzuli eta Wikipediara igotzeko aukera ere emango dugu.

Parte hartzeko interesa daukan edonori irekia da. Hori bai, norberak bere ordenagailu eramangarria ekarri beharko du.

Abenduaren 6an etortzerik ez baduzu zure kabuz ere instalatu eta egin dezakezu (begiratu hemen nola egin). Baina errazago izango zaizu Durangora etorrita, lagunduko dizun jendea egongo da eta.  Giro ederrean. Animatu zure ingurukoak ere!

Argibideak: Irati Iciar Madinabeitia (943 82 14 26 edota i.iciar@ueu.org)

Urriak 12: Matxin eta Wikipedia hobetzera etorriko zara?

Parte hartu nahi duzu Matxin itzultzaile automatikoa eta Euskal Wikipedia hobetzen? Boluntarioak behar ditugu OpenMT-2 eta Euskal Wikipedia proiektuan, Wikipedian itzulpen automatikoaren bidez hainbat artikulu gehitzeko, informatikari buruz.

Gaia: Wikitzul eguna
Tokia:  24 orduko laborategia. Informatika Fakultatea
Antolatzaileak: Ixa taldea eta Euskal Wikipedia
Eguna: Urriaren 12an (ez dago klaserik)
Ordua: 9:30-13:30

Ordubete beharko duzu Wikipedian artikulu txiki bat itzuli eta gehitzeko. Edo ordu batzuk artikulu ertain bat sortzeko. Hiru aplikazio ezagutuko dituzu: Matxin itzultzailea, Wikipedia, eta itzulpen memoriak erabiltzeko OmegaT sistema.

Urriaren 12an etortzerik ez baduzu zure kabuz ere instalatu eta egin dezakezu (begiratu hemen nola egin). Baina errazago izango zaizu Informatika Fakultatera bazatoz,   lagunduko dizun jendea egongo da eta.  Giro ederrean. 100.000 hitzeko itzulpen zuzendua behar dugu Matxin itzultzailea hobetzen esperimentatzeko. 50 boluntario beharko ditugu, bakoitzak 2000 hitz itzulita. Orain arte boluntarioak 22 gara eta guztira 6306 hitz sortu/zuzendu ditugu, Wikipedian 36 sarrera berri sortu ditugu.

ANIMATUKO ZARA? AUPA INFORMATIKARI  HORIEK!

Hitzaldia. Daniele Pighin. Rol semantikoen erabilera itzulpenen kalitatea neurtzerakoan.(2011/05/31)

Lluis Marquezekin UPCn lan egiten duen Daniele Pighin ikerlaria astebeteko bisitan dugu Donostian. Mintegi bat antolatu dugu bere ikerketa-lanaren berri jasotzeko.

Gaia: Automatic Projection of Semantic Structures: an Application to Pairwise Translation Ranking  (Rol semantikoen erabilera itzulpenen kalitatea neurtzerakoan.)
Tokia: 3.2 gelan (batzar-gela ohia)
Hizlaria: Daniele Pighin
Eguna: Maiatzaren 31
Ordua: 11:30

Izenburua / Title
Automatic Projection of Semantic Structures: an Application to Pairwise Translation Ranking
(Rol semantikoen erabilera itzulpenen kalitatea neurtzerakoan.)

Laburpena /Abstract
The ability to automatically assess the quality of translation hypotheses is a key requirement towards the development of accurate and dependable translation models. While it is largely agreed that proper transfer of predicate-argument structures from source to target is a very strong indicator of translation quality, especially in relation to adequacy, the incorporation of this kind of information in the Statistical Machine Translation (SMT) evaluation pipeline is still limited to few and isolated cases.

We present a model for the inclusion of semantic role annotations in the framework of confidence estimation for machine translation. The model has several interesting properties:

  1. it only requires a linguistic processor on the (generally well-formed) source side of the translation;
  2. it does not directly rely on properties of the translation model (hence, it can be applied beyond phrase-based systems);
  3. it is inherently extendable to cope with different kinds of sequential annotations, e.g., POS tags.

These features make it potentially appealing for system ranking, translation re-ranking and user feedback evaluation. Preliminary experiments in pairwise hypothesis ranking on five confidence estimation benchmarks show that the model has the potential to capture salient aspects of translation quality.

LIHMT-2011 bilkura: Informazio linguistikoa itzulpen automatiko hibridorako.

Ixa taldea eta Bartzelonako TALP zentroa lankidetzan aritzen gara workshop bat antolatzeko itzulpen automatikoari buruz:
Using Linguistic Information for Hybrid Machine Translation
(LIHMT-2011).

Workshop hori Bartzelonan izango da azaroaren 18an, eta artikuluak bidaltzeko epea irailaren 9raino zabaldu da. http://ixa2.si.ehu.es/lihmt2011/

OpenMT-2 proiektuaren barruan egiten ditugun lanak zabaltzea eta kontrastatzea dira gure helburu nagusiak.

Hitzaldia. Lluís Màrquez. Ebaluazioa itzulpen automatikoan: Hizkuntz oinarriko neurrien konbinaziorantz(2011/05/10)


Gaia: “Ebaluazioa itzulpen automatikoan: Hizkuntz oinarriko neurrien konbinaziorantz /
Hizlaria
: Lluís Màrquez NLPRG, TALP
Technical University of Catalonia, UPC
Udara arte gurekin izango dugu Lluis Marquez, OPENMT-2 proiektu barruan UPC-ko burua dena. Bera nazioarteko aditua da hizkuntza-teknologian, ikasketa automatikoko teknikak erabiltzen batez ere.
Tokia: Informatika Fakultateko Batzar Aretoa
Eguna: Maiatzaren 10.an
Ordua: 15:30


Laburpena:
Automatic evaluation plays a very important role in the development andcomparison of machine translation systems. In this talk we will overview the current trend of using linguistically-guided evaluation measures based on several linguistic layers and their combination.
Also, we will talk about confidence estimation measures, a particular subset of measures to assess output quality without the need of reference translations. Finally, we will overview the role of evaluation measures within the FAUST European project (Feedback Analysis for User Adaptive Statistical Translation; http://www.faust-fp7.eu/), focusing on the usage of user feedback to guide the combination of measures.