Itzulpengintza automatiko neuronala. Jardunaldi irekia Kyunghyun Cho adituarekin (2017-05-29)

Itzulpengintza automatikoaren hirugarren belaunaldia garatzen ari da. Garai batean erregela linguistikoetan oinarritutako sistemak ziren nagusi (RBMT teknologia), azken hamarkadan, berriz, estatistikan oinarritutako sistemak gailentzen joan dira (SMT teknologia), eta azken bi urtetan neurona-sareetan oinarritutako sistemek hobekuntza kualitatiboak lortzen ari dira (NMT teknologia), teknologia hau ikergai nagusia bihurtuz itzulpengintza automatikoaren arloan. Jardunaldi honetan teknologia horren azken aurrerapenak aurkeztu nahi ditugu, euskararen gainean lortu ditugun emaitzak barne.

Modela_irudia11Testuingurua:

NMT teknologian ikertzea eta, are gehiago, erronka handia den euskararen itzulpen automatiko onargarrira iristea da Modela proiektuaren helburua. Modela proiektua Eusko Jaurlaritzak finantzatzen du eta honako erakundeak dira partaideak: Ametzagaiña, Elhuyar, ISEA, UPV/EHUko Ixa taldea eta Vicomtech/IK4.

Gonbidatua:

Jardunaldi honen gonbidatu nagusia Kyunghyun Cho (Center for Data Science, New York University), ikerlari ezaguna da. NMT arloan aditu erreferentziatuenetako bat da, Google saria jaso du gai horretan eta hizlari bikaina ere bada.

Noiz: 2017ko maiatzaren 29, goizeko 11.00etan
Non: EHUko Informatika Fakultatea, ManuelLardizabal 1, 20018 Donostia (mapa)
Hizkuntza: ingelesa
Programa:

11.00-11.15: Sarrera eta proiektuaren aurkezpena
11.15-12.30: NMT (Kyunghyun Cho)
12.30-13.15: Modela proiektuaren lehen emaitzak

Babesleak: Modela proiektua, TAdeep proektua eta UPV/EHUko Gipuzkoako errektoreordetza

Biharamonean 15:00ean, maiatzak 30, HAP masterreko ikasleekin arituko da Kyunghyun Cho irakaslea.

Bideoak eta gardenkiak:

Sponsors: Modela projectTAdeep project and University of the Basque Country

Modela_irudia3

Itzultzaile automatikoen bolada berria (sarean.eus)

Itzultzaile automatikoen bolada berria artikulua idatzi dute eta “.EUS” domeinuko sarean.eus webgunean. Hona hemen horko zati batzuk:

Sarean_MT_AlegriaEneko

“[…] aldaketa espero ez zen bidetik etorri da. Ikusita sare neuronalek (bereziki Iiasketa sakona edo “deep learning” deritzatenek) irudien prozesamenduan eta giza-ahotsaren ezagutzan izan duten arrakasta, ikerlari batzuek horiek aplikatu dituzte itzulpenera, […] hitzen esanahia bektoreen bitartez errepresentatzen dute eta egitura sintaktikoa matrizeen biderketa bidez, orain arteko teknologiaren mugak gaindituz.  Denbora gutxian garapen izugarria izan dute, eta egun Google, Microsoft eta Systran enpresek teknologia hau darabilte itzulpenak sortzeko, aurreko 20 urtetan garatutako teknologia alde batera utziaz.[…]

[…] lexikoan, morfologian, eta hitzen hurrenkeran egin izan diren erroreak %20 inguru gutxitu direla. Hala ere, azterketa berdinak azaleratu du fenomeno sintaktiko eta semantiko ugari oraindik ondo itzuli gabe gelditzen direla – egitura linguistiko aberatsagoak behar direnaren seinale, beharbada.”