Mikel Artetxeri Europako tesien saria Adimen Artifizialean

Mikel Artetxe Ixakideak orain dela urtebete aurkeztu zuen doktore-tesiari beste sari handi bat eman diote, estatu mailako saria eman zioten maiatzean eta orain abuztuan Europa mailako saria.
Adimen artifizialerako Europako elkarteak tesi onenarentzako saria eman dio atzo (Itzulpen automatiko gainbegiratu gabea  / Unsupervised Machine Translation). 

Zorionak Mikeli eta zuzendari biei, Eneko Agirre eta Gorka Labaka

 

 

Ikerketaren motibazioa, galderak:

Sekuentziatik sekuentziarako eredu neuronalaren etorrerak aurrerapen izugarria ekarri du itzulpen automatikoan. Horrek hobekuntza handia ekarri du itzulpen-sistema estandarretan eta horrela zenbait ingurunetan giza-itzulpenen kalitatearen maila lortu dute lehenengoz. Hala ere, gaur egun dauden sistemek datu asko behar dute (gainbegiratze sakona), corpus paralelo gisa normalean milioika perpaus behar izaten dituzte. Baina harrigarria da, baldintza hori ez du behar gizakiak hizkuntza eskuratzeko. Eta gainera arazo praktiko garrantzitsu bat planteatzen du euskara bezalako baliabide gutxiko hizkuntzekin itzulpenak egiteko.

Tesiaren helburua datu paraleloen mendekotasun hori guztiz ezabatzea da, corpus elebakarra baino beharko ez duten “gainbegiratu gabeko itzulpen automatiko”ko sistemak eratzeko. Horretarako, lehenengo urrats batean bi hizkuntzatarako sortutako hitz-bektoreak (word embedding-ak) lerrokatzen ditu, beren arteko egitura-antzekotasunean oinarrituta. Gero, bigarren urrats batean, lerrokatze horren emaitzak erabiltzen ditu itzulpen-sistema neuronal bat edo itzulpen-sistema estatistiko bat hasieratzeko, azken urratsean back-translationaren bidez hobetzen joango dena.

https://github.com/artetxem
https://github.com/artetxem

Tesiaren egindako bide progresiboa eta ekarpenak oso ondo jarraitu daiteke Mikel Artetxek 2016tik argitaratu zituen 9 artikulu hauen zehar:

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude