Mikel Artetxe-k saria jaso du Bartzelonako HP Hackatoian

Mikel Artetxe IXAkideak bigarren saria lortu du aste honetan Bartzelonan antolatu den  Hizkuntza Teknologietako Hackatoian. Antolatzailea Red.es izan da, Espainian Hizkuntza Teknologiak sustatzeko Planaren barruan kokatuta dago ekitaldia eta SESIAD agentziaren babesa izan du.

Hackatoia startup teknologikoak sustatzeko aurten Bartzelonan antolatu den “4 Years From Now” (4YFN) plataformaren barruan egon da, Mobile World Capital Barcelona azokan. Beste IXakide batzuk ere izan ditugu antolaketan inplikatuta (German Rigau, Iñaki Alegria eta Rodrigo Agerri).

Linguee_server

Ingelesezko “server” eta espainierazko “servidor” hitzen erabilera-adibideak Linguee aplikazioan.

Antolakuntzakoek 8 proiektu hautatu zituzten astelehenean, otsailak 27, izan zen hackatoi/lehiaketa honen finalerako. Mikel Artetxe lankideak Linguee moduko aplikazioak sortzeko programa bat garatu du; testu-corpus batetik abiatuta hiztegi elebidunak sortzeko aplikazio honek testu errealetako adibide errealak eskaintzen ditu hitzaren erabilera zelakoa den hobeto erakustearren. Software librea den aplikazio hau hainbat hizkuntzatarako erabili ahal izango da, tartean euskararako, noski.

Hackatoiko finalera heldu ziren proiektuak

Itzultzaile automatikoen bolada berria (sarean.eus)

Itzultzaile automatikoen bolada berria artikulua idatzi dute eta “.EUS” domeinuko sarean.eus webgunean. Hona hemen horko zati batzuk:

Sarean_MT_AlegriaEneko

“[…] aldaketa espero ez zen bidetik etorri da. Ikusita sare neuronalek (bereziki Iiasketa sakona edo “deep learning” deritzatenek) irudien prozesamenduan eta giza-ahotsaren ezagutzan izan duten arrakasta, ikerlari batzuek horiek aplikatu dituzte itzulpenera, […] hitzen esanahia bektoreen bitartez errepresentatzen dute eta egitura sintaktikoa matrizeen biderketa bidez, orain arteko teknologiaren mugak gaindituz.  Denbora gutxian garapen izugarria izan dute, eta egun Google, Microsoft eta Systran enpresek teknologia hau darabilte itzulpenak sortzeko, aurreko 20 urtetan garatutako teknologia alde batera utziaz.[…]

[…] lexikoan, morfologian, eta hitzen hurrenkeran egin izan diren erroreak %20 inguru gutxitu direla. Hala ere, azterketa berdinak azaleratu du fenomeno sintaktiko eta semantiko ugari oraindik ondo itzuli gabe gelditzen direla – egitura linguistiko aberatsagoak behar direnaren seinale, beharbada.”

German Rigau hizlari TEXT MINING IN POLICY MAKING konferentzian

Pasa den astelehenean German Rigau Ixakidea hizlari inbitatua izan da Europako Batzordeak antolatu duen TEXT MINING IN POLICY MAKING konferentzian. Bertan aurkeztu dira testu-meatzaritzako hainbat arrakasta-kasu eta aprobetxatu egin da Batzordeak arlo horretaz sortu berri duen zentroa (JRC competence centre on text mining).

CODEFEST, antolatu dugu baliabide urriko hizkuntzetarako teknologia-eskola (udan, 2016-07-04)

Codefest

Codefest uda-eskolak baliabide urriko hizkuntzak biziberritzeko helburu argia dauka. Komunikazio elektronikorako tresna eraginkorrak eskaini eta hauek nola erabili erakutsiz. Astebeteko ikastaro praktikoan, egungo hizkuntza-teknologiak aztertu eta aplikazioak garatzeko aukera izango da; lan-taldeak eratuko dira, hizkuntzalari, software ingeniari eta ikasleak integratuz proiektuak auzolanean garatzeko.

Eskola irekia da, ez da aurre ezagutzarik eskatzen, hizkuntzarekiko pasioa eta haren alde zerbait egiteko gogoa dira ezinbesteko bakarrak.

Codefest uztailaren 4tik 8ra izango da, eta asteburuan Wikipedia editathon batekin borobilduko dugu ekitaldia. Hizkuntza txikietan fokua jarriz, hiriari buruzko artikuluak idatzi eta itzuliko ditugu ahalik eta hizkuntza gehienetara.

Helburuak

  • Baliabide urriko hizkuntzei eguneroko komunikazio elektronikorako tresna
  • eraginkorrak eskaintzea.
  • Europa hizkuntza hauen eremu gisa bistaratzea.
  • Auzolana sustatzea.
  • Herrialde ezberdinetako eragileak harremanetan jartzea.
  • Kode librean oinarritutako hizkuntza ­teknologiak eta baliabideak sustatzea.

IXA taldekoak bertan arituko gara, noski 😉

Informazio gehiago (ingelesez): http://dss2016.eu/images/Codefest.pdf

Google-ren ikerketa-saria Eneko Agirreri hitzen esanahiak grafikoki erakusteagatik

Gráfico Eneko AgirreEneko Agirre: “…gure proposamena gai da hainbat hizkuntzatako hitzen esanahiak espazio bakar batean irudikatzeko; horri esker, jakin ahal izango dugu banku hitzaren adiera bat ingeleseko bank hitzaren eta euskarazko kutxa hitzaren antzekoa dela, eta beste adiera chair eta aulki hitzen antzekoa, baina bi adiera horietako bat ere ez dela katu edo cat hitzen antzekoa.”

Horrelako metodoak dira Eneko Agirrek UPV/EHUko Donostiako Informatika Fakultateko ‘Language Analysis and Processing’ masterrean ematen duen ikastaroaren oinarria.

Eneko_Google saria Not_Gip

Google premia a Eneko Agirre, profesor de la UPV (Noticias de Gipuzkoa, 2015-03-19)

Hitzaldia: Gaelikorako Teknologiaren egoera (T. Lynn, 2015/10/13)

Hizlaria:  Teresa Lynn ADAPT Centre, School of Computing, Dublin City University
Eguna: Urriaren 13an, asteartean
Ordua: 15:00-16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua:  “Gaelikorako Hizkuntza-Teknologiaren egoera  / Overview of the current status of Irish language technology”

Teresa Lynn ikertzaileak Euskal Herriko zentro batzuk bisitatuko ditu datorren astean, horien artean Ixa taldea. Euskararako hizkuntza teknologia nola garatu den aztertu nahi dute Gaelikoa lantzeko proiektu estrategiko bat definitu baino lehen. Dublin-eko DCU inibertsitatea eta Trinity College dira proiektu horren arduradunak. Bisita hori aprobetxatuz, eskatu diogu aurkezpen bat eskatu diogu gaelikoak egun hizkuntza-teknologian duen egoera azaltzeko.

Hitzaldia: Diskurtsoaren egitura itzulpen automatikoaren ebaluazioan (L. Màrquez, 2015/06/15).

Hizlaria: Lluis Màrquez
…………….Arabic Language Technologies group from the Qatar Computing Research
Eguna: Ekainaren 15ean, ostegunean
Ordua: 12:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua: Discourse Structure in Machine Translation Evaluation / Diskurtsoaren egitura itzulpen automatikoaren ebaluazioan

Hitzaldia: Itzulpen automatikoaren ebaluazioa (C. España-Bonet, 2015/03/13)

Hizlaria: Cristina España i Bonet
Eguna: Martxoaren 13an, Ostirala
Ordua: 15:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua:
MT evaluation: A broad stroke on Machine Translation Evaluation
/ Pintzelkada zabal bat itzulpen automatikoaren ebaluazioaz”

Abstract:
Itzulpen automatikoaren ebaluazioa egiteko egun dauden neurriak aurkeztuko dira, eskuzkoak eta automatikoak. Zer dator berri ildo horretatik? Bukaeran ebaluazioa egiteko zenbait tresna azalduko dira, bereziki UPCan sortutako Asiya Toolkit.