Itzulpengintza automatiko neuronala. Jardunaldi irekia Kyunghyun Cho adituarekin (2017-05-29)

Itzulpengintza automatikoaren hirugarren belaunaldia garatzen ari da. Garai batean erregela linguistikoetan oinarritutako sistemak ziren nagusi (RBMT teknologia), azken hamarkadan, berriz, estatistikan oinarritutako sistemak gailentzen joan dira (SMT teknologia), eta azken bi urtetan neurona-sareetan oinarritutako sistemek hobekuntza kualitatiboak lortzen ari dira (NMT teknologia), teknologia hau ikergai nagusia bihurtuz itzulpengintza automatikoaren arloan. Jardunaldi honetan teknologia horren azken aurrerapenak aurkeztu nahi ditugu, euskararen gainean lortu ditugun emaitzak barne.

Modela_irudia11Testuingurua:

NMT teknologian ikertzea eta, are gehiago, erronka handia den euskararen itzulpen automatiko onargarrira iristea da Modela proiektuaren helburua. Modela proiektua Eusko Jaurlaritzak finantzatzen du eta honako erakundeak dira partaideak: Ametzagaiña, Elhuyar, ISEA, UPV/EHUko Ixa taldea eta Vicomtech/IK4.

Gonbidatua:

Jardunaldi honen gonbidatu nagusia Kyunghyun Cho (Center for Data Science, New York University), ikerlari ezaguna da. NMT arloan aditu erreferentziatuenetako bat da, Google saria jaso du gai horretan eta hizlari bikaina ere bada.

Noiz: 2017ko maiatzaren 29, goizeko 11.00etan
Non: EHUko Informatika Fakultatea, ManuelLardizabal 1, 20018 Donostia (mapa)
Hizkuntza: ingelesa
Programa:

11.00-11.15: Sarrera eta proiektuaren aurkezpena
11.15-12.30: NMT (Kyunghyun Cho)
12.30-13.15: Modela proiektuaren lehen emaitzak

Babesleak: Modela proiektua eta UPV/EHUko Gipuzkoako errektoreordetza

Biharamonean 15:00ean, maiatzak 30, HAP masterreko ikasleekin arituko da Kyunghyun Cho irakaslea.

Modela_irudia3

HAP/LAP masterreko lau tesiren defentsa

Eguna: irailaren 27a     Lekua: Ada Lovelace aretoa

15:30
Universal Dependencies for Buryat.
Egilea: Elena Badmaeva
Tutoreak: Koldo Gojenola , Gosse Bouma

16:15
LexSynSimpleText, a lexical and syntactic simplifier: first steps.
Egilea: Maria Eguimendia
Tutoreak: Arantza Diaz de Ilarraza and Gosse Bouma

17:00
Data Sparsity in Highly Inflected Languages: The Case of Morphosyntactic Tagging in Polish.
Egilea: Michael Ustaszewski
Tutoreak: Rodrigo Agerri and German Rigau

17:45
Multilingual Central Repository version 3.0: improving a very large lexical knowledge base.
Egilea: Daniel Parera Perez
Tutoreak: German Rigau Claramunt

Nora Aranberri Innsbruckeko udako ikastaroan irakasle

Innsbruck2Nora Aranberri taldekidea, Innsbruck-eko Unibertsitateak inbitatuta, irakaslea izan da Machine Translation for Translators: Taking Advantage of the New Technology workshopean, SummerTrans 2016 udako ikastaroaren barruan.

Itzultzaileentzako SummerTrans udako ikastaroa 2004an hasi zen. Aurten uztailaren 11tik 20ra izan da, itzulpenaren kalitatea eta egokitasuna gaia landu dutela: “SummerTrans VII: Quality and Competence in Translation”.
Partehartzaileak 60 izan dira, 16 herrialdetakoak: Tunisia, Europa, Txina eta India.NoraInnsbruck2016Michael Ustaszewski, 2014-2016 biurteko gure Eramus Mundus LCT masterreko ikaslea, orain irakaslea da Innsbruck-eko Unibertsitatean eta SummerTrans 2016 ikastaroko antolatzaileetako bat ere izan da

IMG_1428b

Michael-ek esan digu workshopeko ikasleak oso pozik geratu direla Norarekin ikasi dutenarekin ;-)

 

Google-ren ikerketa-saria Eneko Agirreri hitzen esanahiak grafikoki erakusteagatik

Gráfico Eneko AgirreEneko Agirre: “…gure proposamena gai da hainbat hizkuntzatako hitzen esanahiak espazio bakar batean irudikatzeko; horri esker, jakin ahal izango dugu banku hitzaren adiera bat ingeleseko bank hitzaren eta euskarazko kutxa hitzaren antzekoa dela, eta beste adiera chair eta aulki hitzen antzekoa, baina bi adiera horietako bat ere ez dela katu edo cat hitzen antzekoa.”

Horrelako metodoak dira Eneko Agirrek UPV/EHUko Donostiako Informatika Fakultateko ‘Language Analysis and Processing’ masterrean ematen duen ikastaroaren oinarria.

Eneko_Google saria Not_Gip

Google premia a Eneko Agirre, profesor de la UPV (Noticias de Gipuzkoa, 2015-03-19)

Ikastaroa: Hizkuntz ingeniaritzako aplikazioak (9 ECTS, ostiraletan)

UPV/EHUko IXA Taldean ikastaro hau antolatu dugu arlo honetan interesa duten guztientzat. Ez da Masterra bezain sakona, masterreko modulu bakar bat da, baina lehenengo ideia bat hartzeko balio dezake. Gustatzen bazaizu hurrengo urtean master osoa egin 😉

Internet eta telefono inteligenteen erabilera masiboak areagotu egin dute hizkuntzaren tratamendu automatikoaren beharra; interesatzen zaigun informazioa ondo aukeratzeko tratamendu linguistiko lagungarria ezinbestekoa baita. Gaur egun hainbat aplikazio dago hizkuntzaren tratamendu automatikorako. Adibidez:

  • IBM-Watson: telebistako Jeopardy programan galderak erantzuten pertsonei irabazi zien programa.
  • Euskarara itzultzeko Matxin (Elhuyar-Ixa) eta Itzultzailea (Eusko Jaurlaritza)
  • Mitzuli aplikazioa android telefonorako (Masterreko ikasle batek egin duena)

Horrelako gaiak interesekoak badituzu, “Hizkuntz ingeniaritzaren arloko aplikazioak” ikastaroak gai hauetan murgiltzen lagunduko dizu.

Ikastaroaren datak: ostiralero, otsailaren 12tik ekainaren 10era arte,
Matrikulazio-epea:  
Urtarrilaren 8tik aurrera
Idazkaritza: amaia.lorenzo@ehu.eus / ana.endemano@ehu.eus
Informazio teknikoa: montse.maritxalar@ehu.eus
Diptikoa: Informazio orokorra (euskaraz) Mesedez, zabaldu zure inguruan.

HAP_ikas_osgarri2016-1

HAP_ikas_osagarri_2016_2

Eskaintzen ditugun masterrak eta itzulpengintzako graduondokoa

Ixa Taldeak bi master eta graduondoko bat eskaintzen ditu datorren ikasturterako.
Ingeniarientzat, filologo-linguistentzat eta itzultzaileentzat dira.
Orain da matrikulatzeko garaia:
HAP-LAP_Bideo_collage

Bideoa: HAP-LAP masterreko protagonisten iritzia

Ikergazteko sari bana Begoña Altuna eta Olatz Perez de Viñasprerentzat

IkerGazte biltzarrean Ixa Taldeko 10 artikulu egotea pozgarria zen, euskaraz ematen dugun HAP_LAP masterreko  ikasle ohien artikuluak 14 izatea ere bai, eta gainera ostiralean sorpresa izan genuen:  Ikergazteko 2 sari:

 

  • olatzUdalbiltzak banatutako sari berezia (Euskal Herriko garapenari ekarpen garrantzitsuena egiten diona):
    Olatz Perez de Viñasprerentzat izan da
    Osasun-txosten elebidunak posible ote?” lanarekin.
    Ikus Ikergazteko artikulu-bilduma (orriak: 730-738)

ZORIONAK DENEI !!   🙂

2015-16ko masterrean izena emateko epea maiatzaren 31ra arte.

HAP_irudi_DiptikoaHAP/LAP masterra
Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing

Ikasi nahi duzu gurekin zer egin daitekeen konputagailuekin hizkuntza aztertzeko eta aplikazioak sortzen? Begiratu Interneteko orri hauetan:

  • Erabiltzen duzu translate.google.com zerbitzuan ematen duen itzuli dokumentu bat aukera?
    Gmail-en itzuli dituzu mezuak euskarara klik bakar batean?
    Zuk esan esaldi bat euskaraz eta ingelesera pasatzen dizu. Probatu duzu telefonoan?
  • Deskargatu duzu Mitzuli aplikazioa telefonora? Honek ere testua, audio eta irudiak itzultzen ditu 50 hizkuntza-bikoeetarako, librea da… eta HAP master honetako ikasle batek sortu du!
  • Euskarara itzultzeko ere bai: Matxin (Elhuyar-Ixa) eta Itzultzailea (Eusko Jaurlaritza)
  • Segapoto-ren laguntzaz bertso bat osatu eta lagunei bidali diezu? Hori ere HAP master honetako ikasleek sortua da!
  • IBM-Watson Telebistako Jeopardy programan galderak erantzuten pertsonei irabazi zien programa.
  • http://start.csail.mit.edu/index.php   Galdetu: `How far is Bilbao from London?’
  • Siri-rekin hitz egin duzu?
  • http://news.google.com/
    Nola egiten dute albiste bilduma hori etengabe automatikoki eguneratuta mantentzeko?
  • Loquendo, Nuance, Aholab: Entzun nola irakurtzen dituen zuk idatzitako testuak.
  • Ikusi duzu testu-prozesadoretako ‘Autosummarize’ edo ‘Autoabstract’ tresna?
  • Zein kantariren alde agertzen da txio gehien Twitter-en?  LaVoz-Alicanteko Unibertsitatea
  • Kartelak 20 hizkuntzatan?? QRak erabilita Albaola museoan posiblea da
  • http://www.yourdictionary.com/languages.html
    900 hiztegi kontsultagarri ingeleserako, 300 espainierarako, 9 euskararako.
  • Bilatu dituzu elurrarrekin (snow) zerikusirik duten hitzak OneLook hiztegi-zerbitzuan?
  • http://www.hiztegia.net: 50 hiztegi euskararako
  • Zein adjektiborekin erabiltzen da “mailegu” hitza? Bilatu Web-corpusen Atarian.
  • Oraindik ez duzu erabiltzen Euskalbar?
  • Badakizu ixa-pipes tresnak Ixa Taldean sortu dugula eta euskara, ingelesa eta espainiera analizatzeko oso baliagarria dela.

2001-02 ikasturtetik gabiltza teknologia hauek zabaltzen master mailan.
Gure ikasle ohiek 2015eko IkerGazte kongresuan 14 artikulu aurkeztu dituzte 🙂