Hitzaldia: Diskurtsoaren egitura itzulpen automatikoaren ebaluazioan (L. Màrquez, 2015/06/15).

Hizlaria: Lluis Màrquez
…………….Arabic Language Technologies group from the Qatar Computing Research
Eguna: Ekainaren 15ean, ostegunean
Ordua: 12:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua: Discourse Structure in Machine Translation Evaluation / Diskurtsoaren egitura itzulpen automatikoaren ebaluazioan

Hitzaldia: Itzulpen automatikoaren ebaluazioa (C. España-Bonet, 2015/03/13)

Hizlaria: Cristina España i Bonet
Eguna: Martxoaren 13an, Ostirala
Ordua: 15:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua:
MT evaluation: A broad stroke on Machine Translation Evaluation
/ Pintzelkada zabal bat itzulpen automatikoaren ebaluazioaz”

Abstract:
Itzulpen automatikoaren ebaluazioa egiteko egun dauden neurriak aurkeztuko dira, eskuzkoak eta automatikoak. Zer dator berri ildo horretatik? Bukaeran ebaluazioa egiteko zenbait tresna azalduko dira, bereziki UPCan sortutako Asiya Toolkit.

Hitzaldia: Bertso-sorkuntza automatikoa, posible ote? (2014/11/27)

UEUk eta Donostiako Euskara Zerbitzuak elkarlanean azarorako hitzaldi-sorta bat antolatu dute, ‘Dakiguna erakutsiko dizugu‘ izenburupean.

Aste honetan hjizlaria Manex Agirrezabal izango da:

Hitzaldia DOKA aretoan emango da, azaroak 27, osteguna, 19:00etan hasita.
Donostian, Antigua auzoan.
Hitzaldiaren ostean solasaldia eta mokautxo bat egongo dira.  :-))
Sarrera irekia eta doanekoa da.

Manex_Unibertsitatean_net

Doktorego tesia IXA taldean egin nahi duzu?

Ikasturtea bukatzen ari dela, plangintza egiteko garaia da ikasleentzat.
Hizkuntzaren prozesamenduko gure arlo honetan tesi bat egingo zenuke?

IXA Taldea Euskal Herriko Unibertsitateko ikerketa talde bat da, batez ere Informatika Fakultatean dabilena. Euskararen gaineko ikerketa aplikatua da gure xede nagusia, baina beste hizkuntzen inguruko ikerketa eta produktuen garapena ere sartzen dira gure eginkizunen artean. 25 urte daramatzagu lan honetan.

Gure ikerketa-lerro garrantzitsuenak hauek dira:

Une honetan bost proiektu europarretako partaide gara (PATHSNewsReaderREADERSOpeNER, eta QTLeap),  Eusko Jaurlaritzaren A motako ikertalde finkatua gara, eta Madrileko ministerioko  Hibrido Sint, TACARDI eta SKaTeR proiektuak ere baditugu. Proiektu horietatik, batez ere, sortzen zaizkigu tesiak egiteko ideiak eta beharra.

ixaproiektuak2014Azken 5 urteetan 8 tesi defendatu dira IXA taldean
eta une honetan 10 dira egiten ari diren tesiak beka ofizial batekin.

Zu ere animatuko zara gurekin tesia egitera?
Hala bada  bidali mezu bat ixa@ehu.es helbidera eta jarriko gara zurekin harremanetan.

IXATxiotesia

#txiotesia ekimenean gutxienez 9 izan ziren hizkuntza teknologiaren inguruko tesiak.

Elhuyar aldizkariko elkarrizketa bat Iñaki Alegria Ixakidearekin

Arg. © Jon Urbe/ARGAZKI PRESS

Ana Galarraga-k egindako elkarrizketa zabal eta dentso bat argitaratu du  Elhuyar aldizkariak Iñaki Alegria gure IXAkidearekin. Hainbat gai jorratu dituzte, hasierakoetan Ixa taldearen jardunaz aritu dira, eta gero Udako Euskal Unibertsitateaz:

Bai, badago zer irakurri elkarrizketa horretan.
Eta irakurri eta gero… badugu zereginik.

I_Alegria_Elhuyar_aldizk

QTLeap proiektua: itzulpen automatikoa hobetu nahian

QTLeap_logo_6letraEuropako proiektu berri batean lanean gabiltza pasa den azarotik: QTLeap. UPV/EHUko IXA Taldeak proiektuko beste kideekin batera egungo itzultzaile automatikoen mugak gainditu nahi ditu.

Perfekziotik urrun dauden egungo itzultzaile automatikoen emaitzak kalitatean dezente hobetzea da helburua.
QTLeap_ikono2Proiektuak hiru urteko iraupena izango du. IXA Taldeak elkarlanean jardungo du itzulpengintza automatikoan aitzindariak diren Europako beste hainbat erakunderekin: Alemaniako DKFI, Lisboako Unibertsitatea, Pragako Charles Unibertsitatea, Bulgariako Zientzien Akademia IICT-BAS, Berlingo Humboldt Unibertsitatea eta Herbehereetako  Groningengo Unibertsitatea.

Itzultzaile automatiko guztiek mugak dituzte. Egindako itzulpenak ez dira perfektuak, ezta gutxiago ere, baina laguntza-tresna baliagarri bilakatu dira azkenaldian.

QTLEAPLisboa2013_11_eskaileretanGramatikalki eta morfologikoki antzekoak diren hizkuntza-bikoteen arteko itzulpen automatiko on bat lortzea errazagoa da, gaztelania-katalana edo gaztelania-galegoa kasu. Euskararen kasuan, berriz, zailtasuna handiagoa da, eta lortzen den itzulpenaren kalitatea baxuagoa. Horretan hiru dira zailtasun handienak: 1) Euskarazko testuen egitura eta inguruko beste hizkuntzena oso ezberdinak direnez, itzulpeneko hitzen ordena asmatzea oso zaila da itzultzaile automatikoentzat, 2) hitz batek beste hizkuntzan dituen ordain egokia aukeratzea (adibidez, euskarazko baso hitza gaztelaniara itzultzerakoan ea bosque edo vaso aukeratu behar den, testuinguruaren ara. bera aukeratu behar da), eta 3) eskuz eta euskarara itzulitako testuekin osa daitekeen corpusa txikia dela.

QTleap_WebsiteGaur egungo itzultzaile automatikoek dituzten muga horiek gainditzen saiatuko gara QTLeap proiektu horretan. Horretarako, batetik, zuhaitz-banku edo treebank-ak erabiliko ditugu. Helburua da sintaktikoki ongi analizatutako esaldi mordoxka bat biltzea, eta horrekin itzultzaile automatikoei laguntzea itzulpeneko sintaxia hobeto aukeratzen.

Bestetik, gaur egun, esaldi konkretu batean hitz batek duen esanahia bereizteko behar den informazioa ez dago hiztegietan bakarrik, Internetetik ere lor daiteke horrelakorik. Horrenbestez, hitzen esanahiak edo adierak behar bezala bereizten ikasteko, Interneteko zenbait baliabide erabiliko ditugu. Esaterako, Wikipedia bezalako testu-bilduma handia, non hainbatetan testuko hitz baten adiera ongi zehaztuta egoten den. Alegia, hitz baten gainean esteka bat badago esteka hori Wikipediako adieretako batera doa. Horrelako esteka asko dituzten testuak bilduz gero, horrekin konputagailuak berak ere ikas lezake adierak bereizten. Wikipedia iturri posibleetako bat besterik ez da, gaur egun, Interneten gero eta testu gehiago dago horrelako lotura edo estekekin; Linked Open Data izenaz ezagutzen dira horrelakoak modu librean erabiltzerik badago.

Halaber, izen propioak, pertsona-izenak, erakunde-izenak edota toki geografikoak modu berezian landuko ditugu. Izan ere, izen propio guztiak landuta izatea ezinezkoa da, baina multzo handi bat kontrolatuta izateak asko hobetuko du itzulpenen kalitatea. Horrek aukera emango du, adibidez, Pilar del Castillo izena itzulpenean bere horretan mantentzeko, eta ez gazteluko pilarea emaitza lortzeko.

Horrenbestez, hiru adar nagusi horiek —zuhaitz-bankuak, Interneteko baliabideak eta izen propioak— lantzen ari da IXA Taldeak pasa den azarotik QTLeap proiektuan, egungo euskarazko itzultzaile automatikoen hiru arazo nagusiei —ezberdintasun morfologiko eta gramatikala, adiera-desanbiguazioa eta corpus txikia— konponbide berriak aurkitzeko.

Bota galdera!

Elhuyar_Iñigo_Bota_galderaLabur eta argi azaldu du Elhuyar aldizkarian Iñigo Lopez ikasleak zer egiten duen HAP masterreko lan praktikoan. Testutxo bat hartuta, euskara irakasteko galderak automatikoki sortzen ditu horren gainean. Adibidez, testua hau bada:

Pizzak asko gustatzen zaizkit; horregatik, afaltzeko hori prestatuko dut.

Galdera hauek sortzen ditu:

Zer gustatzen zaio asko?
Zer egingo du?
Zer prestatuko du afaltzeko?

Pertsona batentzat erraza da galderak horrela sortzea, baina konputagailuentzat ez.
Gai horretan ari da Iñigo bere doktore-tesia lantzen.

Elhuyar aldizkarian idatzi du azalpen hori, umor-ikutu batekin gainera: Bota galdera!

Mintegia: NewsReader proiektua (G. Rigau)

Gaia: NewReader proiektua
Hizlaria: German Rigau
Eguna: Martxoaren 19n, asteazkena
Ordua: 15:30 -16:30
Tokia:  3.2 gela. Informatika Fakultatea
Mintegi guztien egutegia

Laburpena

NewsReaderNewsReaderStorylinesGaur egunean albiste-datuen kopuruak ikaragarri handiak dira eta zabalduz doaz gainera. Mila milioika dokumentu eduki dezakegu gordeta eta milioika dokumentu berri sortzen dira egunero.  NewsReader proiektuan erabaki-prozesuetan laguntzeko tresna bat garatu nahi da. Profesionalari interfaze grafikoen bidez dokumentuak lerro historikoetan antolatuta erakutsiko zaizkio. Elkarrekintzaren bidez dokumentuen berritasun maila aztertu ahal izango du. Helburua da erauztea zer gertatu zion nori, non eta noiz, eta jakitea horrelakoak  bereizten  lerro historiko diferenteetan.

Ixa taldea NewsReader proiektuko bost partaideetako bat da (EU FP7 programa, grant 316404, 2013 – 2015):

2012ko hizkuntzen teknologien datuak (LANGUNE)

Langune2012

 

LANGUNEk, Hizkuntzen Industriaren alorreko Euskal Herriko enpresen elkartea, 2012ko txosten sektoriala plazaratu berri du.

 

Txostenaren arabera, 2012. urtean sektoreko enplegua mantendu egin da (%0,2an baino ez da murriztu) eta fakturazioa %1,8an handiagotu da.

 

Hizkuntzen Industrien inguruan 4.995 langile daude Euskadiko Elkarte Auronomikoan egun, eta 2013rako aurrikuspena apur bat handitzea da 5.045 enplegu lortu arte.

 

Langune2012_Fakturazioa2

 

 

 

 

Sektoreak 276 miloi euro fakturatu ditu 2012an. Irudian ikus daiteke lau segmentuetako bakoitzean aurreko urtearekin izan den aldaketa.

 

 

 

Txostenean agertzen diren beste datu batzuk ere LANGUNE elkartearen webgunetik lortu daitezke.

Gora doa Hizkuntzen Teknologia, 37 bazkide hauek biltzen dira Langune elakrtean:

Langune_Kideak

 

Mintegia: HPSG gramatikak (2013/07/15).

Hizlariak: Montse Marimón eta Lluis Padró
Izenburua: HPSG gramatikak
Eguna: Uztailaren 15a, 2013, astelehena
Ordua: 10:00-13:00
Non
: Informatika Fakutatea, 3.2 gela

 Edukiak:

Erreferentziak: