DiarioVasco.com saria Elhuyar Hiztegiak-entzat

Saritan oparoa izan da benetan azken hilabetea Hizkuntza-Teknologiarako. Batetik Ixa Taldeak Abadia saria, eta bestetik Elhuyar ZTH eta  SEGAPOTO aplikazioek jaso dituzten GipuzkoAPP sarien berri eman dugu blog honetan.  Baina laugarren sari bat ere jaso du Hizkuntza-Teknologiako aplikazio batek.

Gutxi entzun da eta merezi du hona ekartzeak: diariovasco.com saria jaso du Elhuyar Hiztegiak webguneak. Sei sari banatu zituen Diario Vascok azaroaren 28an eta “Euskaraz egitea edo euskara ikastea ahalbidetzen duen webgune onena” kategoriakoa eman diote Elhuyar Fundaziokoei.

DVsaria_Elhuyar_Hiztegiak

(Iturria: http://premios.diariovasco.com/eus/galeria-premiados.php#)

Elhuyar Hiztegia baliabide sendoenetako bat da euskarazko hiztegigintzan, eta sendotasun horren arrazoietako bat hizkuntza-teknologia da. Atzetik urtetako corpus-bilketa, corpusen etiketatzea, lexiko- eta terminologia-erauzketa,  hiztegien eraikuntza automatikoa eta corpus-tresnak daude (webcorpusa adibidez).

http://hiztegiak.elhuyar.org/ gune berriaren ekarpen esanguratsuen errekonozimendua da sari hau.

Pozik gaude Ixa taldean, HIZTEK eta HAP masterren emaitzak ikusten dira hemen.
ZORIONAK!

Elhuyar_Hiztegiak

Mintegia: Lexikoaren Behatokia proiektua eta EDBL aberasten Hiztegi Batuarekin (2013/12/11)

Gaiak: Lexikoaren behatokia proiektua (X. Artola)
+Hiztegi Batuko informazioaren EDBLratzea (Gorka Labaka – Xabier Artola)
Hizlariak: Xabier Artola eta Gorka Labaka
Eguna: Abenduaren 11n, asteazkena
Ordua: 15:30
Tokia:  3.2 gela. Informatika Fakultatea

Lexikoaren behatokia proiektua  2008. urtean jarri zuen abian Euskaltzaindiak, Andoni Sagarna euskaltzainaren zuzendaritzapean. Euskaltzaindiko ikerketarako testu-corpus etiketatu eta linguistikoki anotatu bat prestatzea du helburu. Corpus hori osatzeko hainbat hornitzaile aurreikusi dira, hedabideak bereziki, eta horien artean, besteak beste, interes orokorreko komunikabideak. 2012. urtearen bukaeran 26.565.924 testu-hitz zeuzkan corpusak eta urtean-urtean handituz doa. Euskaltzaindia, IXA taldea, Elhuyar Fundazioa eta UZEI dira proiektuaren kideak.

Lexikoaren behatokiaren corpusa kontsultatu dezakezu hemen.

EDBL datu-base lexikalak sarrera berriak hartu ditu azken aldian Hiztegi Batuaren azken bertsiotik. Prozesu horren berri ere emango da mintegi honetan.

Lex_Behatokia_Twitter

Mintegia: Kitxuaren prozesamendurako lehen hurbilketa (2012/11/15)

Bada ia urtebete Ixa Taldea ea Cuscoko UNSAAC unibertsitateko Juan Cruz ikertzailearen artean kitxuaren prozesamenduari ekiteko lanean hasi ginela.  Euskara eta kitxua  biak baliabide gutxiko hizkuntzak direnez eta morfologia antzekoa dutenez, euskara normalizatzeko eta bere erabilera errazteko azken 20 urtetan hemen egin ditugun tresnak eta aplikazioak baliagarri izan daitezke kitxuaren kasuan ere. Madrileko “Ministerio de Asuntos exteriores y Cooperación”-en proiektu bat izan dugu 2012 urtean: Lehen urratsak Quechua-ren prozesaketa automatikoan. Corpus, morfologia eta lexikoa. Proiektu horren barruan Kepa, Xabier eta Olatz Cuscon egon gara urtean zehar, eta irailetik hona bisitan dauzkagu Hugo Quispe  eta Richard Castro. Hugo datu base lexikal bat garatzen ari da kitxuarako, eta Richard hizketa sortzeko beste sistema bat eraiki du Bilboko Aholab laborategian. Richard-ek datorren astean Iberspeech2012 kongresuan demo bat aurkeztuko du hizketa sortzeko eginda zeukaten beren lehen sistemarekin. Osteguneko mintegi-saioan proiektu honen barruan egin dena azalduko dugu.

Richard eta Hugo Aholab laborategian

Gaia: Kitxuaren prozesamendurako lehen hurbilketa
(Primera aproximación al procesamiento automático del Quechua)
Hizlaria: Hugo Quispe, Richard Castro (UNSAAC unibertsitatea),
Olatz Arregi,  Xabier Artola eta  Kepa Sarasola (Ixa Taldea)
Eguna: azaroaren 15ean, osteguna
Ordua: 16:00-17:00
Tokia:  3.2 aretoa. Informatika Fakultatea


Laburpena:
El Quechua o “Runasimipi” como lengua oriunda de la cultura Inca en el Perú, es una familia de lenguas en Latinoamérica. La situación actual de la lengua, por factores como la occidentalización entre otros, ha hecho que el quechua sea una lengua vulnerable, en vías de extinción.

Un grupo de profesores e investigadores del grupo IXA de la UPV/EHU, en conjunto con la UNSAAC en Cusco, Perú, estamos realizando un trabajo para sentar las bases de lo que pretende ser el centro de ingeniería lingüística de Cusco. Se trata de desarrollar los primeros recursos básicos y herramientas para al procesamiento automático del quechua. Los temas en los que estamos trabajando son: recopilación de un corpus textual, una base de datos léxica para la lengua quechua (BDLQ) y futuras herramientas derivadas de la misma, uso de la herramienta FOMA en el análisis morfológico y creación de un TTS como herramientas básicas para el tratamiento de la lengua.

De esta manera, se ha consolidado las bases de apoyo y trabajo en equipo entre las dos universidades, en bien de una lengua en situación crítica.

Cuscoko taldea 2012ko urtarrilean