DiarioVasco.com saria Elhuyar Hiztegiak-entzat

Saritan oparoa izan da benetan azken hilabetea Hizkuntza-Teknologiarako. Batetik Ixa Taldeak Abadia saria, eta bestetik Elhuyar ZTH eta  SEGAPOTO aplikazioek jaso dituzten GipuzkoAPP sarien berri eman dugu blog honetan.  Baina laugarren sari bat ere jaso du Hizkuntza-Teknologiako aplikazio batek.

Gutxi entzun da eta merezi du hona ekartzeak: diariovasco.com saria jaso du Elhuyar Hiztegiak webguneak. Sei sari banatu zituen Diario Vascok azaroaren 28an eta “Euskaraz egitea edo euskara ikastea ahalbidetzen duen webgune onena” kategoriakoa eman diote Elhuyar Fundaziokoei.

DVsaria_Elhuyar_Hiztegiak

(Iturria: http://premios.diariovasco.com/eus/galeria-premiados.php#)

Elhuyar Hiztegia baliabide sendoenetako bat da euskarazko hiztegigintzan, eta sendotasun horren arrazoietako bat hizkuntza-teknologia da. Atzetik urtetako corpus-bilketa, corpusen etiketatzea, lexiko- eta terminologia-erauzketa,  hiztegien eraikuntza automatikoa eta corpus-tresnak daude (webcorpusa adibidez).

http://hiztegiak.elhuyar.org/ gune berriaren ekarpen esanguratsuen errekonozimendua da sari hau.

Pozik gaude Ixa taldean, HIZTEK eta HAP masterren emaitzak ikusten dira hemen.
ZORIONAK!

Elhuyar_Hiztegiak

Mintegia: Lexikoaren Behatokia proiektua eta EDBL aberasten Hiztegi Batuarekin (2013/12/11)

Gaiak: Lexikoaren behatokia proiektua (X. Artola)
+Hiztegi Batuko informazioaren EDBLratzea (Gorka Labaka – Xabier Artola)
Hizlariak: Xabier Artola eta Gorka Labaka
Eguna: Abenduaren 11n, asteazkena
Ordua: 15:30
Tokia:  3.2 gela. Informatika Fakultatea

Lexikoaren behatokia proiektua  2008. urtean jarri zuen abian Euskaltzaindiak, Andoni Sagarna euskaltzainaren zuzendaritzapean. Euskaltzaindiko ikerketarako testu-corpus etiketatu eta linguistikoki anotatu bat prestatzea du helburu. Corpus hori osatzeko hainbat hornitzaile aurreikusi dira, hedabideak bereziki, eta horien artean, besteak beste, interes orokorreko komunikabideak. 2012. urtearen bukaeran 26.565.924 testu-hitz zeuzkan corpusak eta urtean-urtean handituz doa. Euskaltzaindia, IXA taldea, Elhuyar Fundazioa eta UZEI dira proiektuaren kideak.

Lexikoaren behatokiaren corpusa kontsultatu dezakezu hemen.

EDBL datu-base lexikalak sarrera berriak hartu ditu azken aldian Hiztegi Batuaren azken bertsiotik. Prozesu horren berri ere emango da mintegi honetan.

Lex_Behatokia_Twitter

Kitxua lantzeko, Cusco-ko bisitariak berriro gurean

HinantinPeruko UNSAAC unibertsitateko lankidetzan ari gara orain dela bi urtetik hona. Euskara automatikoki tratatzeko erabili dugun teknologia eta estrategia kitxua hizkuntzari ere aplikatzea da gure helburua.

Zuzentzaile ortografiko bat martxan dago. Analizatzaile morfologikoa eta sintaktiko xume bat ere bai. Hilabete gutxiren barruan kitxuaren datu-base lexikalaren lehen bertsioa eta corpusa kontsultatzeko lehenengo web-aplikazio bat plazaratu nahi ditugu.

Lehengo urtean bi bisitari izan genituen:

Aurten beste bi bisitari ditugu gure artean:

  • IMG_1758Rosemary Jimenez:  testuak automatikoki sailkatzeko programa aurkeztu du gaur bertan, bere master-tesi moduan. Eta bera da corpusa eratu eta kontsultatzeko aplikazioa sortzen ari dena.
  • José Lozano: Kitxua irakasteko sistema bat sortzen ari da Waldir Farfan-ekin. Datorren igandean kitxuazko esaldiak analizatzen dituen sistema aurkeztuko du Polonian, Language Technology Congress (LTC’2013) kongresuan.

2012an Madrileko Kooperaziorako Ministerioko proiektu bat izan genuen, 2013an EHUrekin RUNASIMI proiektua. Juan Cruz irakasleak koordinatzen duen Hinantin taldea jaio da. Orain proiektu berri bat prestatzen ari gara lan hauei 2014an jarraipena emateko.

Hizkuntzalari Euskaldunen I. Topaketa

Arrakastatsua izan da Hizkuntzalari Euskaldunen I. Topaketa. UEUko Hizkuntzalaritza Sailburuak diren Itziar Aduriz eta Ruben Urizar IXAkideek balorazio oso positiboa egin dute bilkuraz.

Lau izan dira bilkuran Ixa Taldearen aldetik aurkeztu diren lanak:

  • Euskarazko testuen sinplifikazio automatikoa. Itziar Gonzalez Dios
  • EPEC corpusa predikatu mailan etiketatzeko eta ustiatzeko oinarriak: BVI, EPEC-RoISem eta e-ROLda. Ainara Estarrona
  • Ezagutza linguistikoa Ingelesa-Euskara itzulpen automatikoko sistemen garapenean. Nora Aranberri
  • BASYQUE: hizkeren arteko aldakortasun sintaktikoa aztertzeko aplikazioa. Gotzon Santander, Xan Aire, Larraitz uria eta Ricardo Etxepare (CNSR-IKER / UPV-EHU, IXA)

Zorionak, hizkuntzalariok!

Edurne Elizondoren albistea Berrian
(Arg.: A. Canellada, ARP)