DiarioVasco.com saria Elhuyar Hiztegiak-entzat

Saritan oparoa izan da benetan azken hilabetea Hizkuntza-Teknologiarako. Batetik Ixa Taldeak Abadia saria, eta bestetik Elhuyar ZTH eta  SEGAPOTO aplikazioek jaso dituzten GipuzkoAPP sarien berri eman dugu blog honetan.  Baina laugarren sari bat ere jaso du Hizkuntza-Teknologiako aplikazio batek.

Gutxi entzun da eta merezi du hona ekartzeak: diariovasco.com saria jaso du Elhuyar Hiztegiak webguneak. Sei sari banatu zituen Diario Vascok azaroaren 28an eta “Euskaraz egitea edo euskara ikastea ahalbidetzen duen webgune onena” kategoriakoa eman diote Elhuyar Fundaziokoei.

DVsaria_Elhuyar_Hiztegiak

(Iturria: http://premios.diariovasco.com/eus/galeria-premiados.php#)

Elhuyar Hiztegia baliabide sendoenetako bat da euskarazko hiztegigintzan, eta sendotasun horren arrazoietako bat hizkuntza-teknologia da. Atzetik urtetako corpus-bilketa, corpusen etiketatzea, lexiko- eta terminologia-erauzketa,  hiztegien eraikuntza automatikoa eta corpus-tresnak daude (webcorpusa adibidez).

http://hiztegiak.elhuyar.org/ gune berriaren ekarpen esanguratsuen errekonozimendua da sari hau.

Pozik gaude Ixa taldean, HIZTEK eta HAP masterren emaitzak ikusten dira hemen.
ZORIONAK!

Elhuyar_Hiztegiak

31 eskutik bloga

31 eskutik bloga EIZIEk jarri zuen abian 2012an, egunero euskararen erabilerari buruzko testu bat argitaratzeko, xede gutxi-asko didaktikoz idatzia.

31eskutikTalde-bloga da, egunero testu bat jartzeko, 31 lagunek idazten dute, hilean behin. Alor askotako kideak bildu dira: irakaskuntzakoak, komunikabideetakoak, itzultzaileak, idazleak, ikertzaileak, hiztegigileak…
Ixa taldeko kidea den Itziar Aduriz Agirre, Bartzelonako Unibertsitateko irakaslea eta UEUkidea dena, martxoan hasi da blog horretan. Honezkero bi artikulu bidali ditu

  • Euliak eta Kanoiak. Teoria-hizkuntzalaritza eta hizkuntzalaritza praktikoaren arteko harremanaz aritzen da. Anekdota bat ere kontatzen du: Hizkuntzalaritza konputazionala Euskaltzaindiko biltzar batean estreinakoz aurkeztuta, Piarres Xarriton altxatu eta bere iritzia bota zuen: ez ote ginen ari euliak kanoikadaz hil nahian.
  • Tristura. Kontakizun goxoa euskarazko tristura hitz horren itzulpena zein zaila den aurkezteko.  “… «ama, zer duzu?» galderari, «tristura» erantzuten zuen, eskua sabelaren gainean jartzen zuen bitartean”

Igone Zabala Ixakide berriak ere berri batzuk bidali ditu 31 eskutik blogera:

  • Corpusak eta hiztegiak artikuluan corpus eta hiztegien mugak aztertzen ditu estimatu / estimazio / estimatzaile lemen adierak aztertuta.“Hiztegiek corpusek egiten dituzten argazkiak interpretatzen dituzte eta zenbat eta argazki gehiago eta enfokatuago eduki, orduan eta informazio hobea eskainiko diete erabiltzaileei.”
  • Corpusen adierazgarritasuna artikuluan agurtzen ditu 2013an argitaratu diren corpus handi berriak “ezinezkoa zait ezikusia egitea urte honen hasieran euskal corpusgintzak eman digun uzta oparoari“. Eta eztabaidatzen du ea Egungo Testuen Corpusa (ETC) corpusa benetan ereduzkoa edo nonbait oportunista den.

Blog interesgarria da. Hizkuntza-teknologiaren bidez sortutako baliabideak aipatu, erabili eta eztabaidatzen dira bertan. Gure blogeko esteken artean sartu dugu.

 

Googleko kontzeptu-hiztegi berritzailea, IXAren elkarlanaren fruitu

Google-koek  beren ikerketa-saileko blogean Wikipedia eleanitzean oinarritutako  baliabide oso interesgarri bat atera dute pasa den asteburuan. IXA taldeko Eneko Agirre-rekin izandako elkarlanaren ondorioz sortu da baliabide hori. Hitzak eta kontzeptuak lotzen dituen hiztegi berezi bat da. Bilaketetako emaitzak hobetze aldera bilaketan zehazten ditugun hitzen esanahiak (kontzeptuak) bereizteko oso erabilgarria izango da hiztegi berri hau. Hemendik deskargatu daiteke.

Albistearen hasiera Google-ren ikerketa-sailaren blogean

Orain dela lau urte Ixa taldeko blog honetako albiste batean poztu egiten ginen azkenean bilatzaileak hizkuntza-teknologia erabiltzen hasten zirelako. Ordura arte Google-ren eta beste bilatzaileetan hitz soila izan baitzen oinarria, karaktere-sekuentzia hutsa.

Bi urte geroago blogeko beste albiste batean IXA taldeko Eneko Agirre Google-ren Zurich-eko ikerketa zentroan izan zela genion, Google-k ikerkuntza jardunaldi batzuetara gonbidatuta.

Oraingoan, eta harreman horren fruitu gisa, 297 miloi (hitz, kontzeptu) bikote dituen “hiztegi” berri hori argitaratu dute. Non kontzeptu bakoitza Wikipediako artikulu bateko izenburua den, eta hitza Wikipedia barruan artikulu horri esteka bat egiteko erabili den testua. Gero zerrenda horiek hainbat modutan erabil daitezke, adibidez, hitzetatik kontzeptuetara edo kontzeptuetatik hitzetara. Zehaztasun gehiago nahi izanez gero jo Googleko blogeko albistera (laburra da eta nahiko ulergarri), ikusi LREC 2012 konferentzian aurkezten duten artikulua, edo irakurri datuekin batera datorren README fitxategia.

Baliabide ireki berri honekin aplikazio berritzaile asko sortu ahal izango dira laster. Adibidez, Google-k duela gutxi kaleratu duen Ezagutza-Grafoarekin zerikusi hertsia duela uste dugu. Ezagutza-grafo horrekin Google-ren egiten ditugun bilaketetan ohiko esteka zerrendaz gain, interesa dugun pertsona edo kontzeptuari buruzko datuak ere azalduko zaizkigu. Proba moduan, oraingoz bilatzailearen ingelesezko bertsioan bakarrik eskaintzen dute. Hemen adibidez Marie Curie-ri buruz galdetuz gero ikusiko genukeena:

Bilaketan izen anbiguo bat jarriz gero informazio ezberdina azalduko zaigu, Manhattanekin gertatzen den bezala (New York-eko hiria edo Woody Allen-en pelikula):

Santiago de Cubako Centro de Lingüística Aplicada-k 40 urte

Iñaki Alegria izan da Ixa taldearen ordezkaria Santiago de Cubako Centro de Lingüística Aplicada-k (CLA) aurten antolatu duen XII Simposium-ean. 10 orduko ikastaro bat eman du
Iñakik morfologiako tresnak erraz inplementatzeko oso baliagarria den Foma tresnaz

Oraintxe bete berri ditu Centro de Lingüística Aplicada horrek 40 urte. Zorionak!

CLA ikergunearen 40. urteurrena izan dela-eta argazkiko eskultura bidali digute IXA taldekoei opari moduan, gure lankidetza ospatzeko edo.

Eskerrik asko. Eta zorionak Eloinari, Julio Viteliori, Leonel-i eta ikergune hori sortu eta animatzen duten ikerlari horiei guztiei!

IXA taldea lankidetzan aritu izan da azken 10 urteetan CLA ikergunearekin.

Hortik atera da, adibidez, lehengo urtean argitaratu zen Cubako Diccionario Básico Escolar (DBE) hiztegiaren hirugarren edizioa. Hiztegia XMLz kodetuta dago, eta hiztegiak editatzeko Ixa taldean garatu zen leXkit izeneko ingurunea erabili zen.

Berri hau ingelesez / English version of this new