Euskal WordNet hiztegi semantikoa “publiko” bihurtu dugu

Itzulpen automatikoari, informazio-erauzketari eta hitzen adieren desanbiguazioari ganoraz ekin ahal izateko, makinek betiko hiztegiak baino tresna informatiko boteretsuagoak behar dituzte. Helburu horiek lantzeko oso egokia den Euskal WordNet baliabidea, eta hori aste honetan doan jaitsi eta kontsultatzeko moduan jarri dugu IXA taldean.¬† Gure 25. urteurrena ospatzeko beste modu gehigarri bat ūüėČ
Ea denon artean fruitu gehiago ateratzen diogun baliabide ahaltsu honi!

Euskal WordNet euskararentzat egin den lehen Ezagutza-Base Lexikala (EBL) da. Alegia, informazio lexikala eta semantikoa jasotzen eta antolatzen dituen ‚Äúhiztegi semantikoa‚ÄĚ edo biltegi bat. Datu-base baten antzekoa da, baina desberdintasuna da hiztegi batean jasotzen den informazioaz gain ‚ÄĒhitzen adierak eta adiera horien definizioak eta adibideak‚ÄĒ kontzeptuak elkarren artean harremanetan jartzen direla.

Adibidez, hatz hitza kontsultatuz gero, zera esaten digu: ‚Äúgizakiaren eskua edo oina bukatzen den bost zatietako bakoitza‚ÄĚ da. Hori da esanahia, baina horretaz gain, beste hitzekin dituen erlazioen biartez hainbat informazio ere jaso dezakegu: hatza gorputz-adar bat dela, hatz lodia hatz bat dela, hatzak eskuen zati bat direla, eskuak aldi berean besoaren zati bat direla, eta hatzak gauzak ukitzeko erabiltzen direla. Kontzeptu horrek beste hizkuntzetan dauzkan baliokideak ere lortu ditzakegu (digit, dedo, dixito, dit). Azken finean, kontzeptu guztiak euren artean harremanetan jartzen dira hierarkikoki.

EuskalWordnet_hatz_eleanitza

“hatz” hitza kontsultatzen EuskalWordnet-en (zati bat)

Datu-base hori oso baliagarria da hainbat arlotan, hala nola, itzulpengintza automatikoan, informazio-erauzketan, hitzen adieren desanbiguazioan eta galdera-erantzun sistemetan. Itzulpen automatikoan, esaterako, sistemak ulertu behar du zer hitz ari den itzultzen eta horretarako horrelako ‚Äúhiztegi semantiko‚ÄĚ baten beharra dauka. Ezinbestekoa da hitz batek dituen adieretatik egokiena bereiztea kalitatezko itzulpena bermatzeko. WordNet erabilita egungo itzulpen automatikoen kalitate hobetzea da IXA taldearen ardura QTLeap proiektu europarrean.

HAP_diptiko_Irudia

HAP/LAP masterra

Euskal WordNet eta antzerako aplikazioak nola sortu eta nola erabili nahi dituenak horiek ikasi ahal izango ditu 2014-2015 ikasturtean UPV/EHUn IXA Taldeak emango duen Hizkuntzaren Azterketa eta Prozesamendua unibertsitate-masterrean. Ekainaren 30era arte dago izena emateko aukera http://ixa.si.ehu.es/master

31 eskutik bloga

31 eskutik bloga EIZIEk jarri zuen abian 2012an, egunero euskararen erabilerari buruzko testu bat argitaratzeko, xede gutxi-asko didaktikoz idatzia.

31eskutikTalde-bloga da, egunero testu bat jartzeko, 31 lagunek idazten dute, hilean behin. Alor askotako kideak bildu dira: irakaskuntzakoak, komunikabideetakoak, itzultzaileak, idazleak, ikertzaileak, hiztegigileak…
Ixa taldeko kidea den Itziar Aduriz Agirre, Bartzelonako Unibertsitateko irakaslea eta UEUkidea dena, martxoan hasi da blog horretan. Honezkero bi artikulu bidali ditu

  • Euliak eta Kanoiak. Teoria-hizkuntzalaritza eta hizkuntzalaritza praktikoaren arteko harremanaz aritzen da. Anekdota bat ere kontatzen du: Hizkuntzalaritza konputazionala Euskaltzaindiko biltzar batean estreinakoz aurkeztuta, Piarres Xarriton altxatu eta bere iritzia bota zuen: ez ote ginen ari euliak kanoikadaz hil nahian.
  • Tristura. Kontakizun goxoa euskarazko tristura hitz horren itzulpena zein zaila den aurkezteko.¬† “… ¬ęama, zer duzu?¬Ľ galderari, ¬ętristura¬Ľ erantzuten zuen, eskua sabelaren gainean jartzen zuen bitartean”

Igone Zabala Ixakide berriak ere berri batzuk bidali ditu 31 eskutik blogera:

  • Corpusak eta hiztegiak artikuluan corpus eta hiztegien mugak aztertzen ditu estimatu / estimazio / estimatzaile lemen adierak aztertuta.“Hiztegiek corpusek egiten dituzten argazkiak interpretatzen dituzte eta zenbat eta argazki gehiago eta enfokatuago eduki, orduan eta informazio hobea eskainiko diete erabiltzaileei.”
  • Corpusen adierazgarritasuna artikuluan agurtzen ditu 2013an argitaratu diren corpus handi berriak “ezinezkoa zait ezikusia egitea urte honen hasieran euskal corpusgintzak eman digun uzta oparoari“. Eta eztabaidatzen du ea Egungo Testuen Corpusa (ETC) corpusa benetan ereduzkoa edo nonbait oportunista den.

Blog interesgarria da. Hizkuntza-teknologiaren bidez sortutako baliabideak aipatu, erabili eta eztabaidatzen dira bertan. Gure blogeko esteken artean sartu dugu.

 

Mintegia: Terminoen erregistro akademikoen garapena aztertzeko lan-ingurunea(2013/02/28)

Gaia: GARATERM: erregistro akademikoen garapena aztertzeko lan-ingurunea
Hizlaria: Igone Zabala
Eguna: Otsailak 28, osteguna
Ordua: 15:00
Tokia:  3.2 gela. Informatika Fakultatea

Laburpena:
2008 urtean aurrera eraman zen GARATERM proiektua (EHU-EJIE deialdiko diru-laguntza). Proiektu horretan gogoeta orokorra egin zen euskara akademikoaren garapena, ikerketa eta didaktika uztartzeko plataforma bat osatzeko eman beharreko urratsez eta beharrezko liratekeen tresna eta baliabideez. Gogoeta horrekin batera etorri zitzaion orduko Euskal Filologia sailari (orain Euskal Hizkuntza eta Komunikazioa izena duenari) zeregin bat Euskara Errektoreordetzatik, alegia, Euskara Plan Gidarian aurreikusten ziren irakasleentzako tailerren ardura hartzea. Zeregin hori Garaterm proiektuaren ideiarekin uztartu zen, eta hasieran tailer huts modura pentsatuta zeudenak Terminologia Sareak Ehunduz esaten diogun programa bihurtu ziren apurka-apurka. 2011 eta 2012 urteetan Elhuyarrekin batera aurrera eraman den unibertsitate-gizartea proiektuaren bitartez eta TSE programan lortutako esperientziari esker, aurrera eraman ahal izan dira lehen proiektuan beharrezkotzat hartutako zenbait elementu. Hitzaldi honetan “Garaterm-2: Linguistikoki prozesatutako corpusetatik terminologia eta neologia erauzteko lan-ingurunearen garapena” proiektuaren helburuak, lorpenak eta aurrera begira egin beharrekoak azalduko dira.

CLARIN proiektuaren bilera Euskal Herriko agenteekin

Ixa Taldeak CLARIN proiektuaren bilera bat antolatu du  n  ekainaren 8an Donostian.  CLARIN proiektuaren helburua hizkuntza-baliabide konputazionalak zabaltzea da giza zientzietako ikerketetan erabiliak izan daitezen.

CLARIN

Bileraren helburuak bi izan dira:

  • Alde batetik, CLARIN proiektuaren zehaztasunak proiektuko arduradunen eskutik¬† zuzenean jasotzea Euskal Herrian. Horregatik izan dugu gure artean Steven Krauwer Utrecht-eko Institute of Linguistics zentroko ikertzailea eta CLARIN proiektuaren koordinatzailea. Eta horregatik izan dugu gure artean Pompeu Fabra Unibertsitateko Nuria Bel irakaslea, bera baita CLARIN proiektuko arduraduna estatu mailan.

  • Eta beste alde batetik, Euskal Herrian hizkuntzaren azterketa eta prozesamenduan aritzen garen taldeon lanak aurkeztea.

Bileran parte hartu dute Eusko Jaurlaritzako Hizkuntza Politikako zuzendaria den Lourdes Auzmendik, Bego√Īa Muruaga zuzendariordeak, eta Araceli D√≠az de Lezanak. Ikusle gisa¬† parte hartu dute¬† proiektuaren berri zehatzagoa izateko eta euskarak marko horretan egin dezakeen ekarpena neurtzeko.

Egitaraua hau izan da (egindako aurkezpen guztien fitxategiak hemendik eskuratu daitezke):

10:00etan, Steven Krauwer (CLARIN proiektua eta Utrecht Institute of Linguistic)

10:30etan, Nuria Bel (Pompeu Fabra Unibertsitatea). 

11:00etan, Atsedenaldia

11:30etatik -13:00etara Hemengo taldeen aurkezpenak (I)

  • Miriam Urkia. Euskaltzaindia
  • Miren Azkarate. Euskara institutua. UPV/EHU
  • Mikel Santesteban.¬† Gogo Elebiduna. UPV/EHU
  • Antton Gurrutxaga eta¬† I√Īaki San Vicente.¬† Elhuyar I+G

13:00etan: Luncha

14:00etatik-15:00etara Hemengo taldeen aurkezpenak (2. saioa)

  • Igone Zabala. Euskal Filologia saila. UPV/EHU
  • Ibon Aizpurua. Eleka.
  • Jon S√°nchez. Aholab. UPV/EHU.
  • Kepa Sarasola. IXA Group. UPV/EHU

15:00-15:30: Jardunaldiaren ondorioak. Arantza Diaz de Ilarraza

CLARIN meeting Donostia10

Argi geratu da egun euskararako ditugun baliabide eta tresnak baliagarriak direla CLARIN proiekturako, baita Europa mailan sortzen ari diren antzeko proiektuetarako ere. Horrela adierazi dute Stephen Krawer eta Nuria Bell  arduradunek.

Parte hartzaileek zuzenean ezagutu dituzte proiektuaren arduradunak eta horiekin itunak sinatu ahal izango dituzte hemendik aurrera.

Gure ustetan CLARIN proiektua interesgarria da, Europako hainbat estatuk bermatua da eta, etorkizunari begira, baliagarria euskararen baliabideak zabaltzeko eta homologatzeko.