Maite Oronoz eta Larraitz Uria punta-puntan Mitxelena tesi-sarian

Astelehenean banatu ziren Euskarazko Tesien II. Koldo Mitxelena sariak Bilbon Euskaltzaindiaren egoitzan. Euskaltzaindiak berak eta EHUk antolatzen dute saria.

EHUko Ixa taldeko kidea den Maite Oronoz Antxordoki-k  irabazi du Ikasketa Teknikoen jakintza-arloko saria. Maitek bere doktore-tesian hainbat errore sintaktiko detektatzeko sistemak garatu ditu.
ZORIONAK Maiteri!
Zorionak zuzendariei! (Arantza Diaz de Ilarraza eta Koldo Gojenola)!

Tesi horren berri ikus dezakezu blog honetan lehengo urteko berri batean.

A! Eta bide batez, zorionak Larraitz Uria Garin lankideari ere bai. Bere tesia sari horretako bonboan azken unera arte egon baita.
Tesi bietan euskarazko erroreak eta desbideratzeak aztertzen dituzte, Maiterenean ikuspuntu informatikotik bideratuta, Larraitzenean linguistikotik.
ZORIONAK zuri ere bai, Larraitz!

Euskarazko erroreen eta desbideratzeen analisirako lan-ingurunea

Horixe da Larraitz Uria-k aurkeztu berri duen tesiaren gaia. Zuzendariak Igone Zabala eta Montse Maritxalar izan dira. Larraitz ikertzailea dugu IXA taldean eta Baionako Unibertsitateko IKER taldean ere bai.

Euskarazko erroreak eta desbideratzeak aztertzen ditugu bi ikerketa‑alorretan ekarpenak egiteko: erroreen tratamendu automatikoaren alorrean, euskararako ortografia‑, gramatika- eta estilo-zuzentzailea edota aldaki dialektalen markatzailea bezalako tresnak garatzea dugu helburu; ordenagailuz lagundutako hizkuntzen i(ra)kaskuntzaren alorrean, berriz, hizkuntzaren i(ra)kaskuntza prozesua bideratzen laguntzeko baliabideak prestatzea da gure xedeetako bat.

Alor bi horietan, batean zein bestean, erabiltzaileen beharrei erantzuteko gai diren laguntza‑tresna eraginkorrak garatu ahal izateko, ezinbestekoa da euskaraz egiten diren erroreen eta desbideratzeen analisi sakona egitea, gure hizkuntza‑komunitateak bizi duen egoera soziolinguistikoa kontuan hartuta.

Testuinguru honetan, erroreak eta desbideratzeak bereizten ditugu. Erroretzat hartzen ditugu arau linguistikoak betetzen ez dituzten egiturak, edozein kasutan gaizki egongo direnak. Desbideratze esaten diegu, berriz, gramatikaren ikuspuntutik zuzenak izan arren, testuinguru edota egoera jakin batean egokiak ez diren egiturei: behin eta berriz errepikatzen diren hitzei/egiturei edota testuinguru komunikatibo jakin baterako desegokiak diren baliabideei (adibidez, baliabide dialektalak erabiltzea euskara batua erabili behar den testuinguruetan, edota alderantziz) (Karrajuan ohar bat egin duten ildo horren inguruan).

Tesi-lan honetan, euskarazko erroreen azterketa eta prozesamendua bideratzeko hainbat irizpide finkatu ditugu eta lan-ingurune oso bat eratu dugu erroreen eta desbideratzeen analisirako ezinbestekoak diren baliabideekin: corpusak (hizkuntza‑ikasleen edota hiztun arrunten testu-bildumak), adibide erroredunak corpusetan etiketatzeko EtikErro deritzon editorea, erroreen eta desbideratzeen sailkapen bat eta etiketatutako adibideak gordetzeko bi datu-base: erroreak eta ikasleak. Erroreak datu‑basean erroreen eta desbideratzeen adibideak biltegiratzen ditugu, adibide bakoitza automatikoki tratatzeko beharrezkoa den informazio linguistikoarekin eta teknikoarekin batera; Ikasleak datu‑basean, berriz, hizkuntza‑ikasleek egindako erroreen eta desbideratzeen adibideak gordetzen ditugu, adibideei dagokien informazio linguistikoarekin eta psikolinguistikoarekin batera. Informazio hori guztia da helburu ditugun tresna informatikoak garatzeko oinarria.

Errore mota guztien analisia aldi berean egitea ezinezkoa zaigunez, tesi‑lan honetan determinatzaile-erroreak izan ditugu aztergai eta determinatzaile-errore batzuk automatikoki detektatzeko erregelak egin ditugu. Erregela horiek euskararako garatzen ari garen XUXENg gramatika‑zuzentzailean integratuko dira.

Zuzenketaren ildoan sortu zen hasieran Xuxen eta azkenaldian XuxenIV  barruan banatzen den Ortografia-, gramatika- eta estilo-zuzentzailea.

Zorionak Larraitz!

Jaso hemendik tesiaren txosten osoa.
Jo hona Larraitzen artikulu zientifikoak jasotzeko.

Beste zenbait esteka: erabili.com, eurekalert, karrajua, bizkaie, basqueresearch, redorbit, uztaro.