Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken bidez.


Zuzentzaile ortografiko automatikoa tresna lagungarria da zalantzarik gabe. Halako tresna batek aztergai duen aztertzeko unitatea hitz soltea izaten da. Testuen zuzenketa automatiko sakonagoa egin ahal izateko sintaxia ere kontuan hartu behar izaten da, eta halakoetan, esaldi luze-luzeak izan ohi direnez, esaldi horien sintaxia lantzeko esaldia “zati” txikiagoetan banatzea izan ohi da lehen pausoa: sintagmak eta perpausak identifikatzea, alegia.Bertol Arrieta Kortajarena Ixakideak bere tesian Ikasketa Automatikoko teknikak aztertu eta erabiltzea izan du helburu, euskararen sintaxian eta zuzenketa automatikoan bi urrats aurrera egiteko.

Hau da tesiaren izenburu osoa:
Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken bidez: euskarako  kateen eta perpausen identifikazioa eta bere erabilera koma-zuzentzaile batean.

Hala, euskarako kate- eta perpaus-identifikatzaile automatikoak sortu dira, ikasketa automatikoko teknikak hizkuntzaren ezagutzan oinarritutakoekin uztartuz. Modu honetan, testu bat emanda, makina gai da testu horretako sintagmak, perpausak eta esaldiak modu automatikoan identifikatzeko. Tresna hauek oso baliagarriak dira analisi sintaktiko automatiko osoa edo sakona bideratzeko, eta baita Hizkuntzaren Prozesamenduko hainbat arloetan aurrerapausoak egiteko ere: hala nola, informazioaren erauzketa, laburpenen sorkuntza, itzulpen automatikoa

Horretaz gain, puntuazioaren erabilera jorratu da hizkuntzalaritza konputazionalaren ikuspegitik. Makinak hizkuntzaren ulermen osoa lor dezan, komak duen garrantzia aztertu da, batez ere. Hala, euskarako koma-zuzentzaile automatiko bat garatu da ikasketa automatikoko teknikak baliatuz. Horretarako, aurrez sortutako kate- eta perpaus-identifikatzaileek ematen duten informazioa erabili da. Koma-zuzentzaile hau XUXENg euskarako estilo- eta gramatika-zuzentzailean txertatu nahi da. Gainera, baliagarria izango da euskarako analizatzaile eta desanbiguatzaile sintaktikoak hobetzeko, eta baita ahotsaren ezagutza sistemetan integratzeko ere.

Tesi osoa eta aurkezpena Ixa taldeko argitalpenen orritik jaso daitezke. Pasa den uztailaren 27an aurkeztu izan da, eta zuzendariak Iñaki Alegria eta Arantza Diaz de Ilarraza izan dira.

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude