Izen+aditz konbinazioen erauzketaz PLOS ONE aldizkarian

Gorka Labaka
Uxoa Iñurrieta

Uxoa Iñurrietak bere tesian izen+aditz konbinazioen itzulpena (gaztelaniatik euskarara) eta tratamendu konputazionala aztertu zuen 2019an. Eta tesitik eratorritako artikulu bat argitaratu du abuztuan PLOS ONE aldizkarian.

Learning about phraseology from corpora: A linguistically motivated approach for Multiword Expression identification.
Uxoa Inurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka, Kepa Sarasola

Galdera honi erantzun dio artikuluarekin: Nola detektatu izen+aditz konbinazio berezi horiek masiboki eta automatikoki  corpus elebakarra eta elebiduna edukiz gero? Eskuzko lana murriztu eta detektatuko konbinazioen kopurua handitu nahi da.

Metodo bat asmatu da hori egiteko, eta ebaluatu ondoren ikusi da baliagarria dela. Perfektoa ez dela, ez, baina baliagarria bai.

Konbinazio horien informazio morfosintaktiko espezifikoa erabilgarria dela ikusi zen lehenago. Aurreko lan batean egiaztatu zen  informazio lexikal eta morfosintaktikoa erabiltzea  eragin positiboa izan zuela bai identifikazioan, bai itzulpen automatikoan. Hala ere, konbinazio kopuru ez-handi bat baino ez zen aztertu, eta, analisi-prozesua eskuzkoa izanik, metodoak eskalagarritasun-arazo argia zuen. Orain argitaratutako artikuluak atea irekitzen dio konbinazio berezi horiek masiboki eta automatikoki jasotzeari. 🙂

Lan horrekin lotuta dauden beste argitalpen batzuk:

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude