Izen+aditz konbinazioen erauzketaz PLOS ONE aldizkarian – Hizkuntza-teknologiak, Ixa Taldearen bloga

Uxoa Iñurrietak bere tesian izen+aditz konbinazioen itzulpena (gaztelaniatik euskarara) eta tratamendu konputazionala aztertu zuen 2019an. Eta tesitik eratorritako artikulu bat argitaratu du abuztuan PLOS ONE aldizkarian.

Learning about phraseology from corpora: A linguistically motivated approach for Multiword Expression identification.
Uxoa Inurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka, Kepa Sarasola

Galdera honi erantzun dio artikuluarekin: Nola detektatu izen+aditz konbinazio berezi horiek masiboki eta automatikoki corpus elebakarra eta elebiduna edukiz gero? Eskuzko lana murriztu eta detektatuko konbinazioen kopurua handitu nahi da.

Metodo bat asmatu da hori egiteko, eta ebaluatu ondoren ikusi da baliagarria dela. Perfektoa ez dela, ez, baina baliagarria bai.

Konbinazio horien informazio morfosintaktiko espezifikoa erabilgarria dela ikusi zen lehenago. Aurreko lan batean egiaztatu zen informazio lexikal eta morfosintaktikoa erabiltzea eragin positiboa izan zuela bai identifikazioan, bai itzulpen automatikoan. Hala ere, konbinazio kopuru ez-handi bat baino ez zen aztertu, eta, analisi-prozesua eskuzkoa izanik, metodoak eskalagarritasun-arazo argia zuen. Orain argitaratutako artikuluak atea irekitzen dio konbinazio berezi horiek masiboki eta automatikoki jasotzeari. 🙂

Lan horrekin lotuta dauden beste argitalpen batzuk:

Ez burua hautsi, Matxin! Elhuyar aldizkaria
Izen+aditz konbinazioen itzulpenaz eta tratamendu konputazionalaz
Senez itzulpen-aldizkaria
Using Linguistic Data for Verb-Noun Combination Identification
COLING 2016
Uxoa Iñurrietak parte hartu zuen Wolfram deuna 2016 umorezko saioan. Ikusi behean Teknopolis programako albistea (Uxoarena: 2’10”).

Utzi erantzuna Cancel Reply