Twitter-eko testuak normalizatzeko lehiaketa antolatu dugu.

Twitter-eko testuetan hitzak ez dira azaltzen beti beren itxura normalizatuan.  Laburtuta azaltzen dira sarritan, edo deformatuta emozio-puntu bat adierazteko (edeeeerra, esaterako). Normalizazio-falta hori arazo da Twitterreko testuak gero automatikoki landu ahal izateko hizkuntza-teknologikaren bidez.

Ixa taldeko kide batzuen iniziatibaz Tweet Normalization Workshopa  antolatu da aurten SEPLN2013 konferentziaren barruan.

Tweet-NormWEET-NORM_2013 Workshop hori lehiaketa baten inguruan antolatu da, partaideek lehenago espaineraz idatzitako “txioak” normalizatu behar izan dituzte, eta honezkero publikoak dira lehiaketaren emaitzak (ikusi behean ere). Euskal Herriko parte hartzaileak ez gara txarto geratu. Elhuyar, IXA Taldea eta Vicomtech hor gaude hirurak elkarren jarraian 4., 5. eta 6. posizioetan.

Workshopa irailaren 20an izango da Madrilen. Talde bakoitzak bere sistema aurkeztuko du eta bukaeran eztabaida egingo dugu.

Posizioa Parte hartzailea
Exekuzio hoberenaren zehaztasuna
2. Exekuzio Hoberenaren  zehaztasuna
1 RAE 0,781
2 Citius-Imaxin 0,663 0,662
3 UPC 0,653
4 Elhuyar 0,636 0,634
5 IXA-EHU_em-phonm 0,619 0,609
6 Vicomtech 0,606
7 UniArizona 0,604
8 UPF-Havas 0,548 0,491
9 DLSIAlicante 0,545 0,521
10 UniMelbourne 0,539 0,517
11 UniSevilla 0,396
12 Ujaen-sinai 0,376
13 UniCoruña 0,335

Ixa taldean workshop hau TACARDI proiektuaren barruan bideratzen dugu. Itzulpen automatikoari ekin aurretik testuak zuzentzea eta normalizatzea oso lagungarria izaten baita.

Tacardi_irudia
TACARDI proiektua: Testuinguruaren erabilera itzulpen automatikoan eta horren hobekuntza Interneteko baliabide dinamikoak baliatuz

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude