Twitter-eko testuetan hitzak ez dira azaltzen beti beren itxura normalizatuan. Laburtuta azaltzen dira sarritan, edo deformatuta emozio-puntu bat adierazteko (edeeeerra, esaterako). Normalizazio-falta hori arazo da Twitterreko testuak gero automatikoki landu ahal izateko hizkuntza-teknologikaren bidez.
Ixa taldeko kide batzuen iniziatibaz Tweet Normalization Workshopa antolatu da aurten SEPLN2013 konferentziaren barruan.
WEET-NORM_2013 Workshop hori lehiaketa baten inguruan antolatu da, partaideek lehenago espaineraz idatzitako “txioak” normalizatu behar izan dituzte, eta honezkero publikoak dira lehiaketaren emaitzak (ikusi behean ere). Euskal Herriko parte hartzaileak ez gara txarto geratu. Elhuyar, IXA Taldea eta Vicomtech hor gaude hirurak elkarren jarraian 4., 5. eta 6. posizioetan.
Workshopa irailaren 20an izango da Madrilen. Talde bakoitzak bere sistema aurkeztuko du eta bukaeran eztabaida egingo dugu.
Posizioa | Parte hartzailea |
Exekuzio hoberenaren zehaztasuna |
2. Exekuzio Hoberenaren zehaztasuna |
---|---|---|---|
1 | RAE | 0,781 | |
2 | Citius-Imaxin | 0,663 | 0,662 |
3 | UPC | 0,653 | |
4 | Elhuyar | 0,636 | 0,634 |
5 | IXA-EHU_em-phonm | 0,619 | 0,609 |
6 | Vicomtech | 0,606 | |
7 | UniArizona | 0,604 | |
8 | UPF-Havas | 0,548 | 0,491 |
9 | DLSIAlicante | 0,545 | 0,521 |
10 | UniMelbourne | 0,539 | 0,517 |
11 | UniSevilla | 0,396 | |
12 | Ujaen-sinai | 0,376 | |
13 | UniCoruña | 0,335 |
Ixa taldean workshop hau TACARDI proiektuaren barruan bideratzen dugu. Itzulpen automatikoari ekin aurretik testuak zuzentzea eta normalizatzea oso lagungarria izaten baita.
