Elhuyar irabazle testuetan jarrera positibo edo negatiboak antzemateko TASS txapelketan

Aurten SEPLN biltzarrarekin batera TASS txapelketa  antolatu da.

Txapelketaren helburua gaztelaniazko Twitter mezuetan jarrera positiboa edo negatiboa antzematea zen. Formalki horri sentimenduen analisia esaten zaio (análisis de sentimientos, sentiment analysis edo opinion mining)

Eta nor izan da txapelduna?   Elhuyar I+G !

Sistemaren garatzaileak Iñaki San Vicente eta Xabier Saralegi izan dira (gure HAP master ofizialean hezitako jendea).

ZORIONAK!

Emaitza guztiak hemen ikus daitezke.

 

Xuxen, Kimmo Koskeniemmi eta FSMLNP2012

XUXEN zuzentzaile ortografikoak laguntza paregabea eskaintzen dio erabiltzaileari testuaren kalitatea hobetzeko eta euskara batuaren forma estandarrekin ohitzen joateko apurka-apurka. Horrela, esan dezakegu euskararen estandarizazio-prozesuaren aliatu indartsua dela XUXEN programa.

 

Programaren erabilera guztiz hedatuta dago gaur egun, erabiltzaile kopuruaren aldetik eta aplikazio informatikoen aldetik:

1) Dohainik jaitsi daiteke www.euskara.euskadi.net webgunetik,
2) 1998z geroztik Microsoft Officeko banaketa ofizial guztiek barruan daukate.
3) www.euskara.euskadi.net webgunetik egin diren deskargak 20.000 baino gehiago izan dira.
4) OpenOffice-rako deskargak 7.000 baino gehiago izan ziren 2010. urtean.
5) Firefoxerako deskargak 134.000 baino gehiago izan dira 2007tik.
6) Eta posible da beste edozein aplikaziorekin ere erabiltzea www.xuxen.com zerbitzarira jotzen badugu.

Koskeniemmi Donostian 1990ean (Euskaldunon Egunkaria)

Baina espainiera, frantsesa edo ingeleserako zuzentzaileak baino dezente konplexuagoa da XUXEN, hitz posibleak askoz gehiago direlako, eta ondorioz, hitzen analisi morfologikoa egin behar delako. 1989an horretarako balio zuen programa propio eta konplexu bat  sortu behar izan genuen. Baina hori ez zatekeen posible izan sei urte lehenago Kimmo Koskeniemmi irakasle finlandiarrak Two Level Morphology metodologia asmatu izan ez balu. Finlandieraren morfologia lantzeko asmatu zuen Koskeniemmik metodo hori, baina laster frogatu zen euskararako, ingeleserako eta beste hainbat hizkuntzatarako ere balio zuela. Geroago, urteak pasata birritan birprogramatu behar izan dugu gure zuzentzailea Karttunen, Beesley (www.fsmbook.com) eta Mans Hulden (code.google.com/p/foma) ikertzaileek asmatutako teknika berriak aplikatzeko.

Kimmo Koskeniemmi Donostiara ekarri genuen hitzaldi bat ematera 1991ean, eta berriro etorriko da datorren astean antolatu dugun nazioarteko biltzar batera: 10th edition of the International Workshop on Finite State Methods and Natural Language Processing 2012 – FSMNLP 2012.

Hori aprobetxatuz, eta jakinda irailean jubilatuko dela, pertsonalki eskertuko ahal izango diogu omenalditxo batekin morfologia konputazionalean egin zuen ekarpena, hain zuzen, euskararen prozesamendu automatikorako hain garrantzitsua izan zaiguna. ESKERRIK ASKO KIMMO!

SEPLN2008 biltzarreko laburpena Elhuyar-eko Hizkuntza-Zerbitzuen blogean

Elhuyar-eko Hizkuntza-Zerbitzuak sailekoek SEPLN 2008 kongresuaren laburpena egin dute. SEPLNren (Sociedad Española para el Procesamiento del Lenguaje Natural) XXIV. kongresu hori irailean izan da Madrilen.

Atal bakoitzean nabaritu dena aipatzen dute eta Elhuyarrekoek eurek kongresuan aurkeztu duten  AzerHitz proiektuko ikerketaren azken emaitzak ere azaltzen dituzte. AzerHitz  terminologia-erauzketaren alorrean kokatzen da. Corpus konparagarrietatik lexiko elebiduna erauzteko teknikak lantzen dira ikerketa horretan, metodo probabilistikoak bektoreetan eta horien arteko distantzietan oinarritutako metodoekin alderatuz. Metodo probabilistikoek hobekuntza bat ekarri omen diete aurreko lanarekin alderatuta (aurtengo LREC-2008 kongresuan aurkeztu dutena).

SEPLN-2009 Donostian izango da, eta XXV. saioa izango da . Honezgero hasi gara Ixa taldean antolaketarekin. Bai, noski, eurek dioten bezala guk ere espero dugu Elhuyar han izango dela.

Eta ongi etorria beren blogari. Hizkuntza-teknologiako berriak dakartzala eta, gure blogeko esteken artean sartu dugu.