Ingeleserako analizatzaile sintaktiko bat nahi dut. Zein dago eskura?

Batzuetan aplikazio batean edo ikerketa batean ingeleserako analizatzaile sintaktiko bat (parser) erabili nahi dugu hizkuntza-teknologian.Lagun batek galdetu digu zer dagoen eskura gaur egunean hori martxan jartzeko, eta ondoko lista prestatu dugu. Listan hiru multzo bereizten ditugu eskuratzeko erraztasunaren arabera.Beste alde batetik, parser bat aukeratzeko orduan estaldura (zelako esaldiak analizatzekogauza den) eta erantzun-denbora ere kontuan hartu beharko dira.

Guztiz libreak:

* MaltparserGuztiz librea eta ona ere Nivrerena da (maltparser, Javaz dago).Parser estatistikoa da. Edozein hizkuntzatarako egokitu daiteke, noski, sintaktikoki etiketatuta dagoen corpus bat edukiz gero.Ingeleserako entrenatuta dago eta erabiltzeko eta jaisteko aukera ematen dute.Ixa taldeko Koldo Gojenola eta Kepa Bengoetxea ari dira euskararako entrenatzen.

* Stanford ParserEmaitza onak aurkeztu dituzte artikuluetan. Librea ere bai (GNU lizentzia)
* Freeling Espainierakoa aspaldi dago martxan. Ingeleserakoa garapen mailan dabil oraindik, baina azken hilebetetan hobekuntza nabarmena jaso du. Guztiz librea (GNU GPL).

* NLTK Natural Language ToolKitHizkuntzaren prozesaketarako tresna multzo honetan parser sinple bat eskaintzen da. Python lengoaia erabili da programatzeko.

Libreak ikerketetarako, baina erabilera komertzialetarako lizentzia ordaindu behar da:

* RASPEgungo erronka  handiena da ezagutza linguistikoa eta estatistikoakonbinatzea analizatzaile hobeak lortzearren. Ildo horretatik ikertuzJohn Carroll-ek Robust Accurate Statistical Parsing (RASP) sistema sortu du. Oso ondo dabil eta hainbeste ikerkuntza-proiektutan zein aplikaziotan erabiltzen ari da.

* Bikel Oinarria aurretik erabiltzen ziren bi parser estatistiko hauek dira: Collins eta Charniak.Bikel-ek egin zuen berrinplementazioa java lengoaiaz, eta orain Bikelen parser hori erabiltzen da.

Erabil daitezke Internet-en bidez esaldi batzuk analizatzeko, baina ezin dira jaitsi norberaren makinan erabiltzeko:

* Connexor Ezagutza linguistikoan oinarritutakoa.* XeroxEzagutza linguistikoan oinarritutakoa.

Iruzkinak (2)

  • Irakasle eta ikasleetaz aparte blog honen ideia, beste edozeinek kontsultatu eta dudak argitzeko erabilgarria izan dadin sortu dela uste dut. Beraz nik ingeleserako parserren inguruan (stanford, elda, bison, freeling, YACC, CASS, brown) azterketa txikitxo bat egina dut, beraz edonork eskuratu nahi badu .pdf formatuan dago, baina eztakit nola igo daitekeen blog honetara email bat bidali iezadan. Nere ideia nagusia, ingeleserako parserra erabilterraza aurkitzea da. Non testu bat emanda parserra exekutatu eta hitzen kategoriekin gelditu. Gero kategoria hauek aztertu eta batzuk kanpoan utzi.  Ea laguntzerik baduzuenMila esker pd: oso ideia ona, gure ideiak eta eztabaidak denentzat atzigarri uztea

Utzi erantzuna borja(r)i Cancel Reply

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude