Ikastaro osagarria: Hizkuntz ingeniaritzaren arloko aplikazioak (Matrikulazio epea luzatuta)

HAP masterretik ikastaro hau zabaldu dugu publiko orokorrarentzat:

Hizkuntz ingeniaritzaren arloko aplikazioak.
Eskola saioak Hizkuntzaren Azterketa eta Prozesamendua masterreko saioen azpimultzo bat dira, aplikazio praktikoekin lotuta daudenena (itzulpen automatikoa, informazio-bilaketa, hizkuntzaren ikaskuntza…

Matrikulazio-epea/Plazo de matricula:  Urtarrilaren 12tik 23ra/ Del 12 al 23 de enero Urtarrilaren 12tik Otsailaren 7ra / Del 12 de enero al 7 de febrero
Idazkaritza amaia.lorenzo@ehu.es / patxi.salinas@ehu.es
Informazio teknikoa: montse.maritxalar@ehu.es
Loturak:

diptikoa-ikastaro-osagarria-Aplikazioak_1

diptikoa-ikastaro-osagarria-Aplikazioak_2

Kitxua lantzeko, Cusco-ko bisitariak berriro gurean

HinantinPeruko UNSAAC unibertsitateko lankidetzan ari gara orain dela bi urtetik hona. Euskara automatikoki tratatzeko erabili dugun teknologia eta estrategia kitxua hizkuntzari ere aplikatzea da gure helburua.

Zuzentzaile ortografiko bat martxan dago. Analizatzaile morfologikoa eta sintaktiko xume bat ere bai. Hilabete gutxiren barruan kitxuaren datu-base lexikalaren lehen bertsioa eta corpusa kontsultatzeko lehenengo web-aplikazio bat plazaratu nahi ditugu.

Lehengo urtean bi bisitari izan genituen:

Aurten beste bi bisitari ditugu gure artean:

  • IMG_1758Rosemary Jimenez:  testuak automatikoki sailkatzeko programa aurkeztu du gaur bertan, bere master-tesi moduan. Eta bera da corpusa eratu eta kontsultatzeko aplikazioa sortzen ari dena.
  • José Lozano: Kitxua irakasteko sistema bat sortzen ari da Waldir Farfan-ekin. Datorren igandean kitxuazko esaldiak analizatzen dituen sistema aurkeztuko du Polonian, Language Technology Congress (LTC’2013) kongresuan.

2012an Madrileko Kooperaziorako Ministerioko proiektu bat izan genuen, 2013an EHUrekin RUNASIMI proiektua. Juan Cruz irakasleak koordinatzen duen Hinantin taldea jaio da. Orain proiektu berri bat prestatzen ari gara lan hauei 2014an jarraipena emateko.

“Espediente onenarentzako diploma” eman diote Iñigo Lopez Gazpio Ixakideari

UPV/EHUko Informatika Fakultateko 2012-2013 ikasturteko “espediente onenari diploma” eman diote Iñigo Lopez Gazpio Ixakideari. Diploma-banaketa urriaren 18an izan zen Carlos Santamaria Zentroan, Donostian.

Iñigo_sariaIXA taldeak eskaintzen dituen lan poltsen bitartez hasi zen Iñigo taldean. Hizkuntzaren Prozesamenduko teknikak irakaskuntzako domeinuan aplikatu ditu, euskarazko galderen sorkuntza automatikoan ikertzen aritu izan da.

Montse Maritxalar Ixakidearen zuzendaritzapean burutu du bere karrera-amaierako proiektua: Seneko: galderak automatikoki sortuz testuak  lantzeko aukera ematen duen aplikazioa. Eta lan horretan ohorezko matrikula lortu zuen. Horra lan horren  laburpentxo bat:

Seneko testuak lantzeko web bidez eskaintzen den aplikazio didaktikoa da. Oro har, sistemak erabiltzaileengandik jasotako fitxategien gainean automatikoki galderak sortzen ditu eta ariketa gisa eskaini. Honetaz gain, ikaskuntza/irakaskuntza metodologiari dagokionez sarean aurki daitezkeen aplikazioen alternatiba gisa garatu da sistema. Izan ere, fitxategiak eta ariketak partekatzeko metodoak oinarritzat hartuz kooperazioa eta elkarlana ahalbidetzen dituen metodologiari heltzea izan da helburua. Hau guztia gauzatzeko, besteak beste, web aplikazioak galderak automatikoki sortzeko gai den sistema batekin elkar eragiten du.

Egindako lanen dibulgazioari dagokionez, Seneko aplikazioa Bilbon ospatu zen IADAT 2013 kongresuan aurkeztu zuen Iñigok berak. Galderen sorkuntzaren inguruan elkarlanean burututako lanak, berriz, Madrilen egindako SEPLN 2013 kongresuan aurkeztu dira pasa den irailean.

Taldean hasitako ikerketa lerroari jarraipena emateko, IXA taldeak eskaintzen duen Hizkuntzaren Azterketa eta Prozesamendua masterreko ikaslea da egun.

ZORIONAK, Iñigo!

Iñigo_KBP_Irudia

TC3 aldizkarian argitaratu dugu Berbatek proiektuko uzta

TC·_2013_BerbatekTranslation: Computation, Corpora, Cognition (TC3) aldizkari berriak itzulpengintzako lanak argitaratzen ditu modu elektronikoan eta atzipen libreko filosofiarekin.

TC3 aldizkari honek argitaratu berri du gure artikulu bat non ETORTEK deialdiko Berbatek proiektuan sortu genituen demoak deskribatzen ditugun. Proiektuaren garapenean darabilgun filosofia ere azaltzen dugu artikuluan.

Hiru demo hauek prestatu eta aurkeztu genituen prentsaurreko batean:

Artikulua TC3 aldizkariko ale berezi batean atera da:
Vol 3, No 1 (2013): Special Issue on Language Technologies for a Multilingual Europe
Hau da: Europa eleaniztunarentzako Hizkuntza Teknologiak.

Beraz… ondo kokatuta dago gure artikulu hori 🙂

The BerbaTek project for Basque: Promoting a less-resourced language via language technology for translation, content management and learning
Translation: Computation, Corpora, Cognition (TC3) journal. Vol 3, No 1, pp: 119-135 (2013). http://www.t-c3.org/index.php/t-c3/article/view/24/34

Eman eta zabal zazu

 

 

Testu-liburuen “erradiografiak” egiten, hizkuntza teknologia erabiliz (Mikel Larrañagaren tesia)

Abenduan irakurritako tesi-lanean Mikel Larrañaga doktore berriak hizkuntza-teknologiako zenbait tresna erabiltzen ditu testu-liburu baten “erradiografia” egiteko, alegia, liburuan azaltzen den domeinuko ezagutza erauzteko. Lanaren zuzendariak Galan ikerketa taldeko Jon Ander Elorriaga eta Ana Arruarte izan dira, eta haren titulua Semi-Automatic Generation of Learning Domain Modules for Technology Supported Learning Systems.

Galan ikerketa taldeak EHUko Informatika Fakultatean dihardu. Adimen artifizialeko teknikak erabiltzen dituzte irakaskuntza-sistemak eta tresnak sortzeko.

Irudi honetan ikus daitekeenez, testuliburu bat automatikoki aztertzeko, eta bertan irakasten denaren errepresentazio sakona eraikitzeko hainbat urrats egiten ditu tesi horretan sortu den sistemak. Larranaga_Acq_Domain_ModuleSistemak lortzen dituen Domeinu-Modulu eta Ikas-Domeinuaren Ontologia horiek funtsezkoak dira irakaskuntza-sistema automatikoa sortu ahal izateko.   Honela dio Mikel Larrañagak sarreran: “Domeinu-modulua da Teknologian Oinarritutako Hezkuntzarako edozein tresnaren muina, hark adierazten baitu ikasleek ikasi beharreko ezagutza guztia. Tutore Adimendunek, adibidez, osagai hori erabiltzen dute ikasleen ezagutza neurtzeko eta nola jokatu erabakitzeko. Domeinu-modulua ez bada egokia, ikasketa-prozesu eraginkorra burutzea ezinezkoa izango da (Anderson, 1988).
Domeinu-modulua sortzea ez da lan arina, ordea.”

Testuaren prozesaketa automatiko hori egiteko Ixa taldean sortu ditugun tresnak erabili ditu: lematizazioa, analisi morfologikoa, constrain-grammar, UKB algoritmoa… Honako irudian kolore berdez azaltzen diren moduluak hizkuntza-teknologiakoak dira:

Larranaga_arkitektura Ixa taldean pozik gaude gure tresnetarako erabilera berriak asmatzen direnean, eta horrela tesi honetan bezala ikerketa-lerro berriak zabaltzen direnean. Zorionak eta eskerrik asko!

Tesia begiratu nahi duenak erraz lortu dezake dokumentua (PhDThesis.pdf), baita aurkezpeneko gardenkiak ere (TesiAurkezpenaGardenkiak.pdf) Galan taldeko webgunean.

Berbatek proiektua bukatu da arrakastarekin.

Atzo bukaera eman genion Berbatek proiektuari prentsaurreko batekin. Bertan izan ziren Eusko Jaurlaritzaren
ordezkari instituzionalak (Industria Saileko Edorta Larrauri eta HPSko Begoña Muruaga) eta proiektuan parte hartu duten erakundeen ordezkariak ere.
Demo hauek erakutsi ziren:

  • Bikoizketa automatikoa, gaztelaniazko azpitituluetatik abiatuta dokumentalak euskaratzeko. IXA Taldearen Matxin itzultzaile automatikoak itzultzen ditu azpitituluok euskarara.
  • Multimedia-bilatzaile semantiko eta eleaniztuna, web-ean zientzia- eta teknologia-edukiei buruzko bilaketak egiten dituena.
    IXA Taldeak eraikitako zientzia eta teknologiako WNTerm ontologia
    espezializatua du oinarri (zientzia eta teknologiaren alorreko
    kontzeptuak semantikoki erlazionatuta ageri diren sare bat,
    azpiklaseekin, sinonimoekin eta abar), eta laster aterako dugu bertsio osatuago bat.
  • Tutore pertsonala hizkuntza irakasteko. IXA taldearen teknologiaren bidez, automatikoki sortutako gramatika-ariketak
    (aditzak, deklinabidea…) edo ulermen-ariketak (testu batean hutsuneak
    betetzea, hainbat aukera emanda) proposatzen ditu, eta idazketarako laguntzak ematen ditu (aditzen jokabidea, zenbakien
    idazketa, hiztegi-kontsultak…), IXA eta Elhuyarren teknologiaren
    bidez.

Aurkezpenak medioetan harrera ona jaso du gaur:

Proiektukideok oso gustura gelditu gara bai lortutako elkarlanarekin,
bai demoekin eta emaitzekin. Demo horiez gain beste hainbat baliabide eta tresna
garatu ditugu proiektuan, horien berri Berbatek proiektuko webgunean aurkituko duzu.