Informatika Fakultateko HP hautazko ikasgaia. Lan praktiko batzuk (2018)

Informatika Fakultateko Hizkuntzaren Prozesamendua ikasgaian bi lan praktiko egiten ditu ikasleak.Lehenengoa Wikipediarekin eta bigarrena aplikazio praktiko bat da.

Lehenengo praktikan Hizkuntza-Teknologiako aplikazio mota bat aztertzen du:

  • Zeintzuk dira produktu erabilienak gaur egun?  Zein hizkuntzatarako? Zein da aplikazio horien oinarri informatikoa? Adibidez: Iritzi-meatzaritza, Informazioa bilatzea, informazioa erauztea, itzulpengintza automatikoa, hizketa bidezko interfazeak testuen ediziorako laguntzak, galdera-erantzun sistemak. testuen laburpen automatikoa… (ikus Hizkuntzaren_prozesamendua Wikipedian).

Chatbot artikulua Euskal Wikipedian

Aurten lehen lan hori Wikipediaren bitartez egin dugu.  Guztira 17 artikulu berri, 206.267 karaktere eta 41 irudi gehitu genituen. Apiriletik hona artikulu horiek 2,470 aldiz kontsultatu dira : – )
Sortu ditugun artikulu berriak:
Chatbot, Google Assistant, Siri, Microsoft Cortana, Sentimenduen analisi, Word embedding, Word2vec, IXA pipes, Moore makina, Mealy makina, WordNet, Euskal WordNet, Itzulpen automatiko neuronal, Google Translate, Tf–idfKleene izar, eta Neurolinguistika.
Partehartzaileak:
Aitidina, Ainhoa54, Aodriozola023, Satantxiki, Jsautua001, Ehernandez035, XLekunberri, Aritzh, Aelu013, Mssebastian, Jcampandegui, Ilanda020, Atriguero, Eneks, Oaguinagalde002, eta Fofrito.

Ikus albiste hau Fakultatean: Wikipediako Hezkuntza proiektua, gure fakultatearen ekarpena

Bigarren praktikan ikasleak bere aplikazio xume bat sortzen du. Aplikazio tipiko bat Twitterreko hainbat eta hainbat txio bildu eta horiek aztertzea izan daiteke. Txio guzti horien testuak analizatuta aztertzen dugu ea gehiago diren iritzi negatibodunak edo positibodunak.

Baina Twitter izan gabe ere beste iturri batzuk edo beste aplikazio batzuk azter daitezke, adibidez: Mikel San Sebastián ikasleak historiako 8 liburu aztertu ditu IXA pipes tresnarekin eta webgune bat sortu du (https://hpeia.000webhostapp.com/Inicio.php) liburu horietan azaltzen diren pertsonak, erakundeak eta tokiak zein urtetan aipatu izan diren erakusteko.

Liburu guzti hauek landu ditu:
Intervención en Navarra (Koldo San Sebastián), La historiografía modernista en la universitat de Valencia (Manuel Ardit), La música instrumental en el Renacimiento (Jose Ignacio Suarez Garcia), Historia de una historia (Ma. José García Quintana), Inventario general de Manuscritos de la biblioteca nacional. Un legado que perdura (John eta Mark Bieter Garmendia) , Las devociones marianas españolas en el Brasil colonial (Carlos Javier Castro), Revista de Historia Moderna No 33, Revista de Historia Moderna No 28, La colonia de Filipinas (Gemma Quincoces Herreros)

Ikasleek egin dituzten beste lan batzuk:

  • Aitzol Elu, Kantuak bilatu, hitzen esanahia erabilita (semantika distribuzionala).
  • Iñaki Landa: Aplikazio baten lokalizazioa Androiden. Nola euskaratu aplikazio bat?
  • Eneko Ortiz de Zarate. Semantika Distribuzionala: Hizkuntzen arteko antzekotasun lexikala irudikatzea.
  • Unai Cantero eta Julen Pérez-Cortés. Twitter kontu bateko txioen polaritatea aztertzea eta bisualizatzea.
  • Oscar Aguinagalde eta Josu Campandegui. Matxin itzultzailearen APIa erabiltzea Wikimedia Commons-eko argazkien oinak (captions) itzultzeko.
  • Ainhoa Pato eta Alexander Triguero. Dokumentu-sailkapena.
  • Xabier Lekunberri eta Javier Sautua: PythonUEU liburua. 12. Testuak lantzen  HPko ariketak
  • Aritz Lopez eta Elena Hernandez: Euskal Wikipediaren testuzko bertsio batetik abiatuta polaritate negatiboa duten artikuluak detektatzea.
  • Gorka Urbizu. Korreferentziaren ebazpenerako embeddingen konparaketa (dimentsioak eta stemmerra)
  • Ane Odriozola. Zer ikasiko dut unibertsitatean? Aholkularitza-zerbitzu batean egin ziren galdera eta erantzun ugari ditugu errepositorio batean. Galdera berri bat emanda jakin nahi dugu zein den errepositorioko galdera antzekoena, eta eman zitzaion erantzuna.

Aro digital honetan nola dago euskara? (META-NET liburua)

Europa mailan Hizkuntzaren Prozesamenduan koordinazio-lanak egiten dituen META-NET sareak 30 “liburu zuri” argitaratu ditu alor honetan Europako hizkuntzen egoera aztertzearren. Horietako bat euskararena da, orain dela gutxi argitaratu dena:

“Euskara Aro Digitalean” liburua

Inmaculada Hernáez, Eva Navas, Igor Odriozola, Kepa Sarasola, Arantza Diaz de Ilarraza, Igor Leturia, Araceli Diaz de Lezana, Beñat Oihartzabal, Jasone Salaberria  2012
The Basque language in the digital age / Euskara aro digitalean
METANET White Paper Series.
Georg Rehm, Hans Uszkoreit (editors). Springer.

METANET_White_Papers_Basque.pdf

Liburuaren egile eta koordinatzaile nagusia izan den Inma Hernaezek laburpentxo hau egin du:

Oro har, META-NETen ikerketa-lanak ohartarazten du Europako hizkuntza gehienak digitalki iraungitzeko arriskuan daudela, aztertutako 30 hizkuntzetako 21ek duten babes digitala “hutsa” edo, kasurik onenean, “eskasa” baita.

Azterketak agerian uzten du hizkuntza batek ere ez duela “babes bikaina”; ingelesa baino ez da jo “babes ona” duen hizkuntzatzat, eta haren atzetik daude alemana, espainiera, frantsesa, italiera eta nederlandera, “babes ertainaz”. Bestalde euskarak, katalanak eta galegoak, bulgariera, greziera, hungariera eta polonierarekin batera, “babes zatikatua” dute, eta, hortaz arrisku handiko hizkuntzen multzoan ezarri dira horiek ere.

META-NETen arabera, ezinbestekoa da Europan ekimen koordinatu eta eskala handiko bat sortzea, dauden hutsuneak beteko baditugu eta teknologia ahalik eta hizkuntza gehienetara transferituko badugu. Izan ere, biztanleko karga finantzarioa oso handia da hizkuntza-komunitate txikienentzat; hizkuntzen artean teknologiak trukatu beharra dago; nabarmena da baliabideen, tresnen eta zerbitzuen elkarreragingarritasun falta; eta bistakoak dira hizkuntza-mugak eta muga politikoak maiz bat ez etortzearen ondorioak.