Informatika Fakultateko HP hautazko ikasgaia. Lan praktiko batzuk (2018)

Informatika Fakultateko Hizkuntzaren Prozesamendua ikasgaian bi lan praktiko egiten ditu ikasleak.Lehenengoa Wikipediarekin eta bigarrena aplikazio praktiko bat da.

Lehenengo praktikan Hizkuntza-Teknologiako aplikazio mota bat aztertzen du:

  • Zeintzuk dira produktu erabilienak gaur egun?  Zein hizkuntzatarako? Zein da aplikazio horien oinarri informatikoa? Adibidez: Iritzi-meatzaritza, Informazioa bilatzea, informazioa erauztea, itzulpengintza automatikoa, hizketa bidezko interfazeak testuen ediziorako laguntzak, galdera-erantzun sistemak. testuen laburpen automatikoa… (ikus Hizkuntzaren_prozesamendua Wikipedian).

Chatbot artikulua Euskal Wikipedian

Aurten lehen lan hori Wikipediaren bitartez egin dugu.  Guztira 17 artikulu berri, 206.267 karaktere eta 41 irudi gehitu genituen. Apiriletik hona artikulu horiek 2,470 aldiz kontsultatu dira 🙂
Sortu ditugun artikulu berriak:
Chatbot, Google Assistant, Siri, Microsoft Cortana, Sentimenduen analisi, Word embedding, Word2vec, IXA pipes, Moore makina, Mealy makina, WordNet, Euskal WordNet, Itzulpen automatiko neuronal, Google Translate, Tf–idfKleene izar, eta Neurolinguistika.
Partehartzaileak:
Aitidina, Ainhoa54, Aodriozola023, Satantxiki, Jsautua001, Ehernandez035, XLekunberri, Aritzh, Aelu013, Mssebastian, Jcampandegui, Ilanda020, Atriguero, Eneks, Oaguinagalde002, eta Fofrito.

Ikus albiste hau Fakultatean: Wikipediako Hezkuntza proiektua, gure fakultatearen ekarpena

Bigarren praktikan ikasleak bere aplikazio xume bat sortzen du. Aplikazio tipiko bat Twitterreko hainbat eta hainbat txio bildu eta horiek aztertzea izan daiteke. Txio guzti horien testuak analizatuta aztertzen dugu ea gehiago diren iritzi negatibodunak edo positibodunak.

Baina Twitter izan gabe ere beste iturri batzuk edo beste aplikazio batzuk azter daitezke, adibidez: Mikel San Sebastián ikasleak historiako 8 liburu aztertu ditu IXA pipes tresnarekin eta webgune bat sortu du (https://hpeia.000webhostapp.com/Inicio.php) liburu horietan azaltzen diren pertsonak, erakundeak eta tokiak zein urtetan aipatu izan diren erakusteko.

Liburu guzti hauek landu ditu:
Intervención en Navarra (Koldo San Sebastián), La historiografía modernista en la universitat de Valencia (Manuel Ardit), La música instrumental en el Renacimiento (Jose Ignacio Suarez Garcia), Historia de una historia (Ma. José García Quintana), Inventario general de Manuscritos de la biblioteca nacional. Un legado que perdura (John eta Mark Bieter Garmendia) , Las devociones marianas españolas en el Brasil colonial (Carlos Javier Castro), Revista de Historia Moderna No 33, Revista de Historia Moderna No 28, La colonia de Filipinas (Gemma Quincoces Herreros)

Ikasleek egin dituzten beste lan batzuk:

  • Aitzol Elu, Kantuak bilatu, hitzen esanahia erabilita (semantika distribuzionala).
  • Iñaki Landa: Aplikazio baten lokalizazioa Androiden. Nola euskaratu aplikazio bat?
  • Eneko Ortiz de Zarate. Semantika Distribuzionala: Hizkuntzen arteko antzekotasun lexikala irudikatzea.
  • Unai Cantero eta Julen Pérez-Cortés. Twitter kontu bateko txioen polaritatea aztertzea eta bisualizatzea.
  • Oscar Aguinagalde eta Josu Campandegui. Matxin itzultzailearen APIa erabiltzea Wikimedia Commons-eko argazkien oinak (captions) itzultzeko.
  • Ainhoa Pato eta Alexander Triguero. Dokumentu-sailkapena.
  • Xabier Lekunberri eta Javier Sautua: PythonUEU liburua. 12. Testuak lantzen  HPko ariketak
  • Aritz Lopez eta Elena Hernandez: Euskal Wikipediaren testuzko bertsio batetik abiatuta polaritate negatiboa duten artikuluak detektatzea.
  • Gorka Urbizu. Korreferentziaren ebazpenerako embeddingen konparaketa (dimentsioak eta stemmerra)
  • Ane Odriozola. Zer ikasiko dut unibertsitatean? Aholkularitza-zerbitzu batean egin ziren galdera eta erantzun ugari ditugu errepositorio batean. Galdera berri bat emanda jakin nahi dugu zein den errepositorioko galdera antzekoena, eta eman zitzaion erantzuna.

Informatika Fakultateko HP hautazko ikasgaia. Lan praktiko batzuk

Hizkuntzaren Prozesamendua ikasgaian bi lan praktiko egiten ditu ikasleak. Lehenengo praktikan Hizkuntza-Teknologiako aplikazio mota bat aztertzen du:

  • Zeintzuk dira produktu erabilienak gaur egun? Espezifikazioa: datuak eta emaitzak? Zein hizkuntzatarako? Zein da aplikazio horien oinarri informatikoa?
  • Hauek dira aplikazio adibide batzuk: Iritzi-meatzaritza, Informazioa bilatzea, informazioa erauztea, itzulpengintza automatikoa, hizketa bidezko interfazeak testuen ediziorako laguntzak, galdera-erantzun sistemak. testuen laburpen automatikoa… (ikus Hizkuntzaren_prozesamendua Wikipedian).

Bigarren praktikan ikasleak bere aplikazio xume bat sortzen du. Aplikazio tipiko bat Twitterreko hainbat txio bildu eta horiek aztertzea izan daiteke. Txio horietako testua analizatuta, jakin nahi dugu ea gehiago diren iritzi negatibodunak eta positibodunak. Baina Twitter izan gabe ere beste iturri batzuk edo beste aplikazio batzuk azter daiteke, adibidez:

Interesa baduzu, ikasle hori, gauza ederrak egin daitezke ikasgai honetan 😉


Bada beste hautazko ikasgai bat antzekoa dena: Hizkuntzalaritza aplikatua. Biek zerikusirik dute hizkuntzarekin. baina Hizkuntzalaritza aplikatua ikasgaian hizkuntza lantzen da gehiago. Hizkuntza lantzeko dauden informatika-aplikazioak ere begiratzen dira, baina erabiltzailearen ikuspuntutik gehiago, euskaraz hobeto idazteko trebetasuna lortzeko asmoz, ez programa horiek barrutik nola eginda dauden ulertzeko. Ikasgai biak diferenteak dira eta elkarren osagarriak izan daitezke.

Zer da hizkuntzalaritza konputazionala? (K.Sarasola, Zientzia Kaiera)

Zientzia Kaiera (2017-01-20): Zer da hizkuntzaren prozesamendua?

UPV/EHUko “Kultura Zientifikoa” Katedrak gure ikertaldeko kidea den Kepa Sarasolarekin bideo bat grabatu du Hizkuntzalaritza Konputazionala zer den azaltzeko.

Hau da bideo albistea: “Hizkuntzalaritza konputazionalarekin lengoaiak errazago erabiltzeko tresnak garatzen ditugu“.

Gaiari buruz gehiago jakin nahi duenarentzat:

CODEFEST, antolatu dugu baliabide urriko hizkuntzetarako teknologia-eskola (udan, 2016-07-04)

Codefest

Codefest uda-eskolak baliabide urriko hizkuntzak biziberritzeko helburu argia dauka. Komunikazio elektronikorako tresna eraginkorrak eskaini eta hauek nola erabili erakutsiz. Astebeteko ikastaro praktikoan, egungo hizkuntza-teknologiak aztertu eta aplikazioak garatzeko aukera izango da; lan-taldeak eratuko dira, hizkuntzalari, software ingeniari eta ikasleak integratuz proiektuak auzolanean garatzeko.

Eskola irekia da, ez da aurre ezagutzarik eskatzen, hizkuntzarekiko pasioa eta haren alde zerbait egiteko gogoa dira ezinbesteko bakarrak.

Codefest uztailaren 4tik 8ra izango da, eta asteburuan Wikipedia editathon batekin borobilduko dugu ekitaldia. Hizkuntza txikietan fokua jarriz, hiriari buruzko artikuluak idatzi eta itzuliko ditugu ahalik eta hizkuntza gehienetara.

Helburuak

  • Baliabide urriko hizkuntzei eguneroko komunikazio elektronikorako tresna
  • eraginkorrak eskaintzea.
  • Europa hizkuntza hauen eremu gisa bistaratzea.
  • Auzolana sustatzea.
  • Herrialde ezberdinetako eragileak harremanetan jartzea.
  • Kode librean oinarritutako hizkuntza ­teknologiak eta baliabideak sustatzea.

IXA taldekoak bertan arituko gara, noski 😉

Informazio gehiago (ingelesez): http://dss2016.eu/images/Codefest.pdf

2015-16ko masterrean izena emateko epea maiatzaren 31ra arte.

HAP_irudi_DiptikoaHAP/LAP masterra
Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing

Ikasi nahi duzu gurekin zer egin daitekeen konputagailuekin hizkuntza aztertzeko eta aplikazioak sortzen? Begiratu Interneteko orri hauetan:

  • Erabiltzen duzu translate.google.com zerbitzuan ematen duen itzuli dokumentu bat aukera?
    Gmail-en itzuli dituzu mezuak euskarara klik bakar batean?
    Zuk esan esaldi bat euskaraz eta ingelesera pasatzen dizu. Probatu duzu telefonoan?
  • Deskargatu duzu Mitzuli aplikazioa telefonora? Honek ere testua, audio eta irudiak itzultzen ditu 50 hizkuntza-bikoeetarako, librea da… eta HAP master honetako ikasle batek sortu du!
  • Euskarara itzultzeko ere bai: Matxin (Elhuyar-Ixa) eta Itzultzailea (Eusko Jaurlaritza)
  • Segapoto-ren laguntzaz bertso bat osatu eta lagunei bidali diezu? Hori ere HAP master honetako ikasleek sortua da!
  • IBM-Watson Telebistako Jeopardy programan galderak erantzuten pertsonei irabazi zien programa.
  • http://start.csail.mit.edu/index.php   Galdetu: `How far is Bilbao from London?’
  • Siri-rekin hitz egin duzu?
  • http://news.google.com/
    Nola egiten dute albiste bilduma hori etengabe automatikoki eguneratuta mantentzeko?
  • Loquendo, Nuance, Aholab: Entzun nola irakurtzen dituen zuk idatzitako testuak.
  • Ikusi duzu testu-prozesadoretako ‘Autosummarize’ edo ‘Autoabstract’ tresna?
  • Zein kantariren alde agertzen da txio gehien Twitter-en?  LaVoz-Alicanteko Unibertsitatea
  • Kartelak 20 hizkuntzatan?? QRak erabilita Albaola museoan posiblea da
  • http://www.yourdictionary.com/languages.html
    900 hiztegi kontsultagarri ingeleserako, 300 espainierarako, 9 euskararako.
  • Bilatu dituzu elurrarrekin (snow) zerikusirik duten hitzak OneLook hiztegi-zerbitzuan?
  • http://www.hiztegia.net: 50 hiztegi euskararako
  • Zein adjektiborekin erabiltzen da “mailegu” hitza? Bilatu Web-corpusen Atarian.
  • Oraindik ez duzu erabiltzen Euskalbar?
  • Badakizu ixa-pipes tresnak Ixa Taldean sortu dugula eta euskara, ingelesa eta espainiera analizatzeko oso baliagarria dela.

2001-02 ikasturtetik gabiltza teknologia hauek zabaltzen master mailan.
Gure ikasle ohiek 2015eko IkerGazte kongresuan 14 artikulu aurkeztu dituzte 🙂

Ikastaro osagarria: Hizkuntz ingeniaritzaren arloko aplikazioak (Matrikulazio epea luzatuta)

HAP masterretik ikastaro hau zabaldu dugu publiko orokorrarentzat:

Hizkuntz ingeniaritzaren arloko aplikazioak.
Eskola saioak Hizkuntzaren Azterketa eta Prozesamendua masterreko saioen azpimultzo bat dira, aplikazio praktikoekin lotuta daudenena (itzulpen automatikoa, informazio-bilaketa, hizkuntzaren ikaskuntza…

Matrikulazio-epea/Plazo de matricula:  Urtarrilaren 12tik 23ra/ Del 12 al 23 de enero Urtarrilaren 12tik Otsailaren 7ra / Del 12 de enero al 7 de febrero
Idazkaritza amaia.lorenzo@ehu.es / patxi.salinas@ehu.es
Informazio teknikoa: montse.maritxalar@ehu.es
Loturak:

diptikoa-ikastaro-osagarria-Aplikazioak_1

diptikoa-ikastaro-osagarria-Aplikazioak_2

Azken egunak gure masterretan eta itzulpen-graduondokoan matrikulatzeko

Ixa Taldeak antolatzen dituen bi master eta graduondoko bat laster hasiko dira, oraindik geratzen dira egun batzuk matrikulatzeko:

  • UEU_IT_graduondokoa_BideoaItzulpengintza eta Teknologia graduondokoa. On-line ematen da itzultzaile profesionaleei eta  itzulpengintzako ikasleei espezializazio aukera eskaintzeko.  EIZIE, Langune, EHU eta UEUren artean antolatua.  Aurten 3. edizioa egingo da. Izena emateko epea irailaren 19an amaitzen da.
    Entzun bideo honetan bi ikasleren iritzia. Aupa itzultzaile hori.

 

 

  • HAP_diptiko_IrudiaHAP/LAP EHUko masterra Euskaraz eta ingelesez emango da, bietara:
    • Hizkuntzaren Azterketa eta Prozesamendua
    • Language Analysis and Processing.

    Informazio zehatzago hemen

 

 

 

 

Hitzaldia: BrainNet (Massimo Poesio, 2014/02/20)

Hizlariak: Massimo Poesio
Essex-eko Unibertsitatea
Eguna: Otsailaren 20an, 2014, osteguna
Ordua: Arratsaldeko 3:00retan
Non
: Informatika Fakutatea, 3.2 gela

 

Izenburua:
BrainNet: burmuin- eta corpus-datuak erabiltzen ezagutza kontzeptuala ikertzeko.
/ BrainNet: Using Brain (and Corpus) Data to Investigate Conceptual Knowledge. Edukia:

Existing electronic repositories of lexical and commonsense knowledge  such as ConceptNet, Cyc, FrameNet, and especially WordNet (Fellbaum, 1998), have had a dramatic and positive impact on Artificial Intelligence (AI) and Human Language Technology (HLT) research, making it possible to carry out the first large-scale  semantic analyses of text and some simple forms of inference. Nowadays there are few semantic interpretation systems that do not use WordNet. However, the widespread application of these resources has also highlighted their limitations. One example of problem often mentioned in the literature is that the taxonomy structure of WordNet, which plays a crucial role e.g., in the calculation of lexical distance metrics, is based in part on scientific taxonomies for specific domains (e.g., animals, plants), in part on linguistic intuitions.

The hypothesis underlying the BrainNet project is that the dramatic advances in our knowledge of concepts arising from interdisciplinary research of the last thirty years pave the way to the development of a lexical resource of a novel type that may overcome the limits just discussed: an electronic dictionary that directly mirrors the mental lexicon, modelled on the basis of recordings of brain activity using contemporary neuroimaging techniques (EEG, MEG and fMRI). The goal of the BrainNet project is to translate cutting-edge theories and methods from cognitive psychology, computational linguistics, and cognitive neuroscience into a new model for lexical-semantic representation and organization.

Lan hau lankide hauekin egin du:  Andrew Anderson, Brian Murphy, Yuqiao Gu, Marco Baroni, eta Yuan Tao

2014/15rako masterrak: HAP/LAP eta LCT Erasmus Mundus

EM LCT masterra

Beste berri oso on bat heldu zaigu udazken honetan IXA taldera: tramite guztiak gaindituta datorren ikasturtean eskaintza bikoitz eta sendoa zabalduko dugu master mailan:

ERNE: EMLCT master honetan beka eskatzeko epea urtarrilaren 12an bukatuko da.

HAP_diptiko_Irudia

HAP/LAP masterra

  • HAP/LAP EHUko masterra Euskaraz eta ingelesez emango da bietara:
    • Hizkuntzaren Azterketa eta Prozesamendua
    • Language Analysis and Processing.

    . Erasmus Munduseko masterrean emango dugun formazioa, kalitate berarekin eta ikasle gehiagorengana zabaltzeko aukera aprobetxatzeko, beste master honetan ere emango dugu paraleloan, kasu honetan Ixa taldea eta EHUren babesarekin.
    EHUn bekak eskatzeko epea lehengo urtean uztailaren 19an bukatu zen

Azken hamar urteko lanaren fruitua da eskaintza hau; hasieran HIZTEK masterra izan zen (2002-2006) eta azken urteetan HAP masterra (2006-2013). Gutxienez laurogei aditu sortu ditugu, eta hortik berrogei doktorego-tesi. Hizkuntza teknologian urrats garrantzitsuak egin ditugu Ixa Taldean. Bide horretan euskaraz ematen dugun formazioari tinko eutsi nahi diogu. Eta Erasmus Mundus babesaren pean ingelesez ere mundu mailan zabaldu nahi dugu ondo egiten dakiguna, master mailako ikasleak hezitzen. Mesedez, zabaldu mezu hau Hizkuntza-Teknologian ikasi nahiko luketen informatikariei edo hizkuntzariei:

Mintegia: HPSG gramatikak (2013/07/15).

Hizlariak: Montse Marimón eta Lluis Padró
Izenburua: HPSG gramatikak
Eguna: Uztailaren 15a, 2013, astelehena
Ordua: 10:00-13:00
Non
: Informatika Fakutatea, 3.2 gela

 Edukiak:

Erreferentziak: