Zer da hizkuntzalaritza konputazionala? (K.Sarasola, Zientzia Kaiera)

Zientzia Kaiera (2017-01-20): Zer da hizkuntzaren prozesamendua?

UPV/EHUko “Kultura Zientifikoa” Katedrak gure ikertaldeko kidea den Kepa Sarasolarekin bideo bat grabatu du Hizkuntzalaritza Konputazionala zer den azaltzeko.

Hau da bideo albistea: “Hizkuntzalaritza konputazionalarekin lengoaiak errazago erabiltzeko tresnak garatzen ditugu“.

Gaiari buruz gehiago jakin nahi duenarentzat:

CODEFEST, antolatu dugu baliabide urriko hizkuntzetarako teknologia-eskola (udan, 2016-07-04)

Codefest

Codefest uda-eskolak baliabide urriko hizkuntzak biziberritzeko helburu argia dauka. Komunikazio elektronikorako tresna eraginkorrak eskaini eta hauek nola erabili erakutsiz. Astebeteko ikastaro praktikoan, egungo hizkuntza-teknologiak aztertu eta aplikazioak garatzeko aukera izango da; lan-taldeak eratuko dira, hizkuntzalari, software ingeniari eta ikasleak integratuz proiektuak auzolanean garatzeko.

Eskola irekia da, ez da aurre ezagutzarik eskatzen, hizkuntzarekiko pasioa eta haren alde zerbait egiteko gogoa dira ezinbesteko bakarrak.

Codefest uztailaren 4tik 8ra izango da, eta asteburuan Wikipedia editathon batekin borobilduko dugu ekitaldia. Hizkuntza txikietan fokua jarriz, hiriari buruzko artikuluak idatzi eta itzuliko ditugu ahalik eta hizkuntza gehienetara.

Helburuak

  • Baliabide urriko hizkuntzei eguneroko komunikazio elektronikorako tresna
  • eraginkorrak eskaintzea.
  • Europa hizkuntza hauen eremu gisa bistaratzea.
  • Auzolana sustatzea.
  • Herrialde ezberdinetako eragileak harremanetan jartzea.
  • Kode librean oinarritutako hizkuntza ­teknologiak eta baliabideak sustatzea.

IXA taldekoak bertan arituko gara, noski 😉

Informazio gehiago (ingelesez): http://dss2016.eu/images/Codefest.pdf

2015-16ko masterrean izena emateko epea maiatzaren 31ra arte.

HAP_irudi_DiptikoaHAP/LAP masterra
Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing

Ikasi nahi duzu gurekin zer egin daitekeen konputagailuekin hizkuntza aztertzeko eta aplikazioak sortzen? Begiratu Interneteko orri hauetan:

  • Erabiltzen duzu translate.google.com zerbitzuan ematen duen itzuli dokumentu bat aukera?
    Gmail-en itzuli dituzu mezuak euskarara klik bakar batean?
    Zuk esan esaldi bat euskaraz eta ingelesera pasatzen dizu. Probatu duzu telefonoan?
  • Deskargatu duzu Mitzuli aplikazioa telefonora? Honek ere testua, audio eta irudiak itzultzen ditu 50 hizkuntza-bikoeetarako, librea da… eta HAP master honetako ikasle batek sortu du!
  • Euskarara itzultzeko ere bai: Matxin (Elhuyar-Ixa) eta Itzultzailea (Eusko Jaurlaritza)
  • Segapoto-ren laguntzaz bertso bat osatu eta lagunei bidali diezu? Hori ere HAP master honetako ikasleek sortua da!
  • IBM-Watson Telebistako Jeopardy programan galderak erantzuten pertsonei irabazi zien programa.
  • http://start.csail.mit.edu/index.php   Galdetu: `How far is Bilbao from London?’
  • Siri-rekin hitz egin duzu?
  • http://news.google.com/
    Nola egiten dute albiste bilduma hori etengabe automatikoki eguneratuta mantentzeko?
  • Loquendo, Nuance, Aholab: Entzun nola irakurtzen dituen zuk idatzitako testuak.
  • Ikusi duzu testu-prozesadoretako ‘Autosummarize’ edo ‘Autoabstract’ tresna?
  • Zein kantariren alde agertzen da txio gehien Twitter-en?  LaVoz-Alicanteko Unibertsitatea
  • Kartelak 20 hizkuntzatan?? QRak erabilita Albaola museoan posiblea da
  • http://www.yourdictionary.com/languages.html
    900 hiztegi kontsultagarri ingeleserako, 300 espainierarako, 9 euskararako.
  • Bilatu dituzu elurrarrekin (snow) zerikusirik duten hitzak OneLook hiztegi-zerbitzuan?
  • http://www.hiztegia.net: 50 hiztegi euskararako
  • Zein adjektiborekin erabiltzen da “mailegu” hitza? Bilatu Web-corpusen Atarian.
  • Oraindik ez duzu erabiltzen Euskalbar?
  • Badakizu ixa-pipes tresnak Ixa Taldean sortu dugula eta euskara, ingelesa eta espainiera analizatzeko oso baliagarria dela.

2001-02 ikasturtetik gabiltza teknologia hauek zabaltzen master mailan.
Gure ikasle ohiek 2015eko IkerGazte kongresuan 14 artikulu aurkeztu dituzte 🙂

Ikastaro osagarria: Hizkuntz ingeniaritzaren arloko aplikazioak (Matrikulazio epea luzatuta)

HAP masterretik ikastaro hau zabaldu dugu publiko orokorrarentzat:

Hizkuntz ingeniaritzaren arloko aplikazioak.
Eskola saioak Hizkuntzaren Azterketa eta Prozesamendua masterreko saioen azpimultzo bat dira, aplikazio praktikoekin lotuta daudenena (itzulpen automatikoa, informazio-bilaketa, hizkuntzaren ikaskuntza…

Matrikulazio-epea/Plazo de matricula:  Urtarrilaren 12tik 23ra/ Del 12 al 23 de enero Urtarrilaren 12tik Otsailaren 7ra / Del 12 de enero al 7 de febrero
Idazkaritza amaia.lorenzo@ehu.es / patxi.salinas@ehu.es
Informazio teknikoa: montse.maritxalar@ehu.es
Loturak:

diptikoa-ikastaro-osagarria-Aplikazioak_1

diptikoa-ikastaro-osagarria-Aplikazioak_2

Azken egunak gure masterretan eta itzulpen-graduondokoan matrikulatzeko

Ixa Taldeak antolatzen dituen bi master eta graduondoko bat laster hasiko dira, oraindik geratzen dira egun batzuk matrikulatzeko:

  • UEU_IT_graduondokoa_BideoaItzulpengintza eta Teknologia graduondokoa. On-line ematen da itzultzaile profesionaleei eta  itzulpengintzako ikasleei espezializazio aukera eskaintzeko.  EIZIE, Langune, EHU eta UEUren artean antolatua.  Aurten 3. edizioa egingo da. Izena emateko epea irailaren 19an amaitzen da.
    Entzun bideo honetan bi ikasleren iritzia. Aupa itzultzaile hori.

 

 

  • HAP_diptiko_IrudiaHAP/LAP EHUko masterra Euskaraz eta ingelesez emango da, bietara:
    • Hizkuntzaren Azterketa eta Prozesamendua
    • Language Analysis and Processing.

    Informazio zehatzago hemen

 

 

 

 

Hitzaldia: BrainNet (Massimo Poesio, 2014/02/20)

Hizlariak: Massimo Poesio
Essex-eko Unibertsitatea
Eguna: Otsailaren 20an, 2014, osteguna
Ordua: Arratsaldeko 3:00retan
Non
: Informatika Fakutatea, 3.2 gela

 

Izenburua:
BrainNet: burmuin- eta corpus-datuak erabiltzen ezagutza kontzeptuala ikertzeko.
/ BrainNet: Using Brain (and Corpus) Data to Investigate Conceptual Knowledge. Edukia:

Existing electronic repositories of lexical and commonsense knowledge  such as ConceptNet, Cyc, FrameNet, and especially WordNet (Fellbaum, 1998), have had a dramatic and positive impact on Artificial Intelligence (AI) and Human Language Technology (HLT) research, making it possible to carry out the first large-scale  semantic analyses of text and some simple forms of inference. Nowadays there are few semantic interpretation systems that do not use WordNet. However, the widespread application of these resources has also highlighted their limitations. One example of problem often mentioned in the literature is that the taxonomy structure of WordNet, which plays a crucial role e.g., in the calculation of lexical distance metrics, is based in part on scientific taxonomies for specific domains (e.g., animals, plants), in part on linguistic intuitions.

The hypothesis underlying the BrainNet project is that the dramatic advances in our knowledge of concepts arising from interdisciplinary research of the last thirty years pave the way to the development of a lexical resource of a novel type that may overcome the limits just discussed: an electronic dictionary that directly mirrors the mental lexicon, modelled on the basis of recordings of brain activity using contemporary neuroimaging techniques (EEG, MEG and fMRI). The goal of the BrainNet project is to translate cutting-edge theories and methods from cognitive psychology, computational linguistics, and cognitive neuroscience into a new model for lexical-semantic representation and organization.

Lan hau lankide hauekin egin du:  Andrew Anderson, Brian Murphy, Yuqiao Gu, Marco Baroni, eta Yuan Tao

2014/15rako masterrak: HAP/LAP eta LCT Erasmus Mundus

EM LCT masterra

Beste berri oso on bat heldu zaigu udazken honetan IXA taldera: tramite guztiak gaindituta datorren ikasturtean eskaintza bikoitz eta sendoa zabalduko dugu master mailan:

ERNE: EMLCT master honetan beka eskatzeko epea urtarrilaren 12an bukatuko da.

HAP_diptiko_Irudia

HAP/LAP masterra

  • HAP/LAP EHUko masterra Euskaraz eta ingelesez emango da bietara:
    • Hizkuntzaren Azterketa eta Prozesamendua
    • Language Analysis and Processing.

    . Erasmus Munduseko masterrean emango dugun formazioa, kalitate berarekin eta ikasle gehiagorengana zabaltzeko aukera aprobetxatzeko, beste master honetan ere emango dugu paraleloan, kasu honetan Ixa taldea eta EHUren babesarekin.
    EHUn bekak eskatzeko epea lehengo urtean uztailaren 19an bukatu zen

Azken hamar urteko lanaren fruitua da eskaintza hau; hasieran HIZTEK masterra izan zen (2002-2006) eta azken urteetan HAP masterra (2006-2013). Gutxienez laurogei aditu sortu ditugu, eta hortik berrogei doktorego-tesi. Hizkuntza teknologian urrats garrantzitsuak egin ditugu Ixa Taldean. Bide horretan euskaraz ematen dugun formazioari tinko eutsi nahi diogu. Eta Erasmus Mundus babesaren pean ingelesez ere mundu mailan zabaldu nahi dugu ondo egiten dakiguna, master mailako ikasleak hezitzen. Mesedez, zabaldu mezu hau Hizkuntza-Teknologian ikasi nahiko luketen informatikariei edo hizkuntzariei:

Mintegia: HPSG gramatikak (2013/07/15).

Hizlariak: Montse Marimón eta Lluis Padró
Izenburua: HPSG gramatikak
Eguna: Uztailaren 15a, 2013, astelehena
Ordua: 10:00-13:00
Non
: Informatika Fakutatea, 3.2 gela

 Edukiak:

Erreferentziak:

 

Hizkuntzaren Azterketa eta Prozesamendua. Master ofiziala 2012-2013

2001. urtetik gabiltza hizkuntzalariak eta informatikariak formatzen hizkuntzaren teknologian lan egin eta iker dezaten. 70 profesional edota ikerlari trebatu ditugu orain arte.
Hizkuntzaren azterketa eta prozesamendua Master ofiziala berriro jartzen dugu martxan datorren ikasturterako.

Zer da Hizkuntza-Teknologia? Begiratu, begiratu Interneteko orri hauetan:

Baina… nola dabiltza aplikazio horiek?
Informatikaria edo ingeniaria bazara… Zein dira oinarrizko tresna informatikoak
hor barruan? Nola integratu daitezke aplikazio hauek beste aplikaziotan edo webean?

Filologo edo hizkuntzalaria bazara… Zelan erabiltzen da ezagutza linguistikoa hor barruan?
Lexikoa, gramatika, adierak? Zelan egiten dira automatikoki aplikazio horietan beharrezkoak diren analisi morfologikoa, sintaktikoa eta semantikoa?

Eusko Jaurlaritzak 2002. urtetik Infoingeniaritza linguistikoa aukeratu du bere ikerkuntza-lerro estrategikoren artean. Lerro honetan ikerketa eta garapena landuko duten ikertzaile berriak behar dira (informatikariak eta hizkuntzalariak). Arloko enpresek profesionalak behar dituzte.

Hizkuntza Teknologiaren mundu honetan sartu nahi duzu gure eskutik?
Jo guregana informazio zehatzago lortzeko: Hizkuntzaren azterketa eta prozesamendua