Ikastaroa neguan: Ikasketa sakona hizkuntzaren prozesamendurako (4.5 kreditu ECTS)

Ondoko ikastaro osagarriari buruzko informazioa helarazten dizuegu IXA taldetik.
Ikastaroa ingelesez izango da. Masterreko modulua da. Gustatzen bazaizu hurrengo urtean master osoa egin 😉

GAIA: Ikasketa sakona hizkuntzaren prozesamendurako (4.5 kreditu ECTS)
//
Deep Learning for Natural Language Processing

Hitzen esanahiak grafikoki. Google saria Eneko Agirreri.

Hizkuntza: Ingelesa
Ikastaroaren datak:
12 saio dira; otsailaren 5-8, 19-22, 26-28 eta martxoaren 1a
Ordutegia:
17:30 – 20:00
Matrikulazio-epea:  abenduaren 24ra arte.
Ikasle kopurua: 20 (kurrikulumaren arabera aukeratuko dira)
Izena ematea: bidali CVa amaia.lorenzo@ehu.eus and e.agirre@ehu.eus
Baldintzak:
eskarmentua oinarrizko programazioarekin, informatikako gradua eta Python ezagutzea. Aljebra edo kalkuluaren oinarrizko kontzeptuak ere beharrezkoak dira.
Prezioa: 180€
Irakasleak:Eneko Agirre eta Oier Lopez de Lacalle

[EN]
https://ixa.eus/ikastaroa_deep_learning
Deep Learning for Natural Language Processing

    Course open to anyone, see details and pre-requisite information below.

Irudia: Roelof Pieters

    Deep Learning neural network models have been successfully applied to natural language processing, and are now changing radically how we interact with machines (Siri, Amazon Alexa, Google Home, Skype translator, Google Translate, or the Google search engine). These models are able to infer a continuous representation for words and sentences, instead of using hand-engineered features as in other machine learning approaches. The seminar will introduce the main deep learning models used in natural language processing, allowing the attendees to gain hands-on understanding and implementation of them in Tensorflow.

Edukiak

Introduction to machine learning and NLP with Tensorflow, Deep learning, Word embeddings, Language modeling and recurrent neural networks, Convolutional neural networks, Attention mechanisms

Saria: Bagera elkartearen “bidelagunak” gara

25 urte bete ditu Bagera elkarteak. Donostiako euskaltzaleen elkartea den horrek 25 pertsona edo talde aukeratu ditu 25 urte horietan Donostian euskara sustatzen bidelagun izan dituelako. Eta Ixa Taldea izan da aitortza jaso duen 25 bidelagun horietako bat.

Zelako maila dagoen 25 aukeratu horien artean: Txillardegi, Mikel Zalbide, Arantza Urretabizkaia, Mintzalaguna, Donostiako euskaltegiak, Donostiako euskara taldeak, Dani Goñi, Piratak…

Ohore handia da bidelagun horiekin guztiekin azaltzea.
Eskerrik asko Bagera, eta urte askotarako!
Lanean jarraituko dugu bidelagunekin 😉

Bagera-ren oroigarriak indarra ematen digu. Jarraituko dugu proiektu eta langile gehiago prestatzen.

Ixa taldearen oroigarria Arantza Diaz de Ilarraza-k jaso zuen (Arg: Estitxu Zabala, Hirutxulo)

Mintegia: PROSAMED, gaztelaniazko txosten medikoen azterketa (K. Gojenola, 2017-11-21)

Noiz: asteartean, azaroak 21, 15:30ean. bai oraingoan 15:30ean
Non: 3.2 gelan.
Hizlaria: Koldo Gojenola
Izenburua: 

Lengoaia naturalaren prozesamendua eta medikuntza:
gaztelaniazko txosten medikoen azterketa (PROSAMED proiektua)

Laburpena:
Azken urteotan txosten mediko elektronikoak orokortu egin dira osasun-sistema guztietan. Honek testu horiek prozesatzeko aukera asko irekitzen ditu.
Prosamed proiektuan Osakidetzarekin egiten ari garen lanak aurkeztuko dira mintegi honetan, horien artean:
  • Entitate medikoen ezagutza:
    • gaixotasunak: LEUCEMIA, paniculitis, síndrome de lissi tumoral, STENOTROPHOMONAS MALTOPHILIA, …
    • botikak: Omeprazol, posaconazol, levofloxacino, …
    • gorputz-atalak: pulmonar, pretibial, cutáneas, …
    • kalifikatzaileak: aguda, Fenotipo Mixto T/mieloide, …
  • Entitate medikoen arteko erlazioak: gaixotasuna eta gorputz-atala, gaixotasuna-kalifikatzailea kalifikadorea , gaixotasuna-botika (aurkako efektua)
  • Txostenen lotura medikuntzako datu-base eta ontologiekin:
    • SNOMED Clinical Terms: 311.000 kontzeptu.
    • ICD-10 (International Classification of Diseases): 64.000 entitate baino gehiago.
    • Dokumentuak eta entitateak ontologia horiekin lotu.

Ixa Taldearen 4 proiektu Senez aldizkarian (Besterena nuen neuregana)

Euskal Itzultzaile, Zuzentzaile eta Interpreteen Elkartearen Senez aldizkariko 48. alean Ixa Taldeko lau artikulu argitaratu ditugu Besterena nuen neuregana atal berezian. Hemen daude artikulu horiek ikusteko estekak, baita EIZIEko Karlos del Olmok egin duen sarrera ere:

Zer ikertzen da Informatika Fakultatean? Aurkezpena ikasleei

Bihar goizean Informatika Fakultateko ikerketa-taldeok aurkezpen bat egingo diegu ikasleei.

Noiz: Asteartean, urriak 10
Ordua: 10:05-11:10
Non: Ada-Lovelace aretoan
Norentzat: Batez ere 4. eta 3. mailako ikasleentzat.
Helburua: Fakultatean egiten dugun ikerketa azaltzea, baita ikasleek gurekin lan egiteko dituzten aukerak ere: gradu/master amaierako lanak, kolaborazioak, eta abar.

 

Guztira 15 talde gara! Beraz, aurkezpenak labur joango  dira. 3 minutuko aurkezpena eta minutu bat galderetarako. Ixa taldearena 3. izango da
Kuxkuxeroentzat: ikertaldeen posterrak eta Fakultateko ikertaldeen webgunea

SEPLN2017 biltzarreko artikulu onenaren saria

Begoña Altuna, María Jesús Aranzabe, eta Arantza Diaz de Ilarraza ixakideek artikulu onenaren saria jaso dute kongresuan!
ZORIONAK!!!

Artikuluaren izenburua hau da: ‘EusHeidelTime: Time Expression Extraction and Normalisation for Basque

Euskarazko testuetatik denbora-adierazpenak nola antzeman eta nola normalizatu aztertzen dute artikuluan. Nola antzeman testu batean denbora-lerroko une konkretu bat aipatzen dela? Nola antzeman denbora tarte bat dela? Eta noiz? Testuan deskribatzen diren ekintzak noiz gertatu izan diren ondo ulertzeko behar beharrezko dira ikerketa hauek.

Bada sistema bat ingeleserako eta beste hizkuntzetarako erabiltzen dena HeidelTime. Ikerketa honetan euskarari egokitu dute sistema hori. Morfologia aberatsa duen hizkuntza baterako ere baliagarria izan daitekeela frogatu dute.

 

Hizkuntzaren Prozesamendua ikasgaiko praktika ikusgarri bat

Informatika Ingeniaritzako Hizkuntzaren Prozesamendua ikasgaian (HP) aurtengo ikasleek hainbat lan praktiko interesgarri garatu dituzte. Horien artean, Pello Arrue ikasleak Uztarria Azpeitiko aldizkaria aztertu du. 2001tik 2017ra arteko artikulu guztiak (17.034) batu ditu eta bi ikuspuntutatik aztertu ditu. Alde batetik, agertzen diren entitate izendun guztiak erauzi ditu (pertsonak, tokiak, erakundeak…). Eta bestetik, aurkitutako entitateak aldizkariaren gaien arabera sailkatu ditu. Hau da, IXA taldeak sortu duen Ixa-pipes tresna erabili du hasieran testu horiek masiboki analizatzeko, eta gero kontatu ditu entitate izendun bakoitzaren errepikapenak aldizkariko sail bakoitzean.
Esate baterako, irudian 16 urteotan gehien aipatu diren kirolariak ikus daitezke http://www.estadistikakazpeitia.pe.hu/perKirolak.php
Beste kontsulta batzuk egin ditzakezu. Saia zaitez!

LAN BIKAINA, PELLO!


Hizkuntzaren Prozesamendua ikasgaiaren helburu nagusia giza-lengoaiak (hizkuntzak) ordenagailu bidez tratatzeko dauden teknikak eta aplikazioak ezagutzea eta aplikatzea da. Hizkuntz industrien barruan kokatzen diren aplikazioen artean honakoak sartzen dira: Testuen edizioa, Informazioa bilatzea, informazioa erauztea, ezagutzaren kudeaketa, itzulpen automatikoa, lengoaia naturaleko interfazeak edo ahozko hizkuntzaren tratamendua.

Tesia: Korreferentzia-ebazpena euskarazko testuetan (Ander Soraluze, 2017-07-12)

Tesiaren titulua: Korreferentzia-ebazpena euskarazko testuetan
Non: Informatika Fakultateko Ada Lovelace Aretoan
Eguna: Uztailak 12, asteazkena
Ordua: 11:00etan
Egilea: Ander Soraluze Irureta
Zuzendariak: Olatz Arregi Uriarte / Patxi Xabier Arregi Iparragirre
Hizkuntza: Euskara-Ingelesa
Ikerketaren motibazioa, galderak:

Nazio Batuen Erakundea izan zen bitartekari eta hark hartu zuen prozesuaren ardura

Esaldi hori ulertu nahi badugu, jakin behar dugu “Nazio Batuen Erakundea“,  “bitartekari” eta “hark” testu-zatiek, hirurek, erakunde berari egiten diotela aipamena, erreferentziakide direla, korreferentzia egiteko hiru modu diferente direla. Zelan asmatu hori automatikoki? Zelan jakin testu-zatitxo bat noiz den erreferentzia bat eta ze kontzepturi egiten dion erreferentzia? Euskarazko testuetan, espainieraz edo ingelesezkoetan berdin berdin egin daiteke? Edo diferente egin behar da?

Tesia: CLIR teknikak baliabide urriko hizkuntzetarako (Xabier Saralegi, 2017-07-11)

Tesiaren titulua:  CLIR Teknikak Baliabide Urriko Hizkuntzetarako
Non
: Informatika Fakultateko Ada Lovelace Aretoan
Eguna: Uztailak 11, asteartea
Ordua: 11:30etan
Egilea: Xabier Saralegi Urizar
Zuzendariak: Eneko Agirre Bengoa eta Iñaki Alegria Loinaz
Hizkuntza: Euskara
Ikerketaren motibazioa, galderak:

Testuinguru eleaniztunak ugariak dira mundu osoan. Europako biztanleen erdiak, adibidez, eleaniztunak dira. Programa bilatzaile elebakar klasikoak ez dira eraginkorrak horrelako eszenatokietan non erabiltzaileak eleaniztunak izaten diren eta testuzko informazioa hizkuntza ezberdinetan kodetuta egoten den. Tesi honetan hizkuntza arteko bilatzaileak (Cross Lingual Information Retrieval edo CLIR) garatzeko teknika berriak landu ditugu. Arreta, baliabide urriko hizkuntzetarako egokiak diren tekniketan jarri dugu, honelako hizkuntzak baitira testuinguru eleaniztun gehienetan aurkitzen ditugunak.