Mintegia: Itzulpen automatikoko proiektuak, TADEEP eta MODELA (Gorka Labaka, 2018-03-27)

Noiz: asteartean, martxoak 27, 15:00etan
Non: 3.2 gelan.
Hizlaria: Gorka Labaka
Izenburua:  Itzulpen automatikoko proiektuak, TADEEP eta MODELA
Laburpena:

Mintegi honetan, azken urtean martxan izan ditugun itzulpen automatikoari buruz izandako proiektuetan (Tadeep eta Modela) egindako lanen berri emango da. Bi proiektuak itzulpena automatiko neuronalaren ingurukoak dira, eta, batez ere, euskara-gaztelera hizkuntza bikotea landu da. Bertan, oinarrizko NMT sistema bat entrenatzeaz gain, horren gaineko zenbait moldaketak landu ditugu. Lan horietatik, euskarazko testuen segmentazio aukera desberdinak, eta karaktereetan oinarritutako sistema azalduko dira aurkezpen honetan.  Ikusi demoa

Mintegia: Itzulpen automatiko ez-gainbegiratua (Mikel Artetxe, 2018-02-27)

Noiz: asteartean, otsailak 27, 15:00etan
Non: 3.2 gelan.
Hizlaria: Mikel Artetxe
Izenburua:  Itzulpen automatiko ez-gainbegiratua.
Laburpena:

Mintegian aurkeztuko dudan tesiak eleaniztasuna eta datu-urritasuna uztartzen ditu. Aurkezpen honetan azken urtean itzulpen automatiko ez-gainbegiratuaren inguruan eginiko lana azalduko dut, eta etorkizuneko ikerketa-lerroak eztabaidatu

Hizkuntzaren prozesamendua eta ikasketa automatikoa osasun arloan (iñigo Jauregi, 2017-12-19)

Gaia: Hizkuntzaren prozesamendua eta ikasketa automatikoa osasun arloan
Hizlaria:
Inigo Jauregi-k Telekomunikazioen Ingenieritza gradua atera zuen Nafarroako Unibertsitatean (Tecnum) 2016an. CEITen aritu zen gero bi urtez ikerketa laguntzaile lanetan.
2016ko abuztuaz geroztik Capital Markets Cooperative Research Centre-en (CMCRC) ari da lanean hikzuntzaren prozesamendua osasun sektorean aplikatzen.
2017tik tesia egiten dabil University of Technology Sydney-n (UTS). Bere ikerketaren gai nagusiak ikasketa automatikoa eta hizkuntzaren prozesamendua dira.
Eguna: abenduaren 19an, asteartean
Ordua:  15:00 – 16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)
Laburpena:

Osasun sektorean egunero sortzen den informazio kopurua oso handia da eta, gainera, informazio horren zati handi bat testu hutsa izaten da. Bi gai lantzen ditut, bat unibertsitateari lotuta eta bestea enpresa pribatu baterako proiektu bati lotua:

  • Lehenengoa, farmako, medikamentu marka, gaixotasun, prozedura eta beste zenbait osasun domeinuko izenen ezagutze automatikoan datza (health-domain named-entity recognition). Horretarako, B-LSTM-CRF izeneko sare neuronala erabili dut.
  • Bigarren ikerketa praktikoagoa da. Enpresa honek mugikorreko app baten bitartez bakoitzaren osasunerako coaching zerbitzu pertsonalizatu bat eskaintzen du munduan zehar, 24h erabilgarri dagoen chat baten bitartez. Helburua erabiltzaileen mezuen kopuru handi bati automatikoki erantzungo dien chatbot bat sortzea da.

Mintegia: PROSAMED, gaztelaniazko txosten medikoen azterketa (K. Gojenola, 2017-11-21)

Noiz: asteartean, azaroak 21, 15:30ean. bai oraingoan 15:30ean
Non: 3.2 gelan.
Hizlaria: Koldo Gojenola
Izenburua: 

Lengoaia naturalaren prozesamendua eta medikuntza:
gaztelaniazko txosten medikoen azterketa (PROSAMED proiektua)

Laburpena:
Azken urteotan txosten mediko elektronikoak orokortu egin dira osasun-sistema guztietan. Honek testu horiek prozesatzeko aukera asko irekitzen ditu.
Prosamed proiektuan Osakidetzarekin egiten ari garen lanak aurkeztuko dira mintegi honetan, horien artean:
  • Entitate medikoen ezagutza:
    • gaixotasunak: LEUCEMIA, paniculitis, síndrome de lissi tumoral, STENOTROPHOMONAS MALTOPHILIA, …
    • botikak: Omeprazol, posaconazol, levofloxacino, …
    • gorputz-atalak: pulmonar, pretibial, cutáneas, …
    • kalifikatzaileak: aguda, Fenotipo Mixto T/mieloide, …
  • Entitate medikoen arteko erlazioak: gaixotasuna eta gorputz-atala, gaixotasuna-kalifikatzailea kalifikadorea , gaixotasuna-botika (aurkako efektua)
  • Txostenen lotura medikuntzako datu-base eta ontologiekin:
    • SNOMED Clinical Terms: 311.000 kontzeptu.
    • ICD-10 (International Classification of Diseases): 64.000 entitate baino gehiago.
    • Dokumentuak eta entitateak ontologia horiekin lotu.

Zer ikertzen da Informatika Fakultatean? Aurkezpena ikasleei

Bihar goizean Informatika Fakultateko ikerketa-taldeok aurkezpen bat egingo diegu ikasleei.

Noiz: Asteartean, urriak 10
Ordua: 10:05-11:10
Non: Ada-Lovelace aretoan
Norentzat: Batez ere 4. eta 3. mailako ikasleentzat.
Helburua: Fakultatean egiten dugun ikerketa azaltzea, baita ikasleek gurekin lan egiteko dituzten aukerak ere: gradu/master amaierako lanak, kolaborazioak, eta abar.

 

Guztira 15 talde gara! Beraz, aurkezpenak labur joango  dira. 3 minutuko aurkezpena eta minutu bat galderetarako. Ixa taldearena 3. izango da
Kuxkuxeroentzat: ikertaldeen posterrak eta Fakultateko ikertaldeen webgunea

Itzulpengintza automatiko neuronala. Jardunaldi irekia Kyunghyun Cho adituarekin (2017-05-29)

Itzulpengintza automatikoaren hirugarren belaunaldia garatzen ari da. Garai batean erregela linguistikoetan oinarritutako sistemak ziren nagusi (RBMT teknologia), azken hamarkadan, berriz, estatistikan oinarritutako sistemak gailentzen joan dira (SMT teknologia), eta azken bi urtetan neurona-sareetan oinarritutako sistemek hobekuntza kualitatiboak lortzen ari dira (NMT teknologia), teknologia hau ikergai nagusia bihurtuz itzulpengintza automatikoaren arloan. Jardunaldi honetan teknologia horren azken aurrerapenak aurkeztu nahi ditugu, euskararen gainean lortu ditugun emaitzak barne.

Modela_irudia11Testuingurua:

NMT teknologian ikertzea eta, are gehiago, erronka handia den euskararen itzulpen automatiko onargarrira iristea da Modela proiektuaren helburua. Modela proiektua Eusko Jaurlaritzak finantzatzen du eta honako erakundeak dira partaideak: Ametzagaiña, Elhuyar, ISEA, UPV/EHUko Ixa taldea eta Vicomtech/IK4.

Gonbidatua:

Jardunaldi honen gonbidatu nagusia Kyunghyun Cho (Center for Data Science, New York University), ikerlari ezaguna da. NMT arloan aditu erreferentziatuenetako bat da, Google saria jaso du gai horretan eta hizlari bikaina ere bada.

Noiz: 2017ko maiatzaren 29, goizeko 11.00etan
Non: EHUko Informatika Fakultatea, ManuelLardizabal 1, 20018 Donostia (mapa)
Hizkuntza: ingelesa
Programa:

11.00-11.15: Sarrera eta proiektuaren aurkezpena
11.15-12.30: NMT (Kyunghyun Cho)
12.30-13.15: Modela proiektuaren lehen emaitzak

Babesleak: Modela proiektua, TAdeep proektua eta UPV/EHUko Gipuzkoako errektoreordetza

Biharamonean 15:00ean, maiatzak 30, HAP masterreko ikasleekin arituko da Kyunghyun Cho irakaslea.

Bideoak eta gardenkiak:

Sponsors: Modela projectTAdeep project and University of the Basque Country

Modela_irudia3

Mintegia: itzulpen automatikoa eta postedizio kolaboratiboa consumer.eus proiektuan (I. Cortes, 2017-05-09, 15:00)

Mintegia
Itzulpen automatikoa eta postedizio kolaboratiboa consumer.eus proiektuan

Noiz: asteartean, maiatzak 9, 15:00etan.
Non: 3.2 gelan.
15:15-15:30 aldera, teorikoa amaitu ondoren,  alde praktikoa ere egin nahi duenak, fakultateko 1.6 gelan i
Hizlaria: Itziar Cortes. (Elhuyar Fundazioa)
Izenburua: Consumer.eus elebitan:  uztartzen dituen proiektua

Laburpena:

Itzulpen automatikoarekin lotutako 3 urteko proiektu esperimentala da. Helburu nagusia Consumer.eus atarian argitaratzen diren gaztelaniazko edukiak euskarara ahalik eta modu azkarrrenean itzultzea da, eta, horretarako, itzulpen automatikoa eta itzulpen-memoriak erabiltzen dituen plataforma bat erabiltzen da. Bertan, gainera, automatikoki sortutako euskarazko edukia zuzendu daiteke, posteditatu; testuari egindako moldaketetatik ikasi, eta sistemak automatikoki ematen dituen emaitzak hobetzea da helburua.

Zehazki postedizio automatikoko sistema bat sortuko dugu urte bukaerarako, jasotako informazioa oinarri hartuz. Horregatik, garrantzitsua da ahalik eta zuzenketa edo postedizio gehiena biltzea, sistemak ikasketarako nahikoa informazio izan dezan.

Consumer2

Itzulpen automatiko eta postedizio bidez itzulpena sortzeko interfazea.

Consumer_atun1

Sortutako errezeta bat

Mintegia: Jarreren sailkapena sare sozialetan (A. Zubiaga, 2017-02-14)

Izenburua: Helburu jakinekiko jarreren sailkapena sare sozialetan.
Hizlaria:
Eguna: Otsailaren 14an
Ordua: 16:00-17:00 (bai 16:00etan)
Gela: 3.2 gela. Informatika Fakultatea

Laburpena:

Sare sozialetako erabiltzaileek helburu, kontzeptu edo ideia ezberdinekiko erakusten duten jarrera antzematea erabilgarria izan daiteke kasu askotan. Hitzaldi honetan bi kasu jorratuko ditut. Batetik, sare sozialetan zabaltzen diren zurrumurruekin batera, erabiltzaileek aldeko zein kontrako jarrera ezberdinak erakusten dituzte, eztabaida sortuz eta zurrumurruen egiazkotasuna adostu nahian. Eztabaida hauetan ematen den diskurtsoa aztertzeko sailkatzaile sekuentzialekin egindako lana azalduko dut. Bestetik, sare sozialetako erabiltzaileen identitate nazionalaren sailkapena jorratuko dut, mugimendu independentisten esparruan. Euskal Herria, Herrialde Katalanak eta Eskozia adibide hartuta, erabiltzaileek naziotasunarekiko duten jarrera sailkatzeko egindako lana azalduko dut.

Bio laburra:

Arkaitz Zubiaga doktorego osteko ikertzailea da Warwickeko Unibertsitatean (Coventry, Ingalaterra). Aurretik CUNY eta DIT unibertsitateetan aritu zen, eta UNEDeko hizkuntzaren prozesamendurako taldean burutu zuen doktore tesia. Sare sozialetako edukiak ikertzen ditu hizkuntzaren prozesamendurako eta datu meatzaritzarako teknikak baliatuz, besteak beste, eta baita giza zientzia konputazionalerako tekniken bidez diziplina arteko atazak landuz ere.