HAP/LAP masterreko lau tesiren defentsa

Eguna: irailaren 27a     Lekua: Ada Lovelace aretoa

15:30
Universal Dependencies for Buryat.
Egilea: Elena Badmaeva
Tutoreak: Koldo Gojenola , Gosse Bouma

16:15
LexSynSimpleText, a lexical and syntactic simplifier: first steps.
Egilea: Maria Eguimendia
Tutoreak: Arantza Diaz de Ilarraza and Gosse Bouma

17:00
Data Sparsity in Highly Inflected Languages: The Case of Morphosyntactic Tagging in Polish.
Egilea: Michael Ustaszewski
Tutoreak: Rodrigo Agerri and German Rigau

17:45
Multilingual Central Repository version 3.0: improving a very large lexical knowledge base.
Egilea: Daniel Parera Perez
Tutoreak: German Rigau Claramunt

Bideoa: HAP/LAP master-tesia (Mikel Artetxe)

Mikel Artetxe-k maiatzaren 17an aurkeztu zuen bere master tesia HAP-LAP Masterrean

Lan sakon horretan aztertu du Itzulpen Automatikoa hobetzeko nola txertatu hitzen adierazpen distribuzionala (word embedding) eta ikasketa automatikoa.

Orain EHUtb-n ikus dezakezu aurkezpen osoa.

HAP_LAP_artetxeTBDistributional Semantics and Machine Learning for Statistical Machine Translation
Egilea: Mikel Artetxe Zurutuza
Tutoreak: Eneko Agirre eta Gorka Labaka

HAP/LAP masterra Master-tesien defentsak

Eguna : maiatzaren 17a
Lekua: Ada Lovelace aretoa

11:00
Adverse Drug Reaction event extraction on Electronic Health Records written in Spanish.
Egilea: Sara Santiso González
Tutoreak: Alicia Pérez eta Arantza Casillas
Epaimahaia: Eva Navas, Montse Maritxalar Arantza Casillas

11:45
Distributional Semantics and Machine Learning for Statistical Machine Translation
Egilea: Mikel Artetxe Zurutuza
Tutoreak: Eneko Agirre eta Gorka Labaka
Epaimahaia: Eva Navas, Montse Maritxalar, Gorka Labaka

Ikasketa automatikoaren erabilera testu-sailkapenean, adiera-desanbiguazioan eta korreferentzian

Ana Zelaia irakasleak defenditu du gaur bere tesia Informatika Fakultatean. Zuzendariak Olatz Arregi eta  Basilio Sierra izan dira, eta tesiaren titulua hau:

Latent Semantic Indexing eta Ikasketa Automatikoa Hizkuntzaren Prozesamenduaren Arloan: Testu-Sailkatzea, Hitzen Adiera-Desanbiguatzea eta Korreferentzia-Ebaztea SVD Bidezko Dimentsio Murrizketa eta Multi- Sailkatzea Konbinatuz

Berak, gaur azaldu duen moduan, indar berezia jarri du Latent Semantic Indexing metodoaren oinarri matematikoa deskribatzen duen kapitulua azaltzen, erraz uler dadin. Inork interesa badu horretan irakur dezala, mesedez, tesi osoa edo kapitulu hori gutxienez (Ana_Zelaia_tesia.pdf, Aurkezpena.pdf). Eskerrik asko, Ana!

20160125_114700

Elkarrizketa Uxoa Iñurrieta-rekin unibertsitatea.net-en

Uxoa Iñurrieta gure ixakidearekin elkarrizketa bat argitaratu dute Unibertsitatea.net webguneko Ziztu-bizian albistegian. Izenburuaren arabera Uxoak hau aurrikusten du: “Oso zaila izango da esaldi konplexuenak ere zuzen-zuzen itzuliko dituen tresnarik lortzea”

Uxoa tesia egiten ari da HAP-LAP programaren barruan. Hona hemen elkarrizketako galdera eta erantzun pare bat:

Konbitzul datu-basea daukazu esku artean; zer da?
Konbitzul datu-baseak izen+aditz motako konbinazioei eta haien itzulpenari buruzko informazioa jasotzen du. Hizkuntzaren prozesamenduari begira sortua da, eta baliagarria da hainbat aplikazio informatikotarako, itzultzaile automatikoetarako, kasu. Edo hala espero dugu, behintzat!

Zein da bere aplikazio praktikoa? Zertarako balia daiteke datu-base hau?
Demagun, adibidez, itzultzaile automatiko batek “adarra jo” esapidea gaztelaniara itzultzea nahi dugula. Ordenagailuak, guk informaziorik eman ezean, bi hitz horiek irakurri eta “tocar/pegar el cuerno” bezalako zerbait sortuko luke, ez bailuke jakingo benetako esanahia zein den. Bada, Konbitzulen sartzen ari garen datuek horrelakoak hobeto itzultzeko balioko dute.

Ikergazteko sari bana Begoña Altuna eta Olatz Perez de Viñasprerentzat

IkerGazte biltzarrean Ixa Taldeko 10 artikulu egotea pozgarria zen, euskaraz ematen dugun HAP_LAP masterreko  ikasle ohien artikuluak 14 izatea ere bai, eta gainera ostiralean sorpresa izan genuen:  Ikergazteko 2 sari:

 

  • olatzUdalbiltzak banatutako sari berezia (Euskal Herriko garapenari ekarpen garrantzitsuena egiten diona):
    Olatz Perez de Viñasprerentzat izan da
    Osasun-txosten elebidunak posible ote?” lanarekin.
    Ikus Ikergazteko artikulu-bilduma (orriak: 730-738)

ZORIONAK DENEI !!   🙂

10 artikulu IkerGazte kongresuan!

Durangon ikerlari gazteak biltzen dituen IkerGazte biltzarrean 10 artikulu datoz Ixa taldetik. Ixa Taldeak parte hartze oso handia dauka. Euskaraz ematen dugun HAP masterraren ikasle-ohien artikuluak guztira 14 dira 🙂

Ikusi kongresua laburbiltzen duen BIDEOA
Ikusi kongresuko komunikazio guztiak biltzen dituen LIBURUA

Osteguneko artikuluak:

  • Euskararen Sorkuntza Automatikoa: lehen urratsak. Manex Agirrezabal, Itziar Gonzalez-Dios and Iñigo Lopez-Gazpio.
  • Euskararako HPSG gramatikaren lehen proposamena. Jon Alkorta.
  • Konbitzul: euskarazko eta gaztelaniazko izen+aditz konbinazioen datu-basea. Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka and Kepa Sarasola.
  • Euskarazko denbora-egituren tratamendu automatikorako azterketa. Begoña Altuna.

Ostiralekoak:

  • Konbinatu eta Irabazi! Hitzen Semantikaren Errepresentazio Osoagoaren Bila. Josu Goikoetxea, Eneko Agirre and Aitor Soroa.
  • Lurrikarei buruzko informazioa eskuratzen Twitter bidez. Ander Intxaurrondo, Eneko Agirre and Oier Lopez De Lacalle.
  • Datu handien tekniken erabilera testu-corpus eskergak prozesatzeko. Zuhaitz Beloki, Xabier Artola and Aitor Soroa.
  • Euskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzea. Antton Gurrutxaga, Iñaki Alegria and Xabier Artola.
  • Izen-aipamenak desanbiguatu eta Wikipediara lotzen. Ander Barrena, Eneko Agirre, Jokin Perez de Viñaspre and Aitor Soroa.
  • Korreferentzia-ebazpena euskaraz idatzitako testuetan. Ander Soraluze Irureta, Olatz Arregi Uriarte, Xabier Arregi Iparragirre and Arantza Diaz de Ilarraza Sanchez.

Gainera, horiez gain euskarazko HAP masterraren beste ikasle-ohi hauek ere agertzen dira:

  • Corpusetan oinarritutako hiztegi elebidun berria sortzen. David Lindemann and Iñaki San Vicente.
  • Weba euskarazko corpus gisa. Igor Leturia.
  • Audio albistegietatik informazioa erauzten duen sistema eleaniztuna- Komunikazio zubiak sortzen. Nora Barroso, Karmele Lopez de Ipiña, Pilar Maria Calvo, Carmen Hernandez, Aitzol Ezeiza, Unai Susperregi, Simeon Barroso and Odei Barroso.
  • Polaritate lexikoak azkar eta merke . Iñaki San Vicente and Xabier Saralegi.

Tesia: Estaldura zabaleko euskararako analizatzaile sintaktiko estatistikoa (Kepa Bengoetxea, 2014-12-16)

Tesiaren titulua: Estaldura zabaleko euskararako analizatzaile sintaktiko estatistikoa
Non
: Informatika Fakultateko Gradu Aretoan
Eguna: Abenduak 16, asteartea
Ordua: 11:00etan
Egilea: Kepa Bengoetxea Kortazar
Zuzendaria: Koldo Gojenola Galletebeitia

Agindu bezala hemen dator Kepa Bengoetxea Kortazar ixakideak asteartean defendatuko duen tesia. Sintaxi konputazionalari buruz aurten aurkeztuko den hirugarren tesia da hau, estaldura zabaleko analizatzaile estatitiskoa dakarrena, Maltixa izenekoa.

EU_SintaxiKonp_Mugarriak

Mugarriak euskarararen sintaxi konputazionalean

Txiotesia2-ko saria Itziar Gonzalezi

UEUk antolatu duen “Txiokatu zure tesia 6 mezutan” #Txiotesia2 txapelketako lehen saria Itziar Gonzalez-Dios-entzat izan da, egiten ari den euskarazko testuen sinplifikazio automatikoari buruzko tesia laburtzeagatik. Ikus berria Sustatun

Zorionak @itziarGD!

Eneko Bidegain kazetari eta irakasleak bigarren saria irabazi du tesiko txioak koplatan idatzita.

Hauek dira txio irabazleak:

ItziarGD_tesitxioak