HAP/LAP masterreko lau tesiren defentsa

Eguna: irailaren 27a     Lekua: Ada Lovelace aretoa

15:30
Universal Dependencies for Buryat.
Egilea: Elena Badmaeva
Tutoreak: Koldo Gojenola , Gosse Bouma

16:15
LexSynSimpleText, a lexical and syntactic simplifier: first steps.
Egilea: Maria Eguimendia
Tutoreak: Arantza Diaz de Ilarraza and Gosse Bouma

17:00
Data Sparsity in Highly Inflected Languages: The Case of Morphosyntactic Tagging in Polish.
Egilea: Michael Ustaszewski
Tutoreak: Rodrigo Agerri and German Rigau

17:45
Multilingual Central Repository version 3.0: improving a very large lexical knowledge base.
Egilea: Daniel Parera Perez
Tutoreak: German Rigau Claramunt

Bideoa: HAP/LAP master-tesia (Mikel Artetxe)

Mikel Artetxe-k maiatzaren 17an aurkeztu zuen bere master tesia HAP-LAP Masterrean

Lan sakon horretan aztertu du Itzulpen Automatikoa hobetzeko nola txertatu hitzen adierazpen distribuzionala (word embedding) eta ikasketa automatikoa.

Orain EHUtb-n ikus dezakezu aurkezpen osoa.

HAP_LAP_artetxeTBDistributional Semantics and Machine Learning for Statistical Machine Translation
Egilea: Mikel Artetxe Zurutuza
Tutoreak: Eneko Agirre eta Gorka Labaka

HAP/LAP masterra Master-tesien defentsak

Eguna : maiatzaren 17a
Lekua: Ada Lovelace aretoa

11:00
Adverse Drug Reaction event extraction on Electronic Health Records written in Spanish.
Egilea: Sara Santiso González
Tutoreak: Alicia Pérez eta Arantza Casillas
Epaimahaia: Eva Navas, Montse Maritxalar Arantza Casillas

11:45
Distributional Semantics and Machine Learning for Statistical Machine Translation
Egilea: Mikel Artetxe Zurutuza
Tutoreak: Eneko Agirre eta Gorka Labaka
Epaimahaia: Eva Navas, Montse Maritxalar, Gorka Labaka

Elkarrizketa Uxoa Iñurrieta-rekin unibertsitatea.net-en

Uxoa Iñurrieta gure ixakidearekin elkarrizketa bat argitaratu dute Unibertsitatea.net webguneko Ziztu-bizian albistegian. Izenburuaren arabera Uxoak hau aurrikusten du: “Oso zaila izango da esaldi konplexuenak ere zuzen-zuzen itzuliko dituen tresnarik lortzea”

Uxoa tesia egiten ari da HAP-LAP programaren barruan. Hona hemen elkarrizketako galdera eta erantzun pare bat:

Konbitzul datu-basea daukazu esku artean; zer da?
Konbitzul datu-baseak izen+aditz motako konbinazioei eta haien itzulpenari buruzko informazioa jasotzen du. Hizkuntzaren prozesamenduari begira sortua da, eta baliagarria da hainbat aplikazio informatikotarako, itzultzaile automatikoetarako, kasu. Edo hala espero dugu, behintzat!

Zein da bere aplikazio praktikoa? Zertarako balia daiteke datu-base hau?
Demagun, adibidez, itzultzaile automatiko batek “adarra jo” esapidea gaztelaniara itzultzea nahi dugula. Ordenagailuak, guk informaziorik eman ezean, bi hitz horiek irakurri eta “tocar/pegar el cuerno” bezalako zerbait sortuko luke, ez bailuke jakingo benetako esanahia zein den. Bada, Konbitzulen sartzen ari garen datuek horrelakoak hobeto itzultzeko balioko dute.

Ikergazteko sari bana Begoña Altuna eta Olatz Perez de Viñasprerentzat

IkerGazte biltzarrean Ixa Taldeko 10 artikulu egotea pozgarria zen, euskaraz ematen dugun HAP_LAP masterreko  ikasle ohien artikuluak 14 izatea ere bai, eta gainera ostiralean sorpresa izan genuen:  Ikergazteko 2 sari:

 

  • olatzUdalbiltzak banatutako sari berezia (Euskal Herriko garapenari ekarpen garrantzitsuena egiten diona):
    Olatz Perez de Viñasprerentzat izan da
    Osasun-txosten elebidunak posible ote?” lanarekin.
    Ikus Ikergazteko artikulu-bilduma (orriak: 730-738)

ZORIONAK DENEI !!   🙂

Elkarrizketa Manex Agirrezabalekin unibertsitatea.net-en

Manex Agirrezabal gure ixakidearekin elkarrizketa bat argitaratu dute Unibertsitatea.net webguneko Ziztu-bizian albistegian. Izenburuaren arabera Manexek hau aurrikusten du:“Konputagailuek bertsoak modu naturalean sortzea lortuko dute”

Manex_Unibertsitatean_netBertsoBOT: lehen urratsak proiektua aurkeztu zuen 2012an HAP masterrean,  eta orain  Delawareko unibertsitatean (AEBtan) dabil Manex. Handik erantzun ditu galderak eta hango pinuen arteko argazkia bidali omen du.

Hona hemen elkarrizketako bi galdera eta erantzunak:

Noizbait plazan makinak eta bertsolariak buruz buru ikusteko aukera izango dugu?

Fisikoki posible ikusten dudan arren, gure helburua ezberdina da. Gure helburua ez da bertso-sorkuntza sistema zuzenean robotean txertatzea eta bertsolariekin plazan ikustea. […]

Bertsozaletasunak eraginda hautatu zenuen bertsolaritzaren ikerlerroa ala bertsolaritzaren bat-batekotasun horrekin “lehiatzeko” grinak eraginda?

Bai bata eta baita bestea… Batetik, bertso batek dituen ezaugarri metriko, semantiko eta pragmatikoek egunez-egun gehiago harritzen naute. Bestetik, beti gustatu izan zait zientzia-fikziozko filmetan makinek eta gizkaiek duten elkarrekintza naturala (HAL 9000 eta parekoak). Nik uste dut gure ikerkuntza-lerroak elkarrekintza hori naturalagoa egiten lagun dezakeela.

2013-14 HAP masterreko tesien aurkezpenak (2014/09/17)

HAP_diptiko_IrudiaDatorren asteazkenean, hilak 17, 2013-14 ikasturteko HAP masterreko tesien aurkezpenak egingo dira Fakultateko Areto Nagusian. Lan interesgarri hauek masterrean ikasten denaren erakusgarria dira:

10:00 Analysis, Optimization and Development of an Answer Scoring System
Egilea: Iñigo Lopez-Gazpio
Tutorea: Montse Maritxalar

10:45 Ebaluatoia: crowd evaluation of English-Basque machine translation
Egilea: Nora Aranberri
Tutorea: Gorka Labaka

11:30 Euskararako HPSG gramatikaren lehen proposamena
Egilea: Jon Alkorta
Tutorea: Koldo Gojenola

15:45 Lehen urratsak bertsotarako gaien azterketa automatikoan: gaiaren erregistroaren predikzioa eta gaiaren eta bertsoaren arteko erlazio semantikoaren azterketa
Egilea: Ion Lizarazu
Tutorea: Bertol Arrieta Kortajarena

16:30 Izen-entitate eta Sentimenaren Analisia Frantsesez, Turismoaren Domeinurako Hurbilpena
Egilea: Andoni Azpeitia
Tutorea: Aitor Soroa

17:15 Hitzen arteko ahaidetasuna: teknikak eta ebaluazio aukerak
Egilea: Josu Goikoetxea
Tutorea: Eneko Agirre Bengoa, Aitor Soroa Etxabe

Osasun-terminoak euskaraz: tresna informatiko berri bat

OLatzMaiteSnomed1Osasungoan euskara erabiltzea oraindik erronka betegabea da. Bide horretan, urrats bat eman du Olatz Perez de Viñasprek bere Hizkuntzaren Azterketa eta Prozesamendua  masterreko tesian: SNOMED CT sare semantikoa euskaratzeko lehen urratsak“.

Medikuntza-arloan terminologia zabal, eleanitz eta ulergarriena da SNOMED CT (Systematized Nomenclature of Medicine – Clinical Terms). Milioi bat termino inguru biltzen ditu gaixotasun-izen, gorputzeko atal, medikuntzako prozedura eta antzeko kategorien azpian.

Sare-semantiko honetako kontzeptuentzako euskarazko ordainak lortzeko aplikazio bat diseinatu du Olatzek eta aplikazioaren lehen urratsa inplementatu du. Honela, euskara ere duten zenbait hiztegi eleanitz espezializatutan oinarrituta, SNOMED CTn dauden gaixotasun-izenen %20 inguru euskaratu du modu automatikoan hizkuntza-teknologia baliatuta.

Tresna informatikoa diseinatuta dago eta garapenean jarraituko duen arren, arloko adituen erabilera eta ezagutza behar ditu Olatzek hurrengo urratsak emateko.

Osasun-langileek euskara erabil dezaten laguntza ematea da, besteak beste, aplikazio honen helburua.

Txosten osoa hemen dago eskuragarri.

Snomed

SNOMED ontologiaren adibidea (iturria: http://www.imt.liu.se/~erisu/)