Mintegia: Jarreren sailkapena sare sozialetan (A. Zubiaga, 2017-02-14)

Izenburua: Helburu jakinekiko jarreren sailkapena sare sozialetan.
Hizlaria:
Eguna: Otsailaren 14an
Ordua: 16:00-17:00 (bai 16:00etan)
Gela: 3.2 gela. Informatika Fakultatea

Laburpena:

Sare sozialetako erabiltzaileek helburu, kontzeptu edo ideia ezberdinekiko erakusten duten jarrera antzematea erabilgarria izan daiteke kasu askotan. Hitzaldi honetan bi kasu jorratuko ditut. Batetik, sare sozialetan zabaltzen diren zurrumurruekin batera, erabiltzaileek aldeko zein kontrako jarrera ezberdinak erakusten dituzte, eztabaida sortuz eta zurrumurruen egiazkotasuna adostu nahian. Eztabaida hauetan ematen den diskurtsoa aztertzeko sailkatzaile sekuentzialekin egindako lana azalduko dut. Bestetik, sare sozialetako erabiltzaileen identitate nazionalaren sailkapena jorratuko dut, mugimendu independentisten esparruan. Euskal Herria, Herrialde Katalanak eta Eskozia adibide hartuta, erabiltzaileek naziotasunarekiko duten jarrera sailkatzeko egindako lana azalduko dut.

Bio laburra:

Arkaitz Zubiaga doktorego osteko ikertzailea da Warwickeko Unibertsitatean (Coventry, Ingalaterra). Aurretik CUNY eta DIT unibertsitateetan aritu zen, eta UNEDeko hizkuntzaren prozesamendurako taldean burutu zuen doktore tesia. Sare sozialetako edukiak ikertzen ditu hizkuntzaren prozesamendurako eta datu meatzaritzarako teknikak baliatuz, besteak beste, eta baita giza zientzia konputazionalerako tekniken bidez diziplina arteko atazak landuz ere.

Mintegia: Itzulpen Automatiko Neuronala: TAdeep eta Modela proiektuak (G. Labaka, 2017-01-31)

Izenburua:  Itzulpen Automatiko Neuronala: TADeep eta Modela proiektuak
Hizlaria: Gorka Labaka
Eguna: urtarrilaren 31n
Ordua:  15:00 – 16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

2017. urtean, IXA taldeak bi proiektutan landuko ditu itzulpen automatiko neuronala (TAdeep eta Modela). Mintegian, Gorka Labakak itzulpena automatiko neuronalaren aurkezpen orokorra egingo du, eta horren ondoren proiektu horietan aurreikusitako eginbeharrak eta epeak azalduko dira.

TAdeep

Espainerazko hitz-konbinazio bereziak bilatzen (Margarita Alonso, 2016-01-17)

Izenburua:  Procesamiento de colocaciones en castellano
…….  (Espainerazko kolokazioak bilatzen eta prozesatzen)
Eguna: urtarrilaren 17an
Ordua:  15:00 – 16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)
Laburpena:

It is frequently stated that collocations are especially challenging to L2 learners, even to the more advanced ones (Henriksen 2013). This statement usually appears in the literature which focuses on English as L2. However, learners of English as L2 have at their disposal several resources to help them learn collocations, starting with a number of collocation dictionaries, teaching materials and many online lexical tools (among others, Benson et al. 1996, Crowther et al. 2002, McCarthy and O Dell 2005 or Wu et al. 2010). The situation for learners of Spanish as L2 is very different. Resources for learning collocations in Spanish, compared with those available in English, are scarce. There are only two Spanish combinatorial dictionaries (Bosque 2004, Alonso Ramos 2004), very few specific teaching materials (Prada et al. 2012), and until very recently there was no collocation online tool which could help the learner to choose the appropriate collocation.

Over the last years I have tried to fill these gaps as far as resources for learning Spanish collocations are concerned. However, due to the crisis that traditional dictionary format is facing, the question arises as to what form the ideal resource designed to help learners should take. The challenges are posed not only by online lexical tools, but also by corpora containing vast amounts of lexical information. In this light, some proposals for blending dictionary and corpus have been put forward as an ideal resource (Cobb 2003, Kilgarriff 2009). Corpus-driven lexicography has given rise to what can be called  lexically-driven corpora , resources which instead of providing lexical information in the form of a dictionary do so in the form of a concordance program exploiting language corpora. Through an appropriate user interface, lexical items become pointers to the texts that reveal their meaning, blurring the boundaries between dictionaries and corpora. Moreover, dictionaries have ceased to be stand-alone products to be complemented by CALL applications (Abel 2010). Therefore, the concept of the dictionary is changing towards a more flexible and dynamic tool which aims to better address the user s needs. This presentation shows how the resources we are building attempt to provide assistance with collocational needs. More particularly, I will describe the evolution of my research interests from an online collocation dictionary of Spanish (DiCE), the development of which began ten years ago, towards an online collocation writing assistant, the tool HARenES, which although integrated with the DiCE goes beyond the dictionary. In order to evaluate the effectiveness of correction suggestions offered by this tool, I will show the results of experimental study with students of Spanish as a second language. I will finish by presenting some reflections about the pedagogical role of the corpus

Uxoa Iñurrieta barrezka Matxinekin (Wolfram deuna)

wofram11uxoa_matxin_umorea_bergaraAtzo, Uxoa Iñurrietak parte hartu zuen Wolfram deuna 2016 umorezko saioan. Ikusi behean Teknopolis programako albistea (Uxoarena: 2’10”).

Bai, itzultzaile automatikoen esaldiak barregarri xamarrak izaten dira batzuetan. Horrelako adibide batzuekin bere tesi-lanaren motibazioa erakutsi zigun.

 

Errore horietako batzuk konpontzearren tesian egiten ari dena ikusi nahi baduzu…

Hitzaldia: Modernitaterako balio zuen euskarak? (A. Farwell, 2016-10-11)

Aritz Farwell (Arg.: Mikel Mtz. de Trespuentes)

Jo-ta-fuego gabiltza IXA taldean euskara murgiltzen teknologia berrietan, baina orain dela 100 urte uste zabaldua zen euskara baserrirako eta familiarako bakarrik balio zuela.
Horixe izan da Aritz Farwell-en aurten defenditu duen tesiaren gaia. Asteartean laburpen bat eskainiko digu.

Gaia: Modernitaterako balio du euskarak? Orain dela 100 urteko ikuspegia
Hizlaria:
Aritz Farwell Castillo Los Angeleseko Pitzer Collegen Historian lizentziatu ondoren, University of Chicagon egin zuen masterra. Duela hamar urte Euskal Herrira heldu zen doktoregoa egitera. 2016ko otsailaren 3an defendatu zuen UPV/EHUko Gizarte eta Komunikazio Zientzien Fakultatean ‘Borne Before the Moone: A Social and Political History of Basque at the Dawn of the Twentieth Century‘ tesia.
Eguna: urriaren 11an, asteartean
Ordua:  15:00 – 16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)
Abstract:

Ikerlariaren arabera, gizartearen gehiengoak iritzi hauek partekatzen zituzten euskararen inguruan: “besteak beste, iraganeko erlikia bat bezala ikusten zen, zabartua zegoena, desagertzeko mehatxua gainean zuena, gutxietsia, bizitza publikotik at, linguistikoki irla bat, euskal herritarren jatorrizko hizkuntza eta beheko klasearen hizkuntza”. Horiek guztiak, hala ere, Farwellen esanetan, pertzepzioak ziren, tesian zehar azaltzen den bezala, esate baterako, “euskara ez baitzegoen eremu publikotik erabat baztertua”.

Mintegia: Big Data eta hizkuntza teknologia Trivagon (Min Fang, 2016/06/08)

Izenburua:  Big Data and NLP at Trivago
…………….(Big Data eta hizkuntzaren prozesamendua hotelak bilatzeko Trivago aplikazioan)
Hizlaria: Min Fang
…..2013 – 2015: Master Erasmus Mundus Language and Communication Technologies, summa cum laude
…..2015-… :   (Trivago, hotelak bilatzeko aplikazioa)
Eguna: ekainaren 8an
Ordua:  10:00 – 11:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)
Abstract:
Hoteletako bezeroek idazten dituzten balorazioetatik aldeko eta kontrako iritziak automatikoki lortzea da helburua, ikasketa automatikoa, analisi estatistikoa eta “Big data” teknikak erabilita. Sentimenduen analisia lantzen du.
I’m interested in getting insights from data by applying natural language processing, machine learning and statistical analyses. Ideally, those insights can then be turned into useful applications or facilitate higher level decisions.

Together with our software engineers I take care of our NLP capabilities: We work on improving and maintaining a highly flexible and scalable pipeline that is geared towards aspect-based sentiment analysis (and more in the future). Extracting knowledge from a large number of natural language texts allows us to understand our domain better and enhance the experience for our users.

Our technology stack includes:
– Python and Java
– R for analysis
– AWS for infrastructure

Bideoa: HAP/LAP master-tesia (Mikel Artetxe)

Mikel Artetxe-k maiatzaren 17an aurkeztu zuen bere master tesia HAP-LAP Masterrean

Lan sakon horretan aztertu du Itzulpen Automatikoa hobetzeko nola txertatu hitzen adierazpen distribuzionala (word embedding) eta ikasketa automatikoa.

Orain EHUtb-n ikus dezakezu aurkezpen osoa.

HAP_LAP_artetxeTBDistributional Semantics and Machine Learning for Statistical Machine Translation
Egilea: Mikel Artetxe Zurutuza
Tutoreak: Eneko Agirre eta Gorka Labaka

Ekainak 22: Teknologia itzultzailearen lagun. Noiz eta Nola?

IT_UEUItzulpengintza eta teknologiaren arteko konbergentzia oso azkar gertatzen ari da.
Garapen teknologikoek hizkuntzen industrien lan merkatua handiagotu eta
produktu berriak sortu dituzte. Egungo eskaerari erantzun ahal izateko, ordenagailuz lagundutako itzulpenean, softwarearen edota web orrien lokalizazioan trebatutako profesionalak prestatu behar dira.

Itzulpengintza eta Teknologia’ graduondokoa on-line ematen dugu urte osoan. Oraingoan egunbeteko jardunaldi bat antolatu dugu: Teknologia, itzultzailearen lagun. Noiz eta nola? Jardunaldi honetan tresna teknologikoek lan egiteko prozesuan eta itzultzaileen prestakuntzan duten inpaktua aztertuko da. Ixa Taldekideak daude sartuta honetan: Nora, Gorka eta Kepa.

UEUko udako ikastaroetan. Ekainaren 22an, asteazkena, Eibarren.

8:30 Harrera eta dokumentazio banaketa
9:00 Jardunaldiaren aurkezpena.
9:15 Laguntza teknologikoa itzulpen-enpresaren jarduera estandarrean.
……..Ritxi Lizartza (Maramara Taldea)
10:15 Euskal post-edizioa, zertan dabil?
……..Nora Aranberri (IXA taldea, UPV/EHU. UEUkidea)
11:15 Atsedena
11:45 Euskal lokalizatzaileen gaitasunak eta trebetasunak.
……..Ane Lopez (Itzultzailea eta lokalizatzailea)
12:45 Lan merkatuaren eskakizunak. Itzultzaileen prestakuntza beharrak.
……..Josu Barambones (UPV/EHUko irakaslea. ‘Itzulpengintza eta Teknologia’ graduondokoaren zuzendaria).
13:30 Bazkari arina.
15:00 Mahai ingurua: Teknologiaren ekarpena gure enpresetan.
……..Hori-Hori, Bakun, Maramara, UZEI eta Elhuyar

Mintegia: Zuhaitz-banku unibertsala (K.Gojenola, 2015/10/20)

Hizlaria:  Koldo Gojenola
Ordua: 15:00-16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)
Izenburua:  “Zuhaitz-banku unibertsala / Universal Treebank

2008. urtetik hona, hizkuntza desberdinetan garatutako zuhaitz-bankuek etiketatze eredu estandarra jarraitzeko hainbat saiakera egin dira (Standford Dependencies, Clear, Google UD, Standford UD, Hamlet). 2014tik aurrera Standford UDetan oinarritutako Universal Dependencies, “de facto”zko estandarra bihurtu da. Gure zuhaitz-bankua UDetara bihurtzen hasi gara, eta lehenengo bertsio bat atzigarri dago jada. Eman diren urratsak eta egoera azalduko ditugu mintegi honetan.