SEPLN2017 biltzarreko artikulu onenaren saria

Begoña Altuna, María Jesús Aranzabe, eta Arantza Diaz de Ilarraza ixakideek artikulu onenaren saria jaso dute kongresuan!
ZORIONAK!!!

Artikuluaren izenburua hau da: ‘EusHeidelTime: Time Expression Extraction and Normalisation for Basque

Euskarazko testuetatik denbora-adierazpenak nola antzeman eta nola normalizatu aztertzen dute artikuluan. Nola antzeman testu batean denbora-lerroko une konkretu bat aipatzen dela? Nola antzeman denbora tarte bat dela? Eta noiz? Testuan deskribatzen diren ekintzak noiz gertatu izan diren ondo ulertzeko behar beharrezko dira ikerketa hauek.

Bada sistema bat ingeleserako eta beste hizkuntzetarako erabiltzen dena HeidelTime. Ikerketa honetan euskarari egokitu dute sistema hori. Morfologia aberatsa duen hizkuntza baterako ere baliagarria izan daitekeela frogatu dute.

 

HAP Masterreko 7 ikasle-ohi IKERGAZTE biltzarrean

Maiatzaren 10, 11 eta 12an Iruñean ikerlari gazteak bilduko dituen IkerGazte biltzarreko aurkezpenen listan 7 artikulu aurkituko dituzu HAP masterreko ikasle ohiekin:

  • (18) Euskarazko gertaeren etiketatze automatikoa. Haritz Salaberri, Olatz Arregi eta Beñat Zapirain
  • (29) Poesiaren eskantsio automatikoa: bi hizkuntzen azterketa. Manex Agirrezabal, Iñaki Alegria eta Mans Hulden
  • (78) Testu-loturen labirinto semantikoan barna, esanahi-bektoreak lagun! Josu Goikoetxea, Iñigo Lopez-Gazpio, Eneko Agirre, Montse Maritxalar eta Aitor Soroa
  • (112) Osasun-zientzietako terminologiaren euskaratze automatikoaren ebaluazioa, osasungintzako euskal komunitatea inplikatuz. Olatz Perez-De-Viñaspre eta Maite Oronoz Anchordoqui
  • (120) Ahots kantatuaren sintesiaren, bertsolaritzarako egokitzapena. Xabier Sarasola, Eva Navas eta Inma Hernaez
  • (121) Euskarazko ezeztapenaren tratamendu automatikorako azterketa. Begoña Altuna, María Jesús Aranzabe eta Arantza Díaz de Ilarraza
  • (132) Aditz+izen konbinazioen itzulpen automatikoa, arau linguistikoen bidez. Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka eta Kepa Sarasola

Gaur bukatzen da matrikula merkerako epea. Aupa!

Hizkuntza prozesamenduaren beharraz (Gaur8, 2017-01-28)

Arantza2_Gaur8Hizkuntza prozesamenduaren teknikaz balia gaitezke artikulua argitaratu du Arantza Diaz de Ilarraza Ixakideak Gaur8 aldizkarian. Hona hemen zati batzuk:

Interneten aurki ditzakegun dokumentuen kantitatea ikaragarria da, eta, gainera, esponentzialki handitzen da urtero. Hori dela-eta, gure eskura testu-informazio bolumen itzela dugu, eta hazten doa. Hala ere, testu-informazio hori erabiltzea ez da erraza; laguntza behar dugu, eta konputagailuek lagun diezagukete zeregin horretan. […]

Jende askok ez daki teknologia hori zertan datzan, baina gure bizitzaren alderdi funtsezkoa bilakatu dela esan behar dugu. […]

Datozen urteetan teknologia honen baliagarritasuna gero eta nabarmenagoa izango da eguneroko beharretan. Konputagailuak gero eta hobeto dabiltza itzulpen automatikoan, dokumentuen sailkapenean, bilaketetan eta baita ahotsaren ezagutzan eta hizketaren sintesian ere, baina oraindik ez dute hizkuntzaren esanahia ulertzen. Bitartean, baina, balia gaitezke lagungarriak izan daitezkeen aplikazioez.

IXA taldearen ekarpenak COLING 2016 kongresuan (Osaka, abendua, 11-17)

COLING kongresua oso garrantzitsua da linguistika konputazionaleko ikerketa-arloan. 2016ko bilkura Japonian Osakan egiten ari da egun hauetan, abenduaren 11tik 17ra.
Hauek dira IXA Taldeak aurkeztuko dituen lanak:

#txiotesia3. Hizkuntza-teknologia arloko tesiak

Azaroaren 22an Unibertsitatea.net atariak antolatu duen #txiotesia3 ekimenean gutxienez 6 izan dira hizkuntza teknologiaren inguruko tesiak. Guztira 52 ikertzailek parte hartu zuten, aurreko edizioan baino %13 gehiago.
Sari banaketa abenduaren 1ean izango da Donostiako Garoa liburu dendan, bertan  unibertsitatea.net atariaren 10. urteurrena ospatu eta mahai-inguru bat ere izango da.

Hauek dira Hizkuntza-Teknologiako txio-tesilariak:


Uxoa Iñurrieta barrezka Matxinekin (Wolfram deuna)

wofram11uxoa_matxin_umorea_bergaraAtzo, Uxoa Iñurrietak parte hartu zuen Wolfram deuna 2016 umorezko saioan. Ikusi behean Teknopolis programako albistea (Uxoarena: 2’10”).

Bai, itzultzaile automatikoen esaldiak barregarri xamarrak izaten dira batzuetan. Horrelako adibide batzuekin bere tesi-lanaren motibazioa erakutsi zigun.

 

Errore horietako batzuk konpontzearren tesian egiten ari dena ikusi nahi baduzu…

14 artikulu Esloveniako LREC bilkuran

Aste honetan Eslovenian LREC bilkura egiten ari da (Language Resources and Evaluation Conference). Hizkuntza-Teknologiarako baliabideak eta ebaluazio-metodoak aztertzen dira bilkura handi honetan.

Ez da makala gero, Ixa Taldeko 14 artikulu onartu dizkigute. horietako 3 artikulu Elhuyarreko ikerlariekin batera idatzi ditugu. Bertan daude Eneko Agirre, Iñaki Alegria eta German Rigau Ixakideak. Aupa!

LREC_logoHemen daude 14 artikulu horiek lortzeko estekak:

  1. A Comparison of Domain-based Word Polarity Estimation using different Word Embeddings
  2. A Comparison of Named-Entity Disambiguation and Word Sense Disambiguation
  3. A Multilingual Predicate Matrix
  4. Addressing the MFS Bias in WSD systems
  5. Domain Adaptation in MT Using Titles in Wikipedia as a Parallel Corpus: Resources and Evaluation
  6. Evaluating the Noisy Channel Model for the Normalization of Historical Texts: Basque, Spanish and Slovene
  7. Evaluating Translation Quality and CLIR Performance of Query Sessions
  8. Interoperability of Annotation Schemes: Using the Pepper Framework to Display AWA Documents in the ANNIS Interface
  9. QTLeap WSD/NED Corpora: Semantic Annotation of Parallel Corpora in Six Languages
  10. The Event and Implied Situation Ontology (ESO): Application and Evaluation
  11. Tools and Guidelines for Principled Machine Translation Development
  12. TweetMT: A Parallel Microblog Corpus
  13. Two Architectures for Parallel Processing of Huge Amounts of Text
  14. Word Sense-Aware Machine Translation: Including Senses as Contextual Features for Improved Translation Models

Ikergazteko sari bana Begoña Altuna eta Olatz Perez de Viñasprerentzat

IkerGazte biltzarrean Ixa Taldeko 10 artikulu egotea pozgarria zen, euskaraz ematen dugun HAP_LAP masterreko  ikasle ohien artikuluak 14 izatea ere bai, eta gainera ostiralean sorpresa izan genuen:  Ikergazteko 2 sari:

 

  • olatzUdalbiltzak banatutako sari berezia (Euskal Herriko garapenari ekarpen garrantzitsuena egiten diona):
    Olatz Perez de Viñasprerentzat izan da
    Osasun-txosten elebidunak posible ote?” lanarekin.
    Ikus Ikergazteko artikulu-bilduma (orriak: 730-738)

ZORIONAK DENEI !!   🙂

10 artikulu IkerGazte kongresuan!

Durangon ikerlari gazteak biltzen dituen IkerGazte biltzarrean 10 artikulu datoz Ixa taldetik. Ixa Taldeak parte hartze oso handia dauka. Euskaraz ematen dugun HAP masterraren ikasle-ohien artikuluak guztira 14 dira 🙂

Ikusi kongresua laburbiltzen duen BIDEOA
Ikusi kongresuko komunikazio guztiak biltzen dituen LIBURUA

Osteguneko artikuluak:

  • Euskararen Sorkuntza Automatikoa: lehen urratsak. Manex Agirrezabal, Itziar Gonzalez-Dios and Iñigo Lopez-Gazpio.
  • Euskararako HPSG gramatikaren lehen proposamena. Jon Alkorta.
  • Konbitzul: euskarazko eta gaztelaniazko izen+aditz konbinazioen datu-basea. Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka and Kepa Sarasola.
  • Euskarazko denbora-egituren tratamendu automatikorako azterketa. Begoña Altuna.

Ostiralekoak:

  • Konbinatu eta Irabazi! Hitzen Semantikaren Errepresentazio Osoagoaren Bila. Josu Goikoetxea, Eneko Agirre and Aitor Soroa.
  • Lurrikarei buruzko informazioa eskuratzen Twitter bidez. Ander Intxaurrondo, Eneko Agirre and Oier Lopez De Lacalle.
  • Datu handien tekniken erabilera testu-corpus eskergak prozesatzeko. Zuhaitz Beloki, Xabier Artola and Aitor Soroa.
  • Euskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzea. Antton Gurrutxaga, Iñaki Alegria and Xabier Artola.
  • Izen-aipamenak desanbiguatu eta Wikipediara lotzen. Ander Barrena, Eneko Agirre, Jokin Perez de Viñaspre and Aitor Soroa.
  • Korreferentzia-ebazpena euskaraz idatzitako testuetan. Ander Soraluze Irureta, Olatz Arregi Uriarte, Xabier Arregi Iparragirre and Arantza Diaz de Ilarraza Sanchez.

Gainera, horiez gain euskarazko HAP masterraren beste ikasle-ohi hauek ere agertzen dira:

  • Corpusetan oinarritutako hiztegi elebidun berria sortzen. David Lindemann and Iñaki San Vicente.
  • Weba euskarazko corpus gisa. Igor Leturia.
  • Audio albistegietatik informazioa erauzten duen sistema eleaniztuna- Komunikazio zubiak sortzen. Nora Barroso, Karmele Lopez de Ipiña, Pilar Maria Calvo, Carmen Hernandez, Aitzol Ezeiza, Unai Susperregi, Simeon Barroso and Odei Barroso.
  • Polaritate lexikoak azkar eta merke . Iñaki San Vicente and Xabier Saralegi.

Euskarazko eta gaztelaniazko izen+aditz konbinazioak lantzen

Konbitzul datu-baseak euskarazko eta gaztelaniazko izen+aditz konbinazioei buruzko informazioa biltzen du. Konbinazioen eta euren ordainen ezaugarri morfosintaktiko zein semantikoei begiratu diegu, eta bi hizkuntzak parez pare jarri ditugu, zer alde eta antzekotasun duten aztertzeko.

Konbitzul_Zubiak_eraikiBilatzailea atalean, datu-basean jasota dauden hitz-konbinazioak eta ordainak bilatu daitezke, hainbat irizpideren arabera:

  1. Hizkuntza-norantza: euskaratik gaztelaniara ala gaztelaniatik euskarara.
  2. Bilatu nahi den testuaren forma: konbinazio osoa, aditza edo izena.
  3. Informazio linguistiko gehigarria: euskara-gaztelania zentzuan, euskarazko izenaren kasu- edo postposizio-marka; gaztelania-euskara zentzuan, gaztelaniazko konbinazioaren egitura.

UxoaIñurrietaDatu-base hau IXA taldeko Uxoa Iñurrietak doktoretza-tesirako egin duen lan baten emaitza da. Lankidetzan aritu da beste hauekin ere: Itziar Aduriz, Mikel Artetxe, Arantza Díaz de Ilarraza, Gorka Labaka, Kepa Sarasola eta Ruben Urizar.

Informazio zehatzago nahi izanez gero ikusi artikulu berri hau:

Izen+aditz konbinazioen azterketa elebiduna, hizkuntza-aplikazio aurreratuei begira
Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka eta Kepa Sarasola 2014, Linguamatica 6.2 (2014): 45-55.

Hona hemen Konbitzul datu-basean egin ditzakezun galderetako batzuk:

Konbitzul_TenderKonbitzul_tender_puentes