Ikergazteko sari bana Begoña Altuna eta Olatz Perez de Viñasprerentzat

IkerGazte biltzarrean Ixa Taldeko 10 artikulu egotea pozgarria zen, euskaraz ematen dugun HAP_LAP masterreko  ikasle ohien artikuluak 14 izatea ere bai, eta gainera ostiralean sorpresa izan genuen:  Ikergazteko 2 sari:

 

  • olatzUdalbiltzak banatutako sari berezia (Euskal Herriko garapenari ekarpen garrantzitsuena egiten diona):
    Olatz Perez de Viñasprerentzat izan da
    Osasun-txosten elebidunak posible ote?” lanarekin.
    Ikus Ikergazteko artikulu-bilduma (orriak: 730-738)

ZORIONAK DENEI !!   :-)

2015-16ko masterrean izena emateko epea maiatzaren 31ra arte.

HAP_irudi_DiptikoaHAP/LAP masterra
Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing

Ikasi nahi duzu gurekin zer egin daitekeen konputagailuekin hizkuntza aztertzeko eta aplikazioak sortzen? Begiratu Interneteko orri hauetan:

  • Erabiltzen duzu translate.google.com zerbitzuan ematen duen itzuli dokumentu bat aukera?
    Gmail-en itzuli dituzu mezuak euskarara klik bakar batean?
    Zuk esan esaldi bat euskaraz eta ingelesera pasatzen dizu. Probatu duzu telefonoan?
  • Deskargatu duzu Mitzuli aplikazioa telefonora? Honek ere testua, audio eta irudiak itzultzen ditu 50 hizkuntza-bikoeetarako, librea da… eta HAP master honetako ikasle batek sortu du!
  • Euskarara itzultzeko ere bai: Matxin (Elhuyar-Ixa) eta Itzultzailea (Eusko Jaurlaritza)
  • Segapoto-ren laguntzaz bertso bat osatu eta lagunei bidali diezu? Hori ere HAP master honetako ikasleek sortua da!
  • IBM-Watson Telebistako Jeopardy programan galderak erantzuten pertsonei irabazi zien programa.
  • http://start.csail.mit.edu/index.php   Galdetu: `How far is Bilbao from London?’
  • Siri-rekin hitz egin duzu?
  • http://news.google.com/
    Nola egiten dute albiste bilduma hori etengabe automatikoki eguneratuta mantentzeko?
  • Loquendo, Nuance, Aholab: Entzun nola irakurtzen dituen zuk idatzitako testuak.
  • Ikusi duzu testu-prozesadoretako ‘Autosummarize’ edo ‘Autoabstract’ tresna?
  • Zein kantariren alde agertzen da txio gehien Twitter-en?  LaVoz-Alicanteko Unibertsitatea
  • Kartelak 20 hizkuntzatan?? QRak erabilita Albaola museoan posiblea da
  • http://www.yourdictionary.com/languages.html
    900 hiztegi kontsultagarri ingeleserako, 300 espainierarako, 9 euskararako.
  • Bilatu dituzu elurrarrekin (snow) zerikusirik duten hitzak OneLook hiztegi-zerbitzuan?
  • http://www.hiztegia.net: 50 hiztegi euskararako
  • Zein adjektiborekin erabiltzen da “mailegu” hitza? Bilatu Web-corpusen Atarian.
  • Oraindik ez duzu erabiltzen Euskalbar?
  • Badakizu ixa-pipes tresnak Ixa Taldean sortu dugula eta euskara, ingelesa eta espainiera analizatzeko oso baliagarria dela.

2001-02 ikasturtetik gabiltza teknologia hauek zabaltzen master mailan.
Gure ikasle ohiek 2015eko IkerGazte kongresuan 14 artikulu aurkeztu dituzte :-)

10 artikulu IkerGazte kongresuan!

Durangon ikerlari gazteak biltzen dituen IkerGazte biltzarrean 10 artikulu datoz Ixa taldetik. Ixa Taldeak parte hartze oso handia dauka. Euskaraz ematen dugun HAP masterraren ikasle-ohien artikuluak guztira 14 dira :-)

Osteguneko artikuluak:

  • Euskararen Sorkuntza Automatikoa: lehen urratsak. Manex Agirrezabal, Itziar Gonzalez-Dios and Iñigo Lopez-Gazpio.
  • Euskararako HPSG gramatikaren lehen proposamena. Jon Alkorta.
  • Konbitzul: euskarazko eta gaztelaniazko izen+aditz konbinazioen datu-basea. Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka and Kepa Sarasola.
  • Euskarazko denbora-egituren tratamendu automatikorako azterketa. Begoña Altuna.

Ostiralekoak:

  • Konbinatu eta Irabazi! Hitzen Semantikaren Errepresentazio Osoagoaren Bila. Josu Goikoetxea, Eneko Agirre and Aitor Soroa.
  • Lurrikarei buruzko informazioa eskuratzen Twitter bidez. Ander Intxaurrondo, Eneko Agirre and Oier Lopez De Lacalle.
  • Datu handien tekniken erabilera testu-corpus eskergak prozesatzeko. Zuhaitz Beloki, Xabier Artola and Aitor Soroa.
  • Euskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzea. Antton Gurrutxaga, Iñaki Alegria and Xabier Artola.
  • Izen-aipamenak desanbiguatu eta Wikipediara lotzen. Ander Barrena, Eneko Agirre, Jokin Perez de Viñaspre and Aitor Soroa.
  • Korreferentzia-ebazpena euskaraz idatzitako testuetan. Ander Soraluze Irureta, Olatz Arregi Uriarte, Xabier Arregi Iparragirre and Arantza Diaz de Ilarraza Sanchez.

Gainera, horiez gain euskarazko HAP masterraren beste ikasle-ohi hauek ere agertzen dira:

  • Corpusetan oinarritutako hiztegi elebidun berria sortzen. David Lindemann and Iñaki San Vicente.
  • Weba euskarazko corpus gisa. Igor Leturia.
  • Audio albistegietatik informazioa erauzten duen sistema eleaniztuna- Komunikazio zubiak sortzen. Nora Barroso, Karmele Lopez de Ipiña, Pilar Maria Calvo, Carmen Hernandez, Aitzol Ezeiza, Unai Susperregi, Simeon Barroso and Odei Barroso.
  • Polaritate lexikoak azkar eta merke . Iñaki San Vicente and Xabier Saralegi.

Rodrigo Agerri proiektu-aholkulari aurtengo Google Summer of Code-n

Gure lankide Rodrigo Agerri aukeratu dute aurtengo Google Summer of Code ekitaldiko proiektu baten aholkularia izateko (“mentor” izateko).
Proiektuaren gaia hitzen adiera-desanbiguazioa da (Word Sense Disambiguation – Supervised Techniques) eta Apache Software fundazioak aurkeztu du. Zorionak Rodri!

Google Summer of Code 2015: Onartutatako proiektu guztien lista.

Hitzaldia: Zurrumurruak antzeman eta tratatu Twitterren (A. Zubiaga, 2015/05/12)

Hizlaria: Arkaitz Zubiaga
………….University of Warwick

Eguna: Maiatzaren 12an, asteartean
Ordua: 15:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua:
Zurrumurruak antzematen eta aztertzen Twitter sare sozialean

Laburpena:
Twitter bezalako sare sozialak mundu osoko gertaerez informatuta egoteko tresna paregabea diren arren, kontu handiz hartu behar da bertan irakurritakoa, informazio guztia ez baita zehatza eta egiazkoa. Gezurren hedapenak garrantzi handia du, batik bat, azken orduko albisteen inguruan informazio berria jakinarazten den ahala. Aurkezpen honetan PHEME FP7 proiektuan sare sozialetan hedatzen diren zurrumurruen gainean egiten ari garen ikerketa lanaz arituko naiz. Hasteko, kazetariekin batera lan eginez Twitter bidez gertakizunak jarraitu ahala zurrumurruak antzeman eta ikerketarako aproposa den datu bilduma sortzeko definitu dugun prozesua azalduko dut. Zurrumurru hauen testuingurua osatzeko, erabiltzaileek zurrumurruen inguruan sortutako eztabaidak batu ditugu, eta crowdsourcing bidez txioak anotatu, adostasun, ezadostasun, eta abarrak markatuz. Zurrumurru hauen inguruko eztabaidak hizkuntzaren prozesamendua eta sare sozialen analisia baliatuz aztertzea dugu helburu proiektu honetan.

Biografia:
Arkaitz Zubiaga doktorego ondorengo ikertzailea da Warwickeko Unibertsitatean (Coventry, Ingalaterra). Sare sozialak ikertzen aritu da azken urteotan, testu meatzaritza aplikatuz edukia aztertzeko eta baita erabiltzaileen jarrera ulertzeko ere. Azkenaldian kazetari eta soziologoekin batera lan egin du PHEME FP7 proiektuan, ikuspegi informatikotik sare sozialetan zurrumurruen inguruan gertatzen diren elkarrizketak lantzeko.

Ixa taldea Parisen eta Galesen inbitatuta euskararentzat egindako lana aurkezteko

Azken hilabetean Europako bi herritatik inbitazioa luzatu digute hizkuntzaren prozesamendua alorrean euskararentzat egin dugun lana aurkezteko.

tlrf15

bangor3

Bangor2015_DSC_0016

Hitzaldia: Itzulpen automatikoaren ebaluazioa (C. España-Bonet, 2015/03/13)

Hizlaria: Cristina España i Bonet
Eguna: Martxoaren 13an, Ostirala
Ordua: 15:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)

Hitzaldiaren izenburua:
MT evaluation: A broad stroke on Machine Translation Evaluation
/ Pintzelkada zabal bat itzulpen automatikoaren ebaluazioaz”

Abstract:
Itzulpen automatikoaren ebaluazioa egiteko egun dauden neurriak aurkeztuko dira, eskuzkoak eta automatikoak. Zer dator berri ildo horretatik? Bukaeran ebaluazioa egiteko zenbait tresna azalduko dira, bereziki UPCan sortutako Asiya Toolkit.

Euskarazko eta gaztelaniazko izen+aditz konbinazioak lantzen

Konbitzul datu-baseak euskarazko eta gaztelaniazko izen+aditz konbinazioei buruzko informazioa biltzen du. Konbinazioen eta euren ordainen ezaugarri morfosintaktiko zein semantikoei begiratu diegu, eta bi hizkuntzak parez pare jarri ditugu, zer alde eta antzekotasun duten aztertzeko.

Konbitzul_Zubiak_eraikiBilatzailea atalean, datu-basean jasota dauden hitz-konbinazioak eta ordainak bilatu daitezke, hainbat irizpideren arabera:

  1. Hizkuntza-norantza: euskaratik gaztelaniara ala gaztelaniatik euskarara.
  2. Bilatu nahi den testuaren forma: konbinazio osoa, aditza edo izena.
  3. Informazio linguistiko gehigarria: euskara-gaztelania zentzuan, euskarazko izenaren kasu- edo postposizio-marka; gaztelania-euskara zentzuan, gaztelaniazko konbinazioaren egitura.

UxoaIñurrietaDatu-base hau IXA taldeko Uxoa Iñurrietak doktoretza-tesirako egin duen lan baten emaitza da. Lankidetzan aritu da beste hauekin ere: Itziar Aduriz, Mikel Artetxe, Arantza Díaz de Ilarraza, Gorka Labaka, Kepa Sarasola eta Ruben Urizar.

Informazio zehatzago nahi izanez gero ikusi artikulu berri hau:

Izen+aditz konbinazioen azterketa elebiduna, hizkuntza-aplikazio aurreratuei begira
Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka eta Kepa Sarasola 2014, Linguamatica 6.2 (2014): 45-55.

Hona hemen Konbitzul datu-basean egin ditzakezun galderetako batzuk:

Konbitzul_TenderKonbitzul_tender_puentes

Hitzaldia: Biomedikuntzazko erlazioen erauzketa (Roland Roller, 2015-01-28)

Hizlaria:  Roland Roller (University of Sheffield)

Eguna: Urtarrilaren 28an, asteazkena
Ordua: 17:00
Tokia: 3.2 gela. Informatika Fakultatea
Izenburua: “Biomedical Relation Extraction using Distant Supervision  / Biomedikuntzazko erlazioen erauzketa urrutizko gainbegiraketa erabilita ”

Testuan gako diren entitateen arteko erlazioak automatikoki erauztea zeregin garrantzitsua da. Adibidez, botika eta botiken ondorio kaltegarrien arteko erlazioak testuetatik automatikoki erauzteko erabiltzen da. Gainbegiratuko ikasketa automatikako teknikek frogatu dute hurbilketa eraginkorra izan daitezkeela erronka horri ekiteko.