Elkarrizketa Uxoa Iñurrieta-rekin unibertsitatea.net-en

Uxoa Iñurrieta gure ixakidearekin elkarrizketa bat argitaratu dute Unibertsitatea.net webguneko Ziztu-bizian albistegian. Izenburuaren arabera Uxoak hau aurrikusten du: “Oso zaila izango da esaldi konplexuenak ere zuzen-zuzen itzuliko dituen tresnarik lortzea”

Uxoa tesia egiten ari da HAP-LAP programaren barruan. Hona hemen elkarrizketako galdera eta erantzun pare bat:

Konbitzul datu-basea daukazu esku artean; zer da?
Konbitzul datu-baseak izen+aditz motako konbinazioei eta haien itzulpenari buruzko informazioa jasotzen du. Hizkuntzaren prozesamenduari begira sortua da, eta baliagarria da hainbat aplikazio informatikotarako, itzultzaile automatikoetarako, kasu. Edo hala espero dugu, behintzat!

Zein da bere aplikazio praktikoa? Zertarako balia daiteke datu-base hau?
Demagun, adibidez, itzultzaile automatiko batek “adarra jo” esapidea gaztelaniara itzultzea nahi dugula. Ordenagailuak, guk informaziorik eman ezean, bi hitz horiek irakurri eta “tocar/pegar el cuerno” bezalako zerbait sortuko luke, ez bailuke jakingo benetako esanahia zein den. Bada, Konbitzulen sartzen ari garen datuek horrelakoak hobeto itzultzeko balioko dute.

Xuxen5: harrera oso ona 4000 deskargarekin

Xuxen%_Artola_tolosaldeko Elkarrizketa bat egin diote Ixakidea den Xabier Artola ikerlariari  Toloasaldeko Ataria aldzkarian, besteak beste Xuxen5 programaren bertsio berriaz aritu izan dira. Azalpen sakonak azaldu dira hor: adibidez hauek:

“Orokorrean jendeak Worden atzean dagoen zuzentzailea Xuxen dela uste du, baina ez da horrela. Microsoftek eginiko euskarazko zuzentzaile «kaxkar» bat da. Xuxen norberak bere ordenagailuan edukitzeko norberak instalatu behar du xuxen.eus webgunetik.”

“Aipatzekoa da Elhuyarrek, azken bertsio honetan, bere baliabide propioak erabili behar izan dituela proiektua aurrera ateratzeko, ez baitugu diru laguntzarik jaso. Eusko Jaurlaritzak diruz lagundu izan ditu gure proiektu batzuk baina oraingo hau ez.”

Komunikabideetako beste albiste batzuk:

Pertsona batek ezin ditu milioika albiste irakurri, NewsReader-ek bai

Itziar_Aldabe_HitzaElkarrizketa bat egin diote Ixakidea den Itziar Aldabe ikerlariari Goierriko Hitza aldzkarian, besteak beste euskarak teknologian duen egoeraz eta berak lantzen duen  News Reader proiektu europarraz aritu dira:

Euskarak zer moduzko egoera du teknologia berrietan?

Normalean baliabideak behar dira. Ixa horregatik sortu zen, duela 27 urte. […] Euskara hor dago, eta ingelesarekin konparatzen bada, gauza batzuetan ez dago maila berean, baina beste gauza batzuetan bai.

Hizkuntza gutxituen artean, zer moduzko tokian dago euskara?

Ondo dago kokatuta, Ixa taldeari eta beste erakunde batzuei esker, Elhuyarri adibidez. Hizkuntza gutxituen artetik esango nuke, ondoena posizionatuta dagoena dela. Hemen urteak daramatzate baliabideak sortzen edo biltzen.

[…]

Euskararekin zer ikusirik ez duen Europako beste proiektu batean ere ari zara lanean.

Bai, News Reader proiektua da. Beste bi unibertsitaterekin eta hiru enpresekin ari gara lanean. Proiektu europarra da. Helburu nagusia finantza eta ekonomiako erabakiak hartzen laguntzeko gertaeren antzematea eta egituratzea burutzea da.NewsReaderAdibideren bat jar dezakezu?

Pentsa, enpresa bateko kargudun batek erabaki bat hartu behar duela; adibidez, beste enpresa bat erosi, bai ala ez erabaki behar duela. Enpresa horri bu- ruzko informazioa egunkari eta iturri desberdinetatik jaso daiteke. Informazio hori gainera hizkuntza desberdinetan egongo da. Baina pertsona batek ezin ditu milioika albiste irakurri. Gu, informazio horren guztiaren kronologia eta laburpena egingo duen tresna bat sortzen ari gara. Informazio guztia automatikoki prozesatzeko edo irakurtzeko gai den eta modu kronologiko batean zer gertatzen ari den modu bisualean agertuko duen tresna.

Zein hizkuntzatarako ari zarete tresna hori prestatzen?

Lau hizkuntzatarako ari gara lanean: ingelesa, gaztelera, italiera eta nederlandera, proiektuaren liderra bertakoa delako.

 

Eloína Miyares lankide kubatarra hil zaigu

Eloína_f0040405

Eloína Miyares Bermúdez. (Argazkia: Ecored)

Santiago de Cubako Centro de Lingüística Apli­cada (CLA) zentroko  sortzaileetako bat izan zen Eloína Miyares Bermúdez irakaslea uztailaren 26an hil zaigu gaixotasun luze baten ondorioz.

Ixa taldetik agur eta ohore.
Geratzen zaizkigu zure ekarpenak:

IXA taldea lankidetzan aritu izan da azken 14 urteetan CLA ikergunearekin. Hortik atera da, adibidez, Diccionario Básico Escolar (DBE) hiztegi hori (digitala eta paperezkoa). Hiztegia XMLz kodetuta dago, eta hiztegiak editatzeko Ixa taldean garatu zen leXkit izeneko ingurunea erabiltzen da.

Agur Eloína

Eskaintzen ditugun masterrak eta itzulpengintzako graduondokoa

Ixa Taldeak bi master eta graduondoko bat eskaintzen ditu datorren ikasturterako.
Ingeniarientzat, filologo-linguistentzat eta itzultzaileentzat dira.
Orain da matrikulatzeko garaia:
HAP-LAP_Bideo_collage

Bideoa: HAP-LAP masterreko protagonisten iritzia

Mitzuli itzultzaileak 10.000 deskarga

Mitzuli_10000Deskargatu duzu Mitzuli aplikazioa android telefonora?

Testua, audio eta irudiak ere itzultzen ditu 50 hizkuntza-bikoteetarako, librea da… eta gure taldeko kide eta HAP masterreko ikasle den Mikel Artetxek sortu du!

Honezkero 10.000 deskarga izan ditu.
Zorionak eta eskerrik asko, Mikel!

 

Ikusi, ikusi albiste hauek:

2015-16ko masterrean izena emateko epea maiatzaren 31ra arte.

HAP_irudi_DiptikoaHAP/LAP masterra
Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing

Ikasi nahi duzu gurekin zer egin daitekeen konputagailuekin hizkuntza aztertzeko eta aplikazioak sortzen? Begiratu Interneteko orri hauetan:

  • Erabiltzen duzu translate.google.com zerbitzuan ematen duen itzuli dokumentu bat aukera?
    Gmail-en itzuli dituzu mezuak euskarara klik bakar batean?
    Zuk esan esaldi bat euskaraz eta ingelesera pasatzen dizu. Probatu duzu telefonoan?
  • Deskargatu duzu Mitzuli aplikazioa telefonora? Honek ere testua, audio eta irudiak itzultzen ditu 50 hizkuntza-bikoeetarako, librea da… eta HAP master honetako ikasle batek sortu du!
  • Euskarara itzultzeko ere bai: Matxin (Elhuyar-Ixa) eta Itzultzailea (Eusko Jaurlaritza)
  • Segapoto-ren laguntzaz bertso bat osatu eta lagunei bidali diezu? Hori ere HAP master honetako ikasleek sortua da!
  • IBM-Watson Telebistako Jeopardy programan galderak erantzuten pertsonei irabazi zien programa.
  • http://start.csail.mit.edu/index.php   Galdetu: `How far is Bilbao from London?’
  • Siri-rekin hitz egin duzu?
  • http://news.google.com/
    Nola egiten dute albiste bilduma hori etengabe automatikoki eguneratuta mantentzeko?
  • Loquendo, Nuance, Aholab: Entzun nola irakurtzen dituen zuk idatzitako testuak.
  • Ikusi duzu testu-prozesadoretako ‘Autosummarize’ edo ‘Autoabstract’ tresna?
  • Zein kantariren alde agertzen da txio gehien Twitter-en?  LaVoz-Alicanteko Unibertsitatea
  • Kartelak 20 hizkuntzatan?? QRak erabilita Albaola museoan posiblea da
  • http://www.yourdictionary.com/languages.html
    900 hiztegi kontsultagarri ingeleserako, 300 espainierarako, 9 euskararako.
  • Bilatu dituzu elurrarrekin (snow) zerikusirik duten hitzak OneLook hiztegi-zerbitzuan?
  • http://www.hiztegia.net: 50 hiztegi euskararako
  • Zein adjektiborekin erabiltzen da “mailegu” hitza? Bilatu Web-corpusen Atarian.
  • Oraindik ez duzu erabiltzen Euskalbar?
  • Badakizu ixa-pipes tresnak Ixa Taldean sortu dugula eta euskara, ingelesa eta espainiera analizatzeko oso baliagarria dela.

2001-02 ikasturtetik gabiltza teknologia hauek zabaltzen master mailan.
Gure ikasle ohiek 2015eko IkerGazte kongresuan 14 artikulu aurkeztu dituzte 🙂

10 artikulu IkerGazte kongresuan!

Durangon ikerlari gazteak biltzen dituen IkerGazte biltzarrean 10 artikulu datoz Ixa taldetik. Ixa Taldeak parte hartze oso handia dauka. Euskaraz ematen dugun HAP masterraren ikasle-ohien artikuluak guztira 14 dira 🙂

Ikusi kongresua laburbiltzen duen BIDEOA
Ikusi kongresuko komunikazio guztiak biltzen dituen LIBURUA

Osteguneko artikuluak:

  • Euskararen Sorkuntza Automatikoa: lehen urratsak. Manex Agirrezabal, Itziar Gonzalez-Dios and Iñigo Lopez-Gazpio.
  • Euskararako HPSG gramatikaren lehen proposamena. Jon Alkorta.
  • Konbitzul: euskarazko eta gaztelaniazko izen+aditz konbinazioen datu-basea. Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka and Kepa Sarasola.
  • Euskarazko denbora-egituren tratamendu automatikorako azterketa. Begoña Altuna.

Ostiralekoak:

  • Konbinatu eta Irabazi! Hitzen Semantikaren Errepresentazio Osoagoaren Bila. Josu Goikoetxea, Eneko Agirre and Aitor Soroa.
  • Lurrikarei buruzko informazioa eskuratzen Twitter bidez. Ander Intxaurrondo, Eneko Agirre and Oier Lopez De Lacalle.
  • Datu handien tekniken erabilera testu-corpus eskergak prozesatzeko. Zuhaitz Beloki, Xabier Artola and Aitor Soroa.
  • Euskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzea. Antton Gurrutxaga, Iñaki Alegria and Xabier Artola.
  • Izen-aipamenak desanbiguatu eta Wikipediara lotzen. Ander Barrena, Eneko Agirre, Jokin Perez de Viñaspre and Aitor Soroa.
  • Korreferentzia-ebazpena euskaraz idatzitako testuetan. Ander Soraluze Irureta, Olatz Arregi Uriarte, Xabier Arregi Iparragirre and Arantza Diaz de Ilarraza Sanchez.

Gainera, horiez gain euskarazko HAP masterraren beste ikasle-ohi hauek ere agertzen dira:

  • Corpusetan oinarritutako hiztegi elebidun berria sortzen. David Lindemann and Iñaki San Vicente.
  • Weba euskarazko corpus gisa. Igor Leturia.
  • Audio albistegietatik informazioa erauzten duen sistema eleaniztuna- Komunikazio zubiak sortzen. Nora Barroso, Karmele Lopez de Ipiña, Pilar Maria Calvo, Carmen Hernandez, Aitzol Ezeiza, Unai Susperregi, Simeon Barroso and Odei Barroso.
  • Polaritate lexikoak azkar eta merke . Iñaki San Vicente and Xabier Saralegi.

Rodrigo Agerri proiektu-aholkulari aurtengo Google Summer of Code-n

Gure lankide Rodrigo Agerri aukeratu dute aurtengo Google Summer of Code ekitaldiko proiektu baten aholkularia izateko (“mentor” izateko).
Proiektuaren gaia hitzen adiera-desanbiguazioa da (Word Sense Disambiguation – Supervised Techniques) eta Apache Software fundazioak aurkeztu du. Zorionak Rodri!

Google Summer of Code 2015: Onartutatako proiektu guztien lista.

Ixa taldea Parisen eta Galesen inbitatuta euskararentzat egindako lana aurkezteko

Azken hilabetean Europako bi herritatik inbitazioa luzatu digute hizkuntzaren prozesamendua alorrean euskararentzat egin dugun lana aurkezteko.

tlrf15

bangor3

Bangor2015_DSC_0016