Utikan bilatzaile erdaldunak!

Normalean usatzen ditugun Internet bilatzaileak, Google edo Yahoo! esaterako, ez daude pentsatuta euskarazko testuetan bilaketak egiteko. Lehenik eta behin ez dakite euskaraz, hots, ez dira gai euskaraz dagoen testu bat beste hizkuntza batean dagoenaz bereizten.

Har dezagun Google akuri moduan, bera baita bilatzaileetan nagusia. Interfacea euskaraz ipin dezakezu zure ordenadorean. Era berean, ‘Hizkuntza Tresnak’ dioen atalean sartzen baldin bazara, aukera izango duzu zein hizkuntzatan egin nahi duzu bilaketa. Zerrenda luzea zabaltzen zaizu begien aurrean, baina euskara hautagai moduan ez dager. Horrek zer esan nahi du? Ba, erdararen batean grafia bera duen euskal hitz baten arabera bilaketarik egiten baduzu, demagun energia, ezingo dituzula bilaketa-emaitzak euskarazkoetara mugatu. Katalana edo italiarra izango bazina, aukera izango zenuke emaitzak zedarritzekoa, hurrenez hurren, katalanezkoetara edo italierazkoetara soilik. Energia hitzaren kasuan euskarazko emaitzaren bat aurkitu nahi duen euskal internautak, topatuko luke euskarazkorik hamarnaka batzuk emaitza-orrialde arakatu ostean!

Euskal hiztunak urriak gara eta ez gara bezero erakargarriak munduan dabiltzan multinazionalentzat.

Irakurleak pentsa lezake arazo hori hainbat hizkuntzatan grafia bera duten hitzekin baino ez dela jazotzen; euskarazko hitz jatorrekin horrelakorik ez dela gertatuko. Saia gaitezen ama, aita, eska, aska edo ele euskal hitz jatorrekin. Lehen emaitzetan, bederen, euskarazkorik ez. Hitz monosilabiko eta bisilabikoekin aukera handiagoa dago grafia bereko hitzen bat egotea beste mintzairaren batean edo halako sozietateren edo prozesuren sigla izatekoa. Dagigun froga hitz luzeago batekin, erbinude etsenplurako. Idatzi erbinude bilatzailearen kutxatxoan. Oraingoan, bingo! Emaitzak euskarazkoak dira guztiak. Pentsa dezakezu euskarazko hitz jator luzeekin behintzat molda zaitezkeela bilatzaile arrunt bat baliatuz, baina ez da horrela eta gertaera horrek ohizko Internet bilatzaileen bigarren ahulezia jartzen du agerian.

Euskara hizkuntza aglutinatzailea da, alegia, atzizki bidez seinalatzen du hitz batek izan ditzakeen kasuak edo perpausean duen funtzioa. Arestiko kasuan nominatibo mugagabean tekleatu duzu erbinude eta makinak euskaraz ez dakienez, horixe bilatu dizu otzan-otzan. Alabaina, erbinudea, erbinudeei eta enparauak ahaztu egin ditu. Esan nahi baita, ez dizu informazio osoa eman.

Bada, euskal internautak amaraunean informazio bila dabilenean dituen bi problema nagusi horiei konponbide ematera dator Elekak garatu duen Elebila. Zintzo jokatzeko, aitor dezadan, Elebilaren oinarrian dagoen teknologia Elhuyar Fundazioaren I+G sailak garatutakoa dela eta Elekak hori zerbitzu bilakatu duela.

Elebilak euskarazko informazioa baino ez dio ematen xerka egin duenari, berdin zaiolarik bilakizuna hainbat hizkuntzatan igual idatzi. Elebilak diskriminatu egiten du informazioa euskaraz idatzita dagoenentz eta berdin zaio web gunearen informazio gehiena beste hizkuntza batean egotea edo gunera IP antipodetakoa izatea. Web guneren batean euskarazko informaziorik baldin badago, aurkitu egingo du. Halaber, sorkuntza morfologikoari esker hitz baten araberako bilaketa egiten denean, hitz horren deklinazio-kasuak automatikoki sortzen dira eta horren arabera egiten du bilaketa. Hortaz, berdin dio energia, energiaren edo energiak idaztea, sistemak hitza analizatuko baitu, horren lema erauzi eta horren arabera egingo du bilaketa. Zenbait kasutan, gainera, oker idatzita ere emaitzak egokiak izango dira; esaterako energi gure kasuan.

Elebilak aldaera dialektalak eta forma ez-estandarrak ere kontuan hartzen ditu. Kasu guztietan ez da hori posible, arrazoi teknologikoak medio, baina ahal den guztietan eman egiten da erabiltzaileari bilaketa-aukerak zabalduz. Etsenplurako, pilotari forma estandarra bilatzen duenean, emaitzekin batera erabiltzaileari galdetzen zaio ea pelotari forma ez-estandarraren arabera ere bilaketa egin nahi ote duen.

Elebilak euskaldungoari egiten dio ekarpenak emaitzen zehaztasunaren esparrua gainditzen du. Euskarazko informazioa eskaintzean, euskaldunari nahigabeko itzultzaile automatikoa ez izateko modua ematen dio. Adibideez, euskal ikasleak ez du ibili behar izango gaztelaniaz edo beste erdara batez informazioan leitu, buruan prozesatu eta euskaraz ematen. Euskaraz jasotzeko aukera izango du. Horrek euskararen estandarizazioari eta euskararen kalitatea hobetzeari bultzada handia emango dio; ez da asmatzen ibili beharko termino hau edo hura euskaraz nola eman, fraseologia hori nola eman den galdetuta,… ereduak begien aurrean izango dira, eredu egokiak bilatzen jakiten bada, noski.

Bukatzeko xehetasun pare bat. Elekakook ez dugu asmatu Internet arakatzen dabilen karramarro horietako bat, baizik eta horiek sortzen duten informazioaren gainean lan egiten duen tresna bat. Tresna horrek bi gauza egiten ditu: euskarazko testuak diskriminatu eta euskararen berezko nortasun gramatikala kontuan hartu. Elebilaren atzean Live Search Microsoft-en motorra dago. Beste edozein izan zitekeen, baina baldintza tekniko-ekonomiko egokienak Seattle-ko multinazionalak eman dizkigu

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude