Sei puntu aipa ditzakegu nazioartekoan:
- Powerset
- Hakia
- Google (Ohiko galderak erantzutea /Question Answering)
- Google (Hizkuntzen arteko bilaketa /CLIR Cross Lingual Information Retrieval)
- Google (Esaldiko hutsuneak bete / Fill-in-the-blank search )
- Google (lematizazioa, hutsuneak bete )
Ez da egin aurkezpen ofizialik tresna berri horiekin, apurka-apurka eta ixilik ari dira azaltzen, baina hor daude.
Azken asteetan, baina, gaia pil-pilean egon da Microsoft-ek Powerset (sarearen analisi sintaktikoa egiten ari zen bilatzailea) erosi omen duelako.
Berri onak dira Hizkuntza-teknologiaren alde apustua egin dugunontzat.
Erantzunak
Nik uste dut galdera-erantzunen datu-base bat dutela, eta horretan oinarritzen direla aurrez definitutako hainbat galderei erantzuteko. Gai da, esate baterako, munduko herrialde baten azalera edo populazioa zein den galdetzen diogunean erantzuteko. Baina informazioaren erreferentzia bezala beti ematen digu CIAren webgunea, edo hala gertatu zait niri behintzat; badirudi, beraz, bertako datuak prozesatu dituztela, eta hori ez doa informazio erauzketa prozesu sinple batetik haratago.
Proba egin dut, halaber, 'what is the population of the Basque Country?' galdetuz, eta ez daki erantzuten... CIAren webgunean ez dagoelako?
Ondo dago, baina asko falta zaio oraindik, ezta?
Nork: Arkaitz.2008/07/16 11:56:36.999 GMT+2
http://www.mutilmedia.com
ez da hain sinplea. Beraiek informazioa erauzteko prozesadore automatikoak dauzkate, eta horien emaitza oso fidagarria dela dakitenean bakarrik erabiltzen dute. Horrekin datu base bat elikatzen dute bai, baina LNP erabiltzen ari dira, eta ez eskuzko lana.
Galdetu "When did Hitler die?". Halako batzuk erauzi dituzte (webgune oso ezberdinetatik), baina ez pertsonaia historiko guztietarako.
Nork: Eneko.2008/07/21 11:30:53.794 GMT+2