31 eskutik bloga

31 eskutik bloga EIZIEk jarri zuen abian 2012an, egunero euskararen erabilerari buruzko testu bat argitaratzeko, xede gutxi-asko didaktikoz idatzia.

31eskutikTalde-bloga da, egunero testu bat jartzeko, 31 lagunek idazten dute, hilean behin. Alor askotako kideak bildu dira: irakaskuntzakoak, komunikabideetakoak, itzultzaileak, idazleak, ikertzaileak, hiztegigileak…
Ixa taldeko kidea den Itziar Aduriz Agirre, Bartzelonako Unibertsitateko irakaslea eta UEUkidea dena, martxoan hasi da blog horretan. Honezkero bi artikulu bidali ditu

  • Euliak eta Kanoiak. Teoria-hizkuntzalaritza eta hizkuntzalaritza praktikoaren arteko harremanaz aritzen da. Anekdota bat ere kontatzen du: Hizkuntzalaritza konputazionala Euskaltzaindiko biltzar batean estreinakoz aurkeztuta, Piarres Xarriton altxatu eta bere iritzia bota zuen: ez ote ginen ari euliak kanoikadaz hil nahian.
  • Tristura. Kontakizun goxoa euskarazko tristura hitz horren itzulpena zein zaila den aurkezteko.  “… «ama, zer duzu?» galderari, «tristura» erantzuten zuen, eskua sabelaren gainean jartzen zuen bitartean”

Igone Zabala Ixakide berriak ere berri batzuk bidali ditu 31 eskutik blogera:

  • Corpusak eta hiztegiak artikuluan corpus eta hiztegien mugak aztertzen ditu estimatu / estimazio / estimatzaile lemen adierak aztertuta.“Hiztegiek corpusek egiten dituzten argazkiak interpretatzen dituzte eta zenbat eta argazki gehiago eta enfokatuago eduki, orduan eta informazio hobea eskainiko diete erabiltzaileei.”
  • Corpusen adierazgarritasuna artikuluan agurtzen ditu 2013an argitaratu diren corpus handi berriak “ezinezkoa zait ezikusia egitea urte honen hasieran euskal corpusgintzak eman digun uzta oparoari“. Eta eztabaidatzen du ea Egungo Testuen Corpusa (ETC) corpusa benetan ereduzkoa edo nonbait oportunista den.

Blog interesgarria da. Hizkuntza-teknologiaren bidez sortutako baliabideak aipatu, erabili eta eztabaidatzen dira bertan. Gure blogeko esteken artean sartu dugu.

 

Hitzaldia. Adam Kilgarriff: Nola ezagutu zure corpus hori. (2012/11/07)

Gero eta errazago da norberak corpus bat biltzea, saretik jasotako hainbat testu bilduta, adibidez. Baina… nola jakin modu erraz batean zelakoa den bildu dugun testu guzti hori?
Zelan bereizi eskura ditugun beste testu-bilduma batzuetatik?
Adam Kilgarriff aditua da corpusen sorkuntzan eta azterketan.

Gaia: Getting to Know Your Corpus  (Nola ezagutu zure corpus hori)
Hizlaria: Adam Kilgarriff (Brightoneko Lexical Computing Ltd. enpresako zuzendaria)
Eguna: azaroaren 7an, asteazkena
Ordua: 16:00
Tokia:  3.2 aretoa. Informatika Fakultatea

Laburpena
Corpora are not easy to get a handle on. The usual way of getting to grips with text is to read it, but corpora are mostly too big to read (and not designed to be read). We show, with examples, how keyword lists (of one corpus vs: another) are a direct, practical and fascinating way to explore the characteristics of corpora, and of text types. Our method is to classify the top one hundred keywords of corpus1 vs: corpus2, and corpus2 vs: corpus1. This promptly reveals a range of contrasts between all the pairs of corpora we apply it to. We also present improved maths for keywords, and quantitative comparisons between corpora. All the methods discussed (and almost all of the corpora) are available in the Sketch Engine, a leading corpus query tool.