Erabiltzaile Tresnak


hizt:4

Lexikoa atzo eta gaur (LAG)

Hiztegi osoa ikusteko, egin klik hemen.

Xedea

Hemen aurkezten den Lexiko honen xedea hitz zerrendan bildutako sarrera bakoitzaren erabilera aztertzea da. Erabilera historian zehar, eta erabilera gaur egun. Hortaz, konparazio bat egiten da lexiko honetan, ikusteko, azken batean, zein den hitz edo sarrera bakoitzaren joera: delako hitz hau lehen baino gehiago erabiltzen da gaur egun? Lehen baino gutxiago? Lehen bezala?

Konparazioaren iturriak

Konparazioak egiteko bi iturri nagusi erabili dira: batetik, historiari dagokionez, Orotariko Euskal Hiztegiak (OEH hemendik aurrera) ematen duen informazioa hartu da kontuan. Erabilera sinkroniko edo egungorako, berriz, Ereduzko Prosa Gaur dago, (EPG hemendik aurrera), 2000-2006 urte bitarteko 25 milioi testu-hitzetatik gorako corpusa biltzen duena. Corpus horren gainean osatua dago Hiztegi Batua Euskal Prosan (HBEP, aurrerantzean), EGPren lexiko zerrenda bezala defini daitekeena. Azken batean, eta guri interesatzen zaigun alderditik, egungo lexiko erabileraren maiztasun eta estatistika datutegi aski osatua eskaintzen diguna. Lehenbizikoak, OEHk, tradizioa biltzen du, hasieratik batasuna abian jarri zen uneraino, 1970. urteraino, gutxi gorabehera. Bigarrenak gaurko prosa hartzen du kontuan, bai liburuetan ageri dena, eta bai prentsan erabiltzen dena.

Helburua, beraz, batak eta besteak ematen dizkiguten datuak konparatzea da, lexikoaren eboluzioa erabileraren bitartez neurtuz. Jakina denez, hizkuntzak ez dira zer estatiko batzuk, denborarekin eboluzionatu egiten dute, aldatu egiten dira, eta lexikoa da transformazio hori neurtzeko modu esanguratsuetako bat.

Aurkezten dena zer den

Sarrera bakoitzari dagokion informzio nagusia orrialdearen erdi-erdian ageri da. Badira hor, hala ere, beste erlaitz batzuk:

  • OEH-EPG aldeak
  • OEH barruko aldeak
  • Autoritateak
  • Agerpenak
  • Guztiak

Ikus dezagun zer esan nahi duen horrek. Azkenetik hasteko: hitzen bilaketa autoritateak (idazleak) bakarrik kontuan hartuz egin daiteke: hitz bat, demagun, 5 idazlek erabili dute, eta beste bat 13k. Horren arabera egiten da sailkapena. Edo, bilaketa, ageri diren adibideak kontuan izanik egin daiteke: hitz bat hamar aldiz ager daiteke (bi autore bakarrik erabilia), eta beste bat 6 aldiz (baina 6 autore desberdinek erabilia). Ikusten denez, bi irizpide dira horiek, elkarren artean osatzen direnak. Gerta daikete beherago azalduko ditugun erabileren joerak paraleloak izatea bi sailetan, edo ez etortzea bat. Hala delarik, ikusi beharko da zergatik gertatzen den hori. Azkenekoz, bi sailak aukera daitezke “guztiak” erlaitza sakatuz: hor ematen da informazio osoa aldaera horiek guztiak kontuan hartuz. Konparazioak egungo euskararen (EPG) eta tradizioarekin (OEH) egiten dira, alde batetik, berehala ikusiko den gisan. Eta OEH-ren barnean ere. Hori da ondoren azalduko duguna.

Tradizioko bi faseak, eta egungo euskara

Eboluzioa kontuan izateko, egungo euskara (EPG) eta tradizioa (OEH) konparatzen dira, baina tradizioari dagokionez (OEHri dagokionez), bi modutara aurkezten da informazio hau:

  • Tradizioa hasieratik XIX. mendea bukatu arte: OEH19 deitu dugu hau.
  • Tradizioa hasieratik batasuna hasi zen arte: OEH deitu dugu.

Hitzen erabilerari buruzko informazioa 0-10erainoko eskala baten bitartez aurkezten da, eta koloreak ere erabiltzen dira, geziekin batera.

Informazioa honela dago antolatua. Jo dezagun, kasurako, “mamu” sarrera. Jakin nahi dugu hitz horren erabiltzeko joera zein den. Hitzean klikatuz, hau ageri da:

Horrek esan nahi du hitz hau gaur egun tradizioan baino pixka bat gehiago erabiltzen dela. Geziak gorantz egiten du, bi kasuetan: bai XIX. mendea bukatu arte (“2”, 0-10eko eskalan), eta bai XX. mendea ere kontuan hartuz (“1”, 0-10ko eskalan). Zenbaki hori handiagoa balitz, 6koa, demagun, horrek esan nahiko luke askoz ere gehiago erabiltzen dela gaur egun, lehen baino. Hori gertatzen da, esaterako, “ebaketa” hitzarekin:

Ikusten denez, hitz hori tradizioan askoz ere gutxiago ageri da: egungo erabilerak 5 hartzen du eskala horretan XIX. mende bukaeraraino iristen den tradizioarekin konparatuz, eta 2, berriz, XX. mendekoa ere barnean sartuz. Horrek esan nahi du XX. mendean gehiago erabiltzen zela aurreko mendeetan baino, eta orain are gehiago erabiltzen dela XX. mendean baino.

“Baldintzatu” hitza erabiltzeko joera, aldiz, aski berria da, ondoan ikusten denez:

Eskuin aldeko zutabetan ageri da zenbat idazlek edo iturburuk (“autoritateak”) erabiltzen duten hitza.

Idazleak eta adibide kopurua

Bilaketaren formularioan posible da autoritateez gain adibide edo agerpen kopurua (“adibideak”) ere aintzat hartzea, informazioa handituz horrela. Gerta daiteke sarrera bat askotan agertzea, adibide anitz agertzea (“agerpenak”), baina erabiltzaile gutxi izatea (“autoritate” gutxi, alegia). Edo, alderantziz, hitz batek nahiko erabiltzaile izatea, baina ez agertzea horrenbestetan. Hona hemen adibide bat:

Informazio bera da hau, baina hemen idazle kopuruak eta adibideak hartzen dira kontuan informazio bera emateko orduan. Ikusten denez, bai idazleak, bai adibideak kontuan harturik, “poz eman” sarreraren erabilera joera beherantz doa.

Orain arte egindako aurkezpen laburtu honekin uler daiteke informazioaren funtsa. Hemendik aurrera, informazio hau eskuratzeko erabili den prozedura azalduko da.

Informazioa bateratzea

OEH eta EPG oso iturburu desberdinak dira. Biek corpusa oinarri badute ere, EPG corpusa da, testu bilduma, baina OEH hiztegia da, sarreretan adibide ugari ageri baldin bada ere. Baina izaera diferenteko iturburuak dira. Lehenak datu estatistikoak eskaintzen ditu (HBEPren bitartez), baina OEHk ez.

Adibideen edo autoritate-aipamenen kopuru absolutuak erabat desberdinak dira, iturri batean eta bestean. Hori berdintzeko, eta nolabait ere datuak erkagarri bihurtzeko, balore guztien eskala erlatiboa sortzea erabaki da, 0tik 10erakoa. Iturburu bakoitzaren kopuru absolutuak balore erlatibo horietara bildu dira.

Datu estatistikoak erautzi

Lehen lana, beraz, OEHtik datu estatistikoak erauztea eta sintetizatzea izan da. Horretarako:

  • Sarrera bakoitzeko adibideak detektatu eta bakartu dira: Adibidea zer den erabakitzeko orduan irizpide murriztailea erabili dugu, eta testuetako lekukotasunak bakarrik hartu dira aintzat. OEHn ageri diren beste hiztegi batzuetako adibideak eta autoritateak, hortaz, albo batera utzi dira. Adibide bakoitza bere autoritateari atxiki zaio.
  • Azpisarrerei izaera autonomoa eman zaie: «gaurdanik» OEHn «gaur» nagusiaren azpisarrera gisa ageri da, «gaur arte» edo «gaurtik» bezala. Hemen denak lema independentetzat hartu dira. Halaber, ondorioz, azpisarreren adibideak eta autoritateak ez dira sarrera nagusiarenak bezala kontabilizatzen, azpisarrerarenak bezala baizik.
  • XX. mendeko adibideak eta autoritateak bereizi dira: autoritateak banaka markatuta, bereizi egin dira XX. mendekoak eta ordura bitartekoak:
  1. autoritateak denera: 781
  2. XX. mendekoak soilik: 378

Azpicorpusak

Ondorioz,__ azpicorpus berezitua sortu da, OEHko XIX. mende amaieraino bitartekoa. Corpus honi OEH19 izena eman zaio. Beraz, alderaketa guztiak bikoitzak izango dira: OEH19—>EPG eta OEH—>EPG. OEH19—>EPG agertzen delarik hitz edo sarrera baten egungo erabilera konparatzen da historian zehar, XIX. mende bukaeraraino, izan duen erabilerarekin. OEH—>EPG ageri denean, berriz, gaurko erabilera batasuna egiten hasi zen arterainokoarekin.

EPGren datutegiari dagokionez, gaur-gaurkoz HBEPn ez dira lema konplexuak (hitz anitzekoak) ageri. OEHko azpisarreren hustuketaren ondorioz, hitz anitzeko lemen zerrenda osatu dugu, eta EPGn duten maiztasuna neurtu. Horrela, 11.472 lema berri gehitu zaizkio HBEPri, hitz anitzekoak: «bihotz-begi», «gozoaren gozoz» edo «puntu-puntuan» bezalakoak, adibidez.

Emaitzak

Datu orokorrak

Datu orokorrak hauek dira:

Aintzat hartutako lemak
OEH72.325
OEH19 46.861
EPG55.727

Konparazioan sartu diren lemak: Alegia, OEHn eta EPGn bietan ageri direnak sartu dira. Bietako batean ageri ez bada, ez da aipatzen. Bi corpusetan ageri diren lemen kopurua hau da:

LAG 33.589

Zer esan nahi du horrek? OEHko lemak 72.325 baldin badira, baina bi corpusetan ageri direnak 33.593 bakarrik, horrek esan nahi du badirela OEHko 38.736 (72.325-33.589) lema EPGn ez daudenak, eta 22.138 (55.727-33.589) alderantziz, EPGn bai baina OEHn ez. Horretarako arrazoiak hiru izan daitezke:

  • Lexikoaren beraren eboluzioa. Adibidez, OEHn bertan, badira 25.464 sarrera edo azpisarrera adibidedun, XX. mendea baino lehenagoko adibide bakar bat ere ez dutenak (OEH19-n ez daudenak).
  • Lexikalizatzeko irizpide desberdinak. Bi iturburuetako bakoitzak bere moduan erabaki du zein den hitz baten forma lexikalizatua edo lema. Adibidez, «iratzartze» OEHn sarrera da, baina EPGn ez da lema, baizik eta «iratzarri» lemaren barruko forma soila.
  • Detekzio mekanismoaren akatsak. Baina badira, azkenik, OEHko testutik informazioa erauzteko erabili den mekanismoak izan ditzakeen hutsak. Adibidez, OEHko sarrera bakoitzeko forma normalizatu bakarra hartu da kontuan, lehenik ageri dena, eta ondoren diren aldaerak baztertu.

Mailakatzea

Esan bezala, 0-10 mailako eskala erlatiboa antolatu da bi corpusak alderatu ahal izateko. Irizpide nagusia corpus desberdinetako kopuruak elkarren artean parekatzea izan da:

-10. maila8-10. mailak4-10. mailak
OEH191.4844.80516.337
OEH 1.476 4.874 21.302
EPG1.495 5.036 20.226

Datu xeheak non ikusi

Mailakatzearen datu xehatuak fitxategi honetan daude.

Tradizioaren barneko faseak

Egungo euskararekin erkatzeko bi fase bereizi badira ere tradizioko iturrietan, tradizioko datuak bakarrik kontuan hartuz, fase gehiago bereizten dira aplikazio honetan, aurreko aurkezpen sistema bera erabiliz. Hori egiten da “OEH barruko aldeak” erlaitza sakatuz. Hor, 1750. urterainoko datuak hartzen dira kontuan lehenik eta horiek 1750-1900 urteetako epearekin erkatzen dira. Beste zutabe batean 1750-1900 epeko datuak 1900etik aurrerako (beti ere OEHko idazleak kontuan izanik) lekukoekin erkatzen dira. Gauza bera egiten da “autoritateak” eta “adibideak” izeneko zutabetan, eta hola ematen dira datuak: hasieratik-1750a arte, 1750-1900, eta 1900etik batasuna hasten den arte.

Hiztegi osoa ikusteko, egin klik hemen.

— Egileak: Ibon Sarasola,Pello Salaburu, Josu Landa, Iñaki Ugarteburu

lanaren aipamena nola egin...

Ibon Sarasola,Pello Salaburu, Josu Landa, Iñaki Ugarteburu , "Lexikoa atzo eta gaur (LAG)", Sareko Euskal Gramatika (SEG), www.ehu.eus/seg
ISBN: 978-84-693-9891-3