Erabiltzaile Tresnak


hizt:2

Hiztegi batua euskal prosan (HBEP)

Egin klik hemen hiztegia ikusteko.

Hasiera

EHU, Leioa2006an hasi zen lantzen proiektu hau EHUko Euskara Institutua, Gipuzkoako Foru Aldundiaren eta Donostiako Udalaren babesarekin. Lana Ibon Sarasola eta Pello Salaburu EHUko katedradunen zuzendaritzapean egiten da. Iñaki Ugarteburu irakaslea ere lan taldean egon da utzi gaituen arte (2009). Eta laugarren kidea Josu Landa da (Ametzagaiña I+G).

Jakina denez, aspaldian jarri zuen EHUk abian gaur egungo euskara idatziaren corpus zabal bat, Ereduzko Prosa Gaur izenekoa. Corpus hori da egungo euskara idatziaren erakusgarri ezin hobea, hor biltzen baitira azkeneko urteetan idatzitako liburu eredugarrienen testuak, eta, kontu hauetarako, prentsa idatziaren lekuko paregabea baita.

Hiztegi Batuaren oinarriak

Orain beste urrats bat egin nahi da: Euskaltzaindia aspalditik ari da Hiztegi Batua lantzen, eta hiztegi horren lehenbiziko bertsioa 2000. urtean argitaratu zuen, Hiztegi Batua izenarekin. Lan hori Pello Salaburuk koordinatu du hainbeste urtetan. Hiztegi horrek eragin handia izan du idazleen artean, denek aitortzen dutenez, eta batasuneko bidean hainbeste gauza berdintzeko balio izan du. Izena aldatu du gero, eta orain Euskaltzaindiaren Hiztegia deitzen da.

Hala ere, Euskaltzaindiaren hiztegi hori batez ere Orotariko Euskal Hiztegian oinarritzen da, hau da, historian zehar idatzitako testuetan, nahiz ez den hori iturri bakarra, azkeneko urteetan testu modernoak ere erabili izan direlako bigarren itzulian. Ereduzko Prosa, ordea, gaur egungo testuetan (2000-2006, batez ere) oinarritzen da.

Hiztegi Batua eta egungo prosa

DONOSTIAKO UDALAKontsultatzen ari zaren hiztegi honetan (HBEP) parean jartzen dira Hiztegi Batuko sarrerak, batetik, eta Ereduzko Prosa Gaur aplikazioan ageri direnak, bestetik. Hau da, azken batean, parean jartzen dira Euskaltzaindiak egin duen hiztegi proposamena, batasunerako, eta benetan euskaraz, batasuna onarturik, idazten dutenek erabiltzen duten hiztegia. Informazio hau ematen da, hortaz, sarrera bakoitzari dagokionez:

  • lema hori Hiztegi Batuan ageri den edo ez
  • zenbat aldiz ateratzen den hitz hori liburuetan eta prentsan. Lema bera (hanka, adibidez), eta lemak zenbat aldaera dituen (hankekin, hanketan…).
  • nork erabiltzen duen (egileen izenak)

Kontsultak egitean ikusiko denez, badira hitz batzuk Hiztegi Batuan ageri bai, baina idazleek erabiltzen ez dituztenak. Edo alderantziz ere, esperatzekoa den gisan. Eta badira beste batzuk idazleek Hiztegi Batuko proposamena ahaztu, eta beren moldera jartzen dituztenak. Nork bere ondorioak atera ditzake hortik.

Lana nola egin den

Lematizazioa egiteko baliabide informatikoak garatu ondoren, hitzak banan-banan ikusi behar izan dira, eta aldez aurretik zehaztutako irizpideak betetzen zituzten hitzak bakarrik jarri dira zerrendan. Horrela, ez dira ageri hemen izen bereziak (Kant, Ibaizabal…); erratak (gainetk, hamobortz…); txokokeriatzat edo oso markatutako hizkeratzat jo daitezkeenak (guziyan, gramera…); erdaretakoak (honorary, jambon…), eta baliabide estilistikotzat hartzen direnak (hoaaaa, gaizqui…). Azkenik, behin bakarrik ageri diren hitzak ere ez dira kontuan hartu.

Orotariko Euskal Hiztegia]] 5 milioi hitz inguruko corpus batean oinarritzen da. Hiztegi honek, berriz, 25 milioi hitzetik gorako corpusa du azpian. Hura, batez ere testu klasikoek osatzen dute. Hau, egungo euskara idatzian, prosan, oinarritzen da, esan bezala. Denetara 46.237 lema bereizten dira hemen, eta horiek guztiak aurkituko dituzu kontsultan. Hiztegi Batuan 21.235 ageri dira, hemengoen erdia baino gutxiago horrenbestez.

Datu argigarri batzuk

Hona hemen beste datu interesgarri batzuk:

  • Hitz agerpenak (hitz guztiak, bakarka kontaturik: etxe, etxetik, etxe, etxetik lau hitz agerpen dira): 25.106.538
  • Hitz desberdinak (errepikatzen direnak kontuan hartu gabe: etxe, etxetik, etxe, etxetik bi hitz desberdin dira): 700.195
  • Lemak (hitz desberdinak: etxe, etxetik lema beraren aldaerak dira. Lema bat hor, hortaz): 46.237

Hitz desberdineko multzoa (700.195) kontuan hartzen baldin badugu, baztertu behar izan dira 255.331 (% 36,47), emandako arrazoiak direla eta (izen bereziak, erratak, txokokeriak, eta abar); beste 53.694 (% 7,67) ez dira aintzat hartu (behin bakarrik ageri direlako, adibidez). Beraz, aztertzeko eta erkaketak egiteko 391.170 (% 55,87) hitz geratu dira azkenean, eta horiek eman dira finkatutzat.

Ordea, agerpen guztiak kontuan hartuz gero (25.106.538), 1.294.355 (% 5,16) baztertu dira eta 157.576 (% 0,63) ez dira aintzat hartu. Ikusten denez, baztertutako edo aintzat ez hartutako hitzen kopurua, ehunekoetan, txikia da, nahiz banaka-banaka ikusi behar direnez, lan handia eman duen bereizketa horiek egiteak.

Esan dezagun, azkenik, datuei dagokienez, hauexek direla Hiztegi Batua eta HBEP-en arteko beste desberdintasun batzuk:

  • HBEP denera: 46.237 (% 100,00)
  • HB denera: 21.235 (% 45,93)
  • HBn ez, HBEPn bai: 25.002 (% 54,07)
  • HBn bai, HBEPn ez: 1.974 (% 4,27)

2009ko urtarrilean beste 10.753 azpisarrera gehitu ziren HBEPn; zerrendetan etzanaz ematen dira azpisarrera horiek, besteetatik bereiztearren. Honekin bukatutzat eman daiteke HBEP, lehenbiziko bertsioan. Badira, hala ere, zenbait lan hurrengo hilabeteetan egingo direnak:

HBEP eta Egungo Euskararen Hiztegia (EEH)

HBEP hiztegi hau lotua da, jakina, honen parean Euskara Institutua argitaratzen ari den Egungo Euskararen Hiztegia (EEH) izeneko lanarekin. Hiztegi hau pixkanaka osatuko da, eta letrak landu ahala sartuko dira hemen.

Egin klik hemen hiztegia ikusteko.

— Egileak: Ibon Sarasola,Pello Salaburu, Josu Landa, Iñaki Ugarteburu

lanaren aipamena nola egin...

Ibon Sarasola,Pello Salaburu, Josu Landa, Iñaki Ugarteburu , "Hiztegi batua euskal prosan (HBEP)", Sareko Euskal Gramatika (SEG), www.ehu.eus/seg
ISBN: 978-84-693-9891-3