Bilaketa aurreratua

Ogi apurrak

Egungo Testuen Corpusa (ETC)



—21. mendeko ereduzko corpusa—

denera: 269,2 milioi testu-hitz

garaia: 2001/2015
bigarren argitaraldia: 2016-05-06
[beheko datuak bigarren argitaraldi horri dagozkio]
hirugarren argitaraldia: 2021-02-15
lehen argitaraldia: 2013-03-11

lemak: 91.884
hitz desberdinak: 2.556.292

Eskerrak eman nahi dizkiegu corpus honen osaketan euren testuak eskuzabal eman dizkigutenei:

  • Berria egunkaria
  • Argia astekaria
  • Goienkaria astekaria
  • Herria astekaria
  • Udako Euskal Unibertsitatea (UEU)
  • UPV/EHUko Euskara Zerbitzua
  • UPV/EHUko Argitalpen Zerbitzua
  • UPV/EHUko Euskara Juridikoaren Ataria
  • Elkar, Txalaparta eta Igela argitaletxeak
  • Pausoka ekoiztetxea eta EITB
  • Jakin aldizkaria
  • Elhuyar Fundazioa

Hona corpusaren ezaugarriak, osaketari dagokionez:

Iturburuaren arabera
155,8 prentsa
104,5 Berria
17,0 Egunkaria
13,3 Argia
12,2 Goienkaria
8,5 Herria
45,3 literatura, saiakera
22,5
EPG-EPDko liburuak
5,6
Pentsamenduaren Klasikoak
2,4
Jakin
14,8
beste liburu batzuk
25,8 zientzia, zuzenbidea
7,1
UEU
6,5
Zuzenbide Corpusa
7,3
UPV/EHU
3,7
ZT Corpusa
1,2
ZIO bilduma
10,1 telebista (Goenkale)
32,2 entziklopedia (Wikipedia)
Jatorrizkoa/itzulpena
46,6 jatorrizkoa
34,6 itzulpena
188,0 neutroa
(ezin jakin bata edo bestea den)
Urtez urte
14,2 2001
14,3 2002
12,8 2003
16,9 2004
15,6 2005
18,1 2006
19,8 2007
20,0 2008
19,7 2009
16,4 2010
14,8 2011
13,8 2012
14,0 2013
13,7 2014
12,9 2015
32,2 neutroa
(ezin jakin zein urtekoa den)
 
 

Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).

ISBN: 978-84-693-9891-3

 
kk1
kk2
  • Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:

    bukatu

    “bukatu” lemaren forma guztiak aintzat hartuko dira.

  • Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:

    -bukatzerakoan

  • Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:

    -bukatze*

    “bukatze” hasiera duten hitz guztiak kontuan hartuko dira.

    Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.

  • Hitz edo lemen segidak ere bila daitezke. Adibidez:

    -bukatutzat eman

    “bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.

  • Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:

    -bukatutzat 3 eman

    “bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.

  • Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:

    bukatu | amaitu | bururatu

    “bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.

  • Aurreko bi aukerak konbinatzerik ere badago. Adibidez:

    -bukatutzat 3 eman | eman 3 -bukatutzat

Nodoa: liferay1.lgp.ehu.eus