Egungo Testuen Corpusa (ETC)
—21. mendeko ereduzko corpusa—
denera: 430,7 milioi testu-hitz
garaia: 2001/2023
laugarren argitaraldia: 2025-01-31
hirugarren argitaraldia: 2021-02-15
bigarren argitaraldia: 2016-05-06
lehen argitaraldia: 2013-03-11
lemak: 94.438
hitz desberdinak: 3.584.978
Eskerrak eman nahi dizkiegu corpus honen osaketan euren testuak eskuzabal eman dizkigutenei:
- Berria egunkaria
- Argia astekaria
- Goienkaria astekaria
- Herria astekaria
- Udako Euskal Unibertsitatea (UEU)
- UPV/EHUko Euskara Zerbitzua
- UPV/EHUko Argitalpen Zerbitzua
- UPV/EHUko Euskara Juridikoaren Ataria
- Elkar, Txalaparta eta Igela argitaletxeak
- Pausoka ekoiztetxea eta EITB
- Jakin aldizkaria
- Elhuyar Fundazioa
Hona corpusaren ezaugarriak, osaketari dagokionez:
|
|
| 74,2 | jatorrizkoa |
| 43,7 | itzulpena |
| 312,7 |
neutroa (ezin jakin bata edo bestea den) |
| 14,2 | 2001 |
| 14,8 | 2002 |
| 11,7 | 2003 |
| 17,0 | 2004 |
| 15,6 | 2005 |
| 18,1 | 2006 |
| 19,9 | 2007 |
| 20,0 | 2008 |
| 19,7 | 2009 |
| 16,4 | 2010 |
| 14,9 | 2011 |
| 16,8 | 2012 |
| 15,9 | 2013 |
| 15,9 | 2014 |
| 15,1 | 2015 |
| 15,6 | 2016 |
| 16,9 | 2017 |
| 15,2 | 2018 |
| 15,1 | 2019 |
| 13,7 | 2020 |
| 15,3 | 2021 |
| 14,9 | 2022 |
| 12,9 | 2023 |
| 68,9 |
neutroa (ezin jakin zein urtekoa den) |
Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).
ISBN: 978-84-693-9891-3
-
Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:
bukatu
“bukatu” lemaren forma guztiak aintzat hartuko dira.
-
Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:
-bukatzerakoan
-
Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:
-bukatze*
“bukatze” hasiera duten hitz guztiak kontuan hartuko dira.
Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.
-
Hitz edo lemen segidak ere bila daitezke. Adibidez:
-bukatutzat eman
“bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.
-
Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:
-bukatutzat 3 eman
“bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.
-
Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:
bukatu | amaitu | bururatu
“bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.
-
Aurreko bi aukerak konbinatzerik ere badago. Adibidez:
-bukatutzat 3 eman | eman 3 -bukatutzat
