inf_estructura-frecuencias-lexico-vasco

Estructure de Fréquences du Lexique Basque (EFLB)

Cette application met à la disposition du public de nombreuses données relatives à la structure des fréquences internes des mots basques:

  • Fréquence des mots
  • Structure syllabique des mots basques : nombre de lettres,nombre de syllabes,chaînes de CV,VV,VC,etc.
  • Mots similaires: en ajoutant une lettre,en ôtant des lettres,en alternant des lettres,etc.
  • Syllabes répétées,lettres groupées par deux,troisleur position à l'intérieur du mot
  • Morphologie relative à chaque lemme,sa fréquence,sa catégorie grammaticale,etc.

Les données ont été obtenues à partir du corpus Prose de Référence Contemporaine, bien que l'on ait seulement tenu compte des entrées de lexique commun,c'est-à-dire de celles qui constituent de véritables lemmes en basque,sans tenir compte des noms propres,des mots appartenant à d'autres langues,des erreurs,etc.C'est ainsi que, des 25,1 millions de mots de PRC,22,7 millions ont été utilisés dans cette application.

Il y a trois types de consultation:

  • Données: données générales de la base des données.
  • A partir des données vers les mots: le consultant peut faire une sélection des critères sur lesquels il veut réaliser la consultation, de sorte que l'application lui renvoie une réponse formée d'une liste de mots contenant une copieuse information.
  • A partir des mots vers les données: on peut écrire sous la forme d'une liste de mots(pour tout type de texte) , ou bien adjoindre un fichier de texte sur lequel l'application fera une analyse dans chacun des mots.