BASE non lemmatisée : "THIEF"

Cette base puise ses données dans FRANTEXT,
- soit en mode ON LINE. Dans ce cas l'utilisateurs choisit librement les textes ou les écrivains dont il veut extraire et exploiter les données statistiques,
- soit en mode OFF LINE, lorsqu'il veut exploiter les tranches chronologiques déjà consituées. Dans ce cas la base rend compte de 117 millions de mots.
Elle ne donne pas accès au texte, mais seulement aux fréquences.
TAILLE : 117.551.569 occurrences, 112.367 vocables, 15643 hapax
COMPOSITION : 12 tranches chronologiques (définies ci-dessous par l'année centrale)
1550 67014 mots, 1630 101892 mots, 1692 69612 mots, 1735 77841 mots, 1780 99028 mots, 11820 98905 mots, 1855 124845 mots, 11885 116085 mots, 1910 98488 mots, 1928 109218 mots, 1942 106498 mots, 1960 112367 mots