De nombreuses bases littéraires sont consultables en ligne ou téléchargeables parmis lesquelles Rabelais, Racine, Rousseau, Hugo, Flaubert, Balzac, Maupassant, Le Clézio... En savoir plus
Des recueils de discours politiques bruts, révolutionnaires ou contemporains, et des Hyperbases politiques déjà constituées sont téléchargeables. Hommes politiques considérés : Robespierre, Danton, Jaurès, Blum, Pétain, De Gaulle, Sarkozy... En savoir plus
Plusieurs macro-bases linguistiques (Google books notamment) sont directement téléchargeables sur le site. Pour les utilisateurs d'Hyperbase (Windows seulement), il suffit de les télécharger et de les installer... En savoir plus
HYPERBASE
Langues traitées : Français, Latin, Anglais, Espagnol, Allemand, Italien, Portugais. Domaines d’application : Littérature, Discours politique, Etude de presse, Grands corpus numériques. Plateforme : Windows 10, Seven, XP, 32/64 bits.
Deux bases textuelles sont fournies pour illustrer les fonctions du logiciel et en permettre la maîtrise. Quatre autres sont ajoutées qui sont purement statistiques et qui exploitent les données de Google Books (GOOFRE2.tbk, 70 milliards de mots), ou celles de la BNF (GALLIBASE.tbk 60 milliards) ou celles de FRANTEXT (AUTEURS.tbk, 56 millions et CHRONO.tbk, 117 millions).
Téléchargerx
HYPERDIX
Il s'agit ici d'une version plus légère d'HYPERBASE. Sous un autre nom le logiciel est exactement le même et ses fonctions identiques. Les bases textuelles d'illustration sont les mêmes et les bases statistiques également, à l'exception de la base GOOFRE2.tbk (Google Books) qui à elle seule pèserait autant que tout le reste.
Langues traitées : Français, Latin, Anglais, Espagnol, Allemand, Italien, Portugais. Domaines d’application : Littérature, Discours politique, Etude de presse, Grands corpus numériques. Plateforme : Windows 10, Seven, XP, 32/64 bits
Deux bases textuelles sont fournies pour illustrer les fonctions du logiciel et en permettre la maîtrise. Trois autres sont ajoutées qui sont purement statistiques et qui exploitent les données de la BNF (GALLIBASE.tbk 60 milliards de mots) ou celles de FRANTEXT (AUTEURS.tbk, 56 millions et CHRONO.tbk, 117 millions).
TéléchargerxBASE : "GOOFRE2" (cette base, extraite de GOOGLE BOOKS, rend compte des 70 milliards de mots recueillis en 2012 dans le domaine français. Elle ne donne pas accès au texte, mais seulement aux fréquences)
COMPOSITION : Le corpus est présenté en 12 tranches chronologiques, de 1800 à 2012. Les données ont été lemmatisées. Elles sont accessibles en mode on line ou off line.
GALLIBASE
Le présent programme est une extension du logiciel Gallicagram que Benjamin Azoulay et Benoît de Courson ont développé pour représenter l'évolution des mots ou syntagmes dans les corpus numérisés de Gallica et de beaucoup d'autres bibliothèques.
À partir des fréquences dont les graphiques rendent compte, on vise ici à constituer des tableaux où les mots sont en ligne et les années en colonne. Chaque cellule du tableau restitue la fréquence absolue (et non un pourcentage) du mot i dans l'année j. Comme Gallicagram fournit aussi le poids de chaque année dans le corpus considéré, on peut appliquer les lois classiques de la statistique et notamment le calcul de l'écart réduit sur lequel on fonde la représentation graphique des lignes mais aussi des colonnes. Les nombres traités étant souvent très considérables (cela va jusqu'au miliard), on a préféré la loi normale au calcul hypergéométrique.
L'intérêt principal de cette approche statistique, c'est qu'elle autorise l'analyse des tableaux et principalement l'analyse factorielle ( de correspondance) et l'analyse arborée (soit celle de Luong, soit celle de Splitstree).
BASE non lemmatisée : "Auteurs" (cette base, extraite de FRANTEXT, rend compte de 56 millions de mots. Elle ne donne pas accès au texte, mais seulement aux fréquences)
TAILLE : 56 477 618 occurrences, 235 100 vocables
COMPOSITION : 70 écrivains, de Montaigne à Gracq
BASE non lemmatisée : "Chrono" (cette base, extraite de FRANTEXT, rend compte de 117 millions de mots. Elle ne donne pas accès au texte, mais seulement aux fréquences)
TAILLE : 117.551.569 occurrences, 112.367 vocables, 15643 hapax
COMPOSITION : 12 tranches chronologiques (définies ci-dessous par l'année centrale)
1550 : 67014 mots, 1630 : 101892 mots, 1692 : 69612 mots, 1735 : 77841 mots, 1780 : 99028 mots, 1820 : 98905 mots, 1855 : 124845 mots, 1885 : 116085 mots, 1910 : 98488 mots, 1928 : 109218 mots, 1942 : 106498 mots, 1960 : 112367 mots
BASE LEMMATISÉE : "ALGERIE"
TAILLE : 1799466 occurrences, 52401 vocables
COMPOSITION : 38 textes
Sartre (32609 occ.),
Taxieur (23265 occ.),
Jelfen (7845 occ.),
Paradis (26974 occ.),
Collier (13613 occ.),
Soir (8334 occ.),
Aljerino (13038 occ.),
Montagne (6056 occ.),
Défunte (11022 occ.),
Tour (7949 occ.),
Peurs (71316 occ.),
Quartiers (42030 occ.),
Rhoulem (54042 occ.),
Mer (27513 occ.),
Impure (49478 occ.),
Éternité (46637,
Etoile ( 56945,
Sauterelle (47931,
Trois_fois (28883,
Abîme ( 80167,
Spoliation (47024,
Glaise ( 59219,
Meriem ( 87810,
Arris ( 37338,
Thagaste (39511,
Shahrazade (29310,
Fils ( 89281,
Entre_deux (65864,
Jasmin ( 44899,
Enfrance (55206,
Soeurs ( 30543,
Enfer ( 23599,
Mémoires (41147,
Passagères (34800,
Femmes ( 87864,
Hommes ( 173329,
Chacals ( 80073,
Aletti ( 117002.
BASE LEMMATISÉE : "ARAGON"
TAILLE : 3258823 occurrences, 69702 vocables, 26838 hapax
COMPOSITION : 23 textes
FeuJoie 55843, Perpétuel 47413, Destinées 76962, Snark 45526,
Peinture 54756, Hourra 71882, CLOCHES 137650, QUARTIERS 222492,
Soviétique 55142, VasteMonde 77817, CrèveCoeur 90934,
EnFrançais 45206, IMPERIALE 328478, Grévin 103828,
AURELIEN 278736, SERVITUDE 66661, BelCanto 118876,
1COMMUNISTES 405734, 2COMMUNISTES 377730, Inachevé 38003,
FoudElsa 141133, MISEÃ MORT 207003, BLANCHE 211018,
BASE LEMMATISÉE de Sylvia KASPARIAN : "ARMENIE"
TAILLE : 194715 occurrences, 9917 vocables
COMPOSITION : 6 textes
Barby (50860 occ.), Bryce (12676 occ.), Captanian (44642 occ.), Naayem (68931 occ.), Sociétéé (12415 occ.), Témoignage (5191 occ.), Téléchargerx
BASE LEMMATISÉE : "AFRANCE"
TAILLE : 1349975 occurrences, 44590 vocables, 17022 hapax
COMPOSITION : 23 textes
ChatMaigre (28063 occ.), Jocaste (32727 occ.), JeanServien (38144 occ.), AutelsPeur (20394 occ.), NosEnfants (6477 occ.), 1VieLitt (106922 occ.), Balthasar (49734 occ.), 2VieLitt (111021 occ.), 3VieLitt (119515 occ.), 4VieLitt (113594 occ.), Coignard (51237 occ.), Pédauque (89923 occ.), Thaïs (63137 occ.), Epicure (40269 occ.), Nozière (70085 occ.), Bergeret (70492 occ.), Opin.Sociales (56061 occ.), HistComique (57825 occ.), PartiNoir (10958 occ.), PierreBlanche (57670 occ.), Pingouins (99270 occ.), BarbeBleue (50043 occ.), FillesGarçons (6414 occ.).
BASE LEMMATISÉE : "BALZAC"
TAILLE : 4182750 occurrences, 60997 vocables, 19945 hapax
COMPOSITION : 49 textes
Chouans (137700 occ.), Physiologie (129644 occ.), Vendetta (29770 occ.), Gobseck (25674 occ.), Sceaux (25284 occ.), Pelote (24944 occ.), Chagrin (110095 occ.), Chabert (28176 occ.), Trente (80020 occ.), Tours (29095 occ.), Lambert (47004 occ.), Campagne (102986 occ.), Ferragus (51792 occ.), Gaudissart (16937 occ.), Grandet (78712 occ.), Absolu (82226 occ.), Goriot (112247 occ.), Séraphita (61002 occ.), Contrat (57901 occ.), Langeais (61839 occ.), Yeux (32910 occ.), Vallée (122127 occ.), Interdiction (32303 occ.), Antiques (59947 occ.), Illusions (274974 occ.), Vieille (57415 occ.), Employés (106001 occ.), Birotteau (122595 occ.), Nucingen (29727 occ.), Curé (106403 occ.), Ève (50620 occ.), Béatrix (140068 occ.), Courtisanes (227742 occ.), Mirouet (97539 occ.), Affaire (87038 occ.), Rabouilleuse (124949 occ.), Mariées (96437 occ.), Médicis (130276 occ.), Début (69618 occ.), Savarus (48563 occ.), Honorine (35459 occ.), Département (73058 occ.), Mignon (109777 occ.), Paysans (135646 occ.), Bette (181763 occ.), Pons (129737 occ.), Histoire (88208 occ.), Bourgeois (75240 occ.), Arcis (43562 occ.)
30 textes
Sous l’oeil des Barbares 31515 occurrences, Un Homme Libre 47711 , Les Déracinés 150028 , Mes Cahiers_1 56841 , Le Jardin de Bérénice 39031 , La Terre et les Morts 8055 , L’Appel au Soldat 160631 , Leurs Figures 89073 , Mes Cahiers_2 60517 , Mes Cahiers_3 70195 , Mes Cahiers_4 58720 , Le Voyage de Sparte 61229 , Mes Cahiers_5 72288 , Mes Cahiers_6 79660 , Colette Baudoche 35720 , Mes Cahiers_7 71241 , Mes Cahiers_8 66569 , Greco ou le secret de Tolède 22288 , Mes Cahiers_9 89673 , La Colline inspirée 95588 , La Grande Pitié des églises de France 68929 , Mes Cahiers_10 94708 , Les Traits éternels de la France 9952 , Les diverses Familles Spirituelles de la France 61864 , Mes Cahiers_11 91920 , Mes Cahiers_12 73566 , Le Génie du Rhin 41402 , Un jardin sur l’Oronte 32324 , Mes Cahiers_13 56942 , Mes Cahiers_14 62455 ,
TOTAL 1960635 occurrences 55003 vocables Téléchargerx
BASE LEMMATISÉE : "BAUDELAI"
TAILLE : 398865 occurrences, 24025 vocables, 10082 hapax
COMPOSITION : 15 textes
45Salon (16749 occ.), 46Salon (30070 occ.), Fanfarlo (13101 occ.), ArtRom (134981 occ.), EdgarPoe (18921 occ.), FleursMal (28834 occ.), Epaves (8051 occ.), P_Divers (2840 occ.), 59Salon (34246 occ.), Haschisch (18652 occ.), Opium (35026 occ.), DuVin (9069 occ.), CoeurNu (8892 occ.), Fusées (5878 occ.), P_Prose (33555 occ.)
Téléchargerx
BASE LEMMATISÉE : "BRETON"
TAILLE : 1928110 occurrences, 62519 vocables, 25137 hapax
COMPOSITION : 17 textes
1_littérature (172880 occ.), 2_littérature (114557 occ.), Pasperdus (46275 occ.), Manifeste (14473 occ.), 1_poésie (19398 occ.), Révolution (357651 occ.), Nadja (28553 occ.), 1_tracts (146777 occ.), Sasdlr (227764 occ.), Vases (49588 occ.), Jour (54362 occ.), Amour (39707 occ.), 2_poésie (14368 occ.), Arcane (27548 occ.), 2_tracts (153631 occ.), Champs (119683 occ.), Labrèche (340895 occ.)
BASE LEMMATISÉE : "BRUYERE"
TAILLE : 181256 occurrences, 11518 vocables, 5197 hapax
COMPOSITION : 21 textes
SurThéophraste (6352 occ.), Théophraste (14590 occ.), 1Préface (2975 occ.), Esprit (9261 occ.), Mérite (5480 occ.), Femmes (8441 occ.), Coeur (4163 occ.), Société (9875 occ.), Fortune (9120 occ.), Ville (4998 occ.), Cour (11385 occ.), Grands (7321 occ.), Souverain (7638 occ.), Homme (19307 occ.), Jugements (15590 occ.), Mode (8058 occ.), Usages (10744 occ.), Chaire (4710 occ.), Esp_forts (11846 occ.), 2Préface (4837 occ.), Académie (4565 occ.)
BASE LEMMATISÉE : "CHATEAU"
TAILLE : 2204106 occurrences, 57091 vocables, 22986 hapax
COMPOSITION : 16 textes
Révolution (125858 occ.), Atala (35759 occ.), René (12606 occ.), Génie (276391 occ.), Martyrs (184243 occ.), Itinéraire (252312 occ.), Natchez (173434 occ.), Abencerage (17093 occ.), Vérone (161191 occ.), Rancé (70780 occ.), 1Mémoires (181351 occ.), 2Mémoires (105072 occ.), 3Mémoires (152782 occ.), 4Mémoires (193968 occ.), 5Mémoires (167875 occ.), 6Mémoires (93391 occ.)
BASE LEMMATISÉE : "CLASSIC"
TAILLE : 1300309 occurrences, 23268 vocables, 8746 hapax
COMPOSITION : 75 textes
Mélite (19485 occ.), Clitandre (16759 occ.), Veuve (21334 occ.), Galerie (19653 occ.), Suivante (18162 occ.), Tuileries (4245 occ.), Médée (16816 occ.), Place (16470 occ.), Illusion (18632 occ.), LeCid (20145 occ.), Cinna (18792 occ.), Horace (19043 occ.), Polyeucte (19696 occ.), Pompée (19040 occ.), Menteur1 (20533 occ.), Menteur2 (21849 occ.), Rodogune (19679 occ.), Théodore (20268 occ.), Héraclius (20577 occ.), Andromède (18177 occ.), Sanche (19509 occ.), Nicomède (19697 occ.), Pertharite (19701 occ.), Oedipe (21337 occ.), Toison (23290 occ.), Sertorius (20384 occ.), Sophonisbe (19188 occ.), Othon (19663 occ.), Agésilas (21079 occ.), Attila (19214 occ.), Tite (19259 occ.), Psyché (18673 occ.), Pulchérie (19235 occ.), Suréna (19148 occ.), ÉTOURDI (23238 occ.), DÉPIT (20615 occ.), PRÉCIEUSES (8417 occ.), SGANARELLE (7540 occ.), GARCIE (20127 occ.), MARIS (13026 occ.), FÂCHEUX (9832 occ.), FEMMES (20534 occ.), CRITIQUE (10794 occ.), IMPROMPTU (9133 occ.), MARIAGE (7945 occ.), ÉLIDE (14087 occ.), TARTUFFE (22456 occ.), DONJUAN (21758 occ.), AMOUR (7856 occ.), MISANTHROP (20936 occ.), MALGRÉLUI (12189 occ.), MÉLICERTE (6955 occ.), SICILIEN (6804 occ.), AMPHITRYON (18837 occ.), DANDIN (14468 occ.), AVARE (26480 occ.), POURCEAUG. (15799 occ.), AMANTS (14649 occ.), BOURGEOIS (22120 occ.), SCAPIN (18409 occ.), ESCARB. (7141 occ.), SAVANTES (21054 occ.), MALADE (26481 occ.), Thébaïde (16489 occ.), Alexandre (16257 occ.), Andromaque (18128 occ.), Plaideurs (11476 occ.), Britannicus (18622 occ.), Bérénice (16144 occ.), Bajazet (18483 occ.), Mithridate (18043 occ.), Iphigénie (18944 occ.), Phèdre (17204 occ.), Esther (13476 occ.), Athalie (18631 occ.)
BASE LEMMATISÉE : "CLAUDEL"
TAILLE : 1298962 occurrences, 37559 vocables, 14852 hapax
COMPOSITION : 44 textes
Base COLETTE
TAILLE : 471116 occurrences, 29501 vocables
COMPOSITION : 10 textesTéléchargerx
BASE LEMMATISÉE : "CORNEIL"
TAILLE : 648732 occurrences, 14271 vocables, 5090 hapax
COMPOSITION : 34 textes
Mélite (19485 occ.), Clitandre (16759 occ.), Veuve (21334 occ.), Gelerie (19653 occ.), Suivante (18162 occ.), Tuileries (4245 occ.), Médée (16816 occ.), Place (16470 occ.), Illussion (18632 occ.), LeCid (20145 occ.), Cinna (18792 occ.), Horace (19043 occ.), Polyeucte (19696 occ.), Pompée (19040 occ.), Menteur1 (20533 occ.), Menteur2 (21849 occ.), Rodogune (19679 occ.), Théodore (20268 occ.), Héraclius (20577 occ.), Andromède (18177 occ.), Sanche (19509 occ.), Nicomède (19697 occ.), Pertharite (19701 occ.), Oedipe (21337 occ.), Toison (23290 occ.), Sertorius (20384 occ.), Sophonisbe (19188 occ.), Othon (19663 occ.), Agésilas (21079 occ.), Attila (19214 occ.), Tite (19259 occ.), Psyché (18673 occ.), Pulchérie (19235 occ.), Suréna (19148 occ.)
Poésie , Théâtre 1862, Théâtre 1863-8, Le Sacrifice , L'Arlésienne , Tartarin de Tarascon , Lise Tavernier , Fromont... et Risler... , Femmes d'artistes , Contes du Lundi, Le Nabab (roman), Les Rois en exil, Lettres de mon moulin , Le Petit Chose , Le Nabab (pièce), Jack , Numa Roumestan (roman), L'Evangéliste , Sapho (roman), Tartarin sur les Alpes , Cinq Nouvelles , La Doulou , L'Immortel , La Lutte pour la Vie , Numa Roumestan (pièce), L'Obstacle , Rose et Ninette , La Menteuse , Sapho (pièce), La petite paroisse , Le Trésor d'Arlatan , Soutien de famille , Notes sur la vie , Critique dramatique Téléchargerx
BASE LEMMATISÉE : "DIB"
TAILLE : 1173018 occurrences, 40737 vocables, 16735 hapax
COMPOSITION : 21 textes
La grande maison (48057 occ.), L'incendie (76005 occ.), Au café (33289 occ.), Le métier à tisser (53462 occ.), Un été africain (48249 occ.), Qui se souvient de la mer (58240 occ.), Cours sur la rive sauvage (32769 occ.), Le talisman (30493 occ.), La danse du roi (58895 occ.), Dieu en barbarie (73996 occ.), Le maître de chasse (68665 occ.), Habel (57375 occ.), Les Terrasses d'Orsol (63725 occ.), Le sommeil d'Eve (60682 occ.), Neiges de marbre (65685 occ.), Le désert sans détour (31779 occ.), L'infante Maure (47304 occ.), Si Diable veut (61986 occ.), L'Arbre à dires (44557 occ.), Comme un bruit d abeilles (84511 occ.), Simorgh (73294 occ.)
BASE LEMMATISÉE : "DIDEROT"
TAILLE : 668792 occurrences, 26989 vocables, 11668 hapax
COMPOSITION : 24 textes
ReligionNat. (5035 occ.), Bijoux (105029 occ.), Aveugles (27993 occ.), Prospectus (12789 occ.), Essais (4054 occ.), PenséesNat. (21487 occ.), RechBeau (18255 occ.), FilsNat (21544 occ.), PèreFam (35704 occ.), LettreFrère (1918 occ.), Religieuse (77452 occ.), NeveuRam (40823 occ.), CommerceLivre (32226 occ.), Alembert (6040 occ.), Bourbonne (4808 occ.), PrincipMat (2607 occ.), Maréchale (6829 occ.), Bougainville (19650 occ.), Femmes (5957 occ.), RobeChambre (2812 occ.), Comédien (26115 occ.), JacquesFat (118946 occ.), Addition (3079 occ.), Sénèque (67640 occ.)
BASE LEMMATISÉE : "DUMAS"
TAILLE : 5729328 occurrences, 61831 vocables, 20238 hapax
COMPOSITION : 42 textes
HenriIII (30044 occ.), Paul (78643 occ.), Acté (83273 occ.), Pamphile (82591 occ.), 1Aréna (63266 occ.), 2Aréna (62326 occ.), Speronare (221619 occ.), Corricolo (252450 occ.), Georges (158454 occ.), 1Montecristo (157715 occ.), 2Montecristo (154068 occ.), 3Montecristo (149825 occ.), 4Montecristo (158268 occ.), Mousquetaires (289273 occ.), 1Margot (138853 occ.), 2Margot (128373 occ.), VingtAns (364438 occ.), MaisonRouge (177433 occ.), 1Montsoreau (126987 occ.), 2Montsoreau (124400 occ.), 3Montsoreau (111804 occ.), 1Bragelonne (222590 occ.), 2Bragelonne (212553 occ.), 3Bragelonne (202928 occ.), 4Bragelonne (236440 occ.), 1QuaranteCinq (106573 occ.), 2QuaranteCinq (108247 occ.), 3QuaranteCinq (100540 occ.), 1Collier (183142 occ.), 2Collier (145408 occ.), Fantômes (70417 occ.), Tulipe (91507 occ.), Velours (71466 occ.), Jéhu (249351 occ.), Bricàbrac (62932 occ.), 1Felice (81078 occ.), 2Felice (80092 occ.), 3Felice (80686 occ.), 4Felice (77942 occ.), 5Felice (77289 occ.), 6Felice (79074 occ.), 8Felice (74970 occ.)
Base DURAS
TAILLE : 596372 occurrences, 21396 vocables
COMPOSITION : 12 textesTéléchargerx
Base De GAULLE
TAILLE : 986819 occurrences, 32746 vocables
COMPOSITION : 13 textesTéléchargerx
BASE LEMMATISÉE : "ELUARD"
TAILLE : 376226 occurrences, 24581 vocables, 11410 hapax
COMPOSITION : 8 textes
I922 (28929 occ.), I932 (82788 occ.), I937 (33622 occ.), I942 (59891 occ.), I945 (21795 occ.), I947 (34786 occ.), I949 (31329 occ.), I951 (83086 occ.)
BASE LEMMATISÉE : "EUGENSUE"
TAILLE : 1592107 occurrences, 34050 vocables, 11571 hapax
COMPOSITION : 10 textes
1Mystères (145205 occ.), 2Mystères (147592 occ.), 3Mystères (146450 occ.), 4Mystères (131628 occ.), 5Mystères (120100 occ.), 1Juif (342295 occ.), 2Juif (358761 occ.), 1Paula (58513 occ.), 2Paula (54613 occ.), Alouette (86950 occ.)
BASE LEMMATISÉE : "FLAUBERT"
TAILLE : 976041 occurrences, 36568 vocables, 13766 hapax
COMPOSITION : 15 textes
Mémoires (25998 occ.), Smarh (38487 occ.), Souvenirs (10221 occ.), Novembre (38487 occ.), Champs (3667 occ.), 49Antoine (113695 occ.), 56Antoine (54091 occ.), Bovary (145891 occ.), Salammbô (124927 occ.), Education (185423 occ.), 74Antoine (52285 occ.), 3Contes (37936 occ.), Bouvard (114253 occ.), Bouilhet (7648 occ.), Correspondance (23032 occ.)
BASE LEMMATISÉE : "FLAUCORR"
TAILLE : 1051039 occurrences, 31424 vocables, 13312 hapax
COMPOSITION : 36 textes (partition chronologique)
t1830 (49276 occ.), t1845 (12247 occ.), t1846 (82131 occ.), t1847 (26360 occ.), t1849 (19053 occ.), t1850 (48512 occ.), t1851 (16668 occ.), t1852 (71718 occ.), t1853 (111725 occ.), t1854 (25398 occ.), t1855 (9849 occ.), t1856 (10960 occ.), t1857 (31885 occ.), t1858 (16289 occ.), t1859 (19901 occ.), t1860 (12196 occ.), t1861 (15766 occ.), t1862 (20155 occ.), t1863 (16077 occ.), t1864 (10433 occ.), t1865 (8629 occ.), t1866 (17460 occ.), t1867 (24933 occ.), t1868 (22024 occ.), t1869 (26755 occ.), t1870 (27004 occ.), t1871 (37741 occ.), t1872 (33663 occ.), t1873 (31342 occ.), t1874 (32742 occ.), t1875 (14643 occ.), t1876 (29898 occ.), t1877 (27127 occ.), t1878 (19404 occ.), t1879 (43676 occ.), t1880 (27399 occ.)
BASE LEMMATISÉE : "FONTAIN"
TAILLE : 410861 occurrences, 18703 vocables, 8019 hapax
COMPOSITION : 36 textes
1Théâtre (21803 occ.), 1Poésie (6160 occ.), 1Psyché (13438 occ.), 2Psyché (17292 occ.), 3Psyché (14404 occ.), 4Psyché (20530 occ.), 2Poésie (10337 occ.), 2Théâtre (2078 occ.), 1Correspondance (6120 occ.), 3Poésie (16306 occ.), 2Correspondance (17225 occ.), 1Contes (13610 occ.), 2Contes (28688 occ.), 1Fables (5698 occ.), 2Fables (5992 occ.), 3Fables (5376 occ.), 4Fables (7452 occ.), 5Fables (4806 occ.), 6Fables (5430 occ.), 4Poésie (13552 occ.), 3Contes (30799 occ.), 4Contes (25046 occ.), 3Théâtre (9208 occ.), 7Fables (8011 occ.), 8Fables (11287 occ.), 9Fables (6882 occ.), 10Fables (8874 occ.), 11Fables (5502 occ.), 5Contes (11661 occ.), 5Poésie (10582 occ.), 4Théâtre (6576 occ.), 5Théâtre (2925 occ.), 3Correspondance (2895 occ.), 6Poésie (15788 occ.), 6Théâtre (7068 occ.), 12Fables (11460 occ.)
Base GARY
TAILLE : 389458 occurrences, 20390 vocables
COMPOSITION : 6 textesTéléchargerx
BASE LEMMATISÉE : "GIRAUDOU"
TAILLE : 638452 occurrences, 30369 vocables, 13712 hapax
COMPOSITION : 16 textes
Simon (58525 occ.), Suzanne (76517 occ.), Limousin (79185 occ.), Bella (59813 occ.), Siegfried (29095 occ.), Amphitryon (35712 occ.), Judith (32798 occ.), Intermezzo (32190 occ.), Guerre (29144 occ.), Electre (39674 occ.), Cantique (11915 occ.), Ondine (39044 occ.), Apollon (11569 occ.), Sodome (30296 occ.), Folle (35742 occ.), Lucrèce (37233 occ.)
BASE LEMMATISÉE : "GRACQ"
TAILLE : 939154 occurrences, 44989 vocables, 18905 hapax
COMPOSITION : 17 textes
Argol (36464 occ.), Ténébreux (73161 occ.), Grande (19983 occ.), Pêcheur (29055 occ.), Breton (48229 occ.), Syrtes (124998 occ.), Penthésilée (33093 occ.), Forêt (65379 occ.), Préférences (80421 occ.), 1Lettrines (44863 occ.), Presqu_île (58002 occ.), 2Lettrines (68159 occ.), Etroites (11644 occ.), Ecrivant (94142 occ.), Ville (52718 occ.), Colline (22929 occ.), Chemin (75914 occ.)
BASE LEMMATISÉE : "HUGOPROS"
TAILLE : 3656982 occurrences, 67904 vocables, 25068 hapax
COMPOSITION : 30 textes
BugJargal (67874 ooc.), LettresFiancée (109656 ooc.), Condamné (43932 ooc.), NotreDame (216912 ooc.), LucrBorgia (28027 ooc.), HanIslande (149247 ooc.), MarTudor (33848 ooc.) ooc.), ClaudeGueux (10559 ooc.), Litt&Phil (108497 ooc.), Rhin (245699 ooc.), 1Corresp (142773 ooc.), NapPetit (87947 ooc.), 1Misérables (141987 ooc.), 2Misérables (122821 ooc.), 3Misérables (109784 ooc.), 4Misérables (155460 ooc.), 5Misérables (134713 ooc.), 2Corresp (234327 ooc.), Shakespeare (10540 ooc.), Travailleurs (172958 ooc.), HomQuiRit (254023 ooc.), 3Corresp (143249 ooc.), QuatVingtTreize (148062 ooc.), 1Actes&P (188283 ooc.), 2Actes&P (147446 ooc.), 3Actes&P (116421 ooc.), 4Actes&P (123329 ooc.), HistCrime (174670 ooc.), Archipel (23913 ooc.), Postscriptum (10025 occ.)
BASE LEMMATISÉE : "HUGOVERS"
TAILLE : 656448 occurrences, 27632 vocables, 11764 hapax
COMPOSITION : 14 textes
Odes (67200 occ.), Orientales (26208 occ.), Feuilles (27512 occ.), Rayons (31992 occ.), Châtiments (64784 occ.), 1Contemplations (48932 occ.), 2Contemplations (63030 occ.), Satan (58060 occ.), 1Légende (51957 occ.), 2Légende (45156 occ.), Chansons (39351 occ.), Terrible (66243 occ.), GrandPère (37305 occ.), Ane_ (28718 occ.)
Le Drageoir, Marthe, Les Soeurs Vatar, Sac au dos, En Ménage, À Vau l'eau , L'Art Moderne, À Rebours, Croquis parisiens, En Rade, Un Dilemme, Certains, Là-bas, En Route, La Cathédrale, Bièvre et Saint-Séverin, Magie en Poitou, Sainte Lydwine de Schiedam, De Tout, L'Oblat, Le Quartier Notre- Dame, Les Foules de Lourdes, Trois Églises Trois Primitifs Téléchargerx
BASE LEMMATISÉE : "LAMARTIN"
TAILLE : 1017464 occurrences, 29785 vocables, 9979 hapax
COMPOSITION : 15 textes
1MEDITATIONS (92645 occ.), 2MEDITATIONS (28520 occ.), HARMONIES (67858 occ.), ODES (5842 occ.), Orient (274229 occ.), JOCELYN (91388 occ.), CHUTE (73494 occ.), RECUEILLEMENTS (40781 occ.), Revue (7274 occ.), 3MEDITATIONS (6228 occ.), 1Confidences (123097 occ.), Graziella (46913 occ.), 2Confidences (76592 occ.), Tailleurs (69431 occ.), COURS (13172 occ.)
BASE LEMMATISÉE : "LECLEZIO"
TAILLE : 2267133 occurrences, 50072 vocables, 20036 hapax
COMPOSITION : 31 textes
Procès (91409 occ.), Fièvre (100227 occ.), Déluge (122378 occ.), Extase (90623 occ.), Fuite (103045 occ.), Guerre (109538 occ.), Mydriase (9874 occ.), Voyage (113668 occ.), Prophéties (8783 occ.), Mondo (97635 occ.), Inconnu (124442 occ.), Icebergs (2728 occ.), Arbres (2993 occ.), Désert (150179 occ.), Villes (15386 occ.), Ronde (82951 occ.), Chercheur (133692 occ.), Angoli (24254 occ.), Rodrigues (38159 occ.), Rêve (86218 occ.), Printemps (69802 occ.), Sirandanes (2489 occ.), Onitsha (75462 occ.), Étoile (118082 occ.), Pawana (10623 occ.), Diego (72646 occ.), Quarantaine (164503 occ.), Poisson (85433 occ.), Fête (70418 occ.), Nuages (21641 occ.), Hasard (67852 occ.)
BASE LEMMATISÉE : "MAMMERI"
TAILLE : 411070 occurrences, 22281 vocables, 10432 hapax
COMPOSITION : 8 textes
COLLINE (63787 occ.), SOMMEIL (62428 occ.), OPIUM (112247 occ.), BANQUET (41152 occ.), TRAVERSEE (66838 occ.), FOEHN (26816 occ.), SOLEIL (10765 occ.), ESCALES (27037 occ.)
BASE LEMMATISÉE : "MARIVAU"
TAILLE : 1190232 occurrences, 22165 vocables, 8284 hapax
COMPOSITION : 59 textes
Prudent (9915 occ.), Vérité (2897 occ.), Poli (10207 occ.), Annibal (16943 occ.), Surprise (23036 occ.), Inconstance (28346 occ.), Travesti (27872 occ.), Suivante (27230 occ.), Dénouement (10004 occ.), Esclaves (11803 occ.), Héritier (11919 occ.), Raison (25633 occ.), Seconde (23099 occ.), Triomphe (25585 occ.), Ligue (618 occ.), JeuAmour (21225 occ.), Réunion (8252 occ.), Plutus (9387 occ.), Serments (29099 occ.), Ecole (10750 occ.), Stratagème (22726 occ.), Méprise (12030 occ.), Corrigé (23547 occ.), Confidente (20354 occ.), Legs (15930 occ.), Fausses (26159 occ.), Joie (13154 occ.), Sincères (13720 occ.), Epreuve (14177 occ.), Commère (14765 occ.), Dispute (11287 occ.), Préjugé (11519 occ.), Colonie (11861 occ.), Fidèle (8323 occ.), Félicie (8135 occ.), Acteurs (9608 occ.), Provinciale (15650 occ.), Mahomet (3569 occ.), 1Marianne (20048 occ.), 2Marianne (19634 occ.), 3Marianne (26400 occ.), 4Marianne (22115 occ.), 5Marianne (22367 occ.), 6Marianne (22070 occ.), 7Marianne (23982 occ.), 8Marianne (23433 occ.), 9Marianne (27325 occ.), 10Marianne (20030 occ.), 11Marianne (19065 occ.), 1Paysan (21333 occ.), 2Paysan (23828 occ.), 3Paysan (25529 occ.), 4Paysan (21193 occ.), 5Paysan (21641 occ.), Lettres (39384 occ.), Spectateur (82746 occ.), Indigent (28053 occ.), Cabinet (53115 occ.), Divers (36607 occ.)
BASE LEMMATISÉE : "MAUPASS"
TAILLE : 1702057 occurrences, 38626 vocables, 13074 hapax
COMPOSITION : 38 textes
POÈMES (8063 occ.), VERS (17344 occ.) occ.), 0CONTES (57807 occ.), CHRONIQUES (4177 occ.), 1TELLIER (57533 occ.), 1CONTES (10389 occ.), 2FIFI (44625 occ.), 2CONTES (48276 occ.), 3BÉCASSE (43464 occ.), 3LUNE (43828 occ.), 3CONTES (46854 occ.), UNEVIE (91062 occ.), CORRESP (3758 occ.), AUSOLEIL (51515 occ.), 4HARRIET (65643 occ.), 4RONDOLI (52653 occ.), 4YVETTE (52839 occ.), 4CONTES (32095 occ.), 5JOUR (53071 occ.), 5CONTES (12976 occ.), 5TOINE (50417 occ.), BELAMI (133399 occ.), 6PARENT (58787 occ.), 6ROQUE (52629 occ.), 6CONTES (19297 occ.), 7HORLA (51737 occ.), 7CONTES (15795 occ.), ORIOL (101108 occ.), PIERRE (54106 occ.), SUREAU (38403 occ.), 8HUSSON (43505 occ.), 9GAUCHE (44659 occ.), 9CONTES (11453 occ.), FORT (89216 occ.), COEUR (70490 occ.), 10BEAUTÉ (49609 occ.), ÉTRANGÈRE (8916 occ.), ANGÉLUS (10559 ooc.)
Menteur (17860
occ.)
Defenses (8383
occ.)
Grammaire (78878
occ.)
Pelletier (4908
occ.)
DesAutels (25142
occ)
TOTAL 135171 occurrences 11146 vocables
La saisie et la
lemmatisation ont ete assurees par Olivier Bettens.
BASE LEMMATISÉE : "MOLIERE"
TAILLE : 468353 occurrences, 15703 vocables, 6936 hapax
COMPOSITION : 30 textes
ETOURDI (23238 occ.), DEPIT (20615 occ.), Précieuses (8417 occ.), SGANARELLE (7540 occ.), GARCIE (20127 occ.), MARIS (13026 occ.), FACHEUX (9832 occ.), FEMMES (20534 occ.), Critique (10794 occ.), Impromptu (9133 occ.), Mariage (7945 occ.), ELIDE (14087 occ.), TARTUFFE (22456 occ.), DonJuan (21758 occ.), Amour (7856 occ.), MISANTHROPE (20936 occ.), MalgréLui (12189 occ.), MELICERTE (6955 occ.), Sicilien (6804 occ.), AMPHITRYON (18837 occ.), Dandin (14468 occ.), Avare (26480 occ.), Pourceaugnac (15799 occ.), Amants (14649 occ.), Bourgeois (22120 occ.), PSYCHE (18673 occ.), Scapin (18409 occ.), Escarbagnas (7141 occ.), SAVANTES (21054 occ.), Malade (26481 occ.)
Téléchargerx
BASE LEMMATISÉE : "MONTAIGN"
TAILLE : 512513 occurrences, 31687 vocables, 17323 hapax
COMPOSITION : 9 textes
1PREMIER (34329 occ.), 2PREMIER (75714 occ.), 3PREMIER (29304 occ.), 1DEUXIEME (47710 occ.), APOLOGIE (81138 occ.), 3DEUXIEME (83843 occ.), 1TROISIEME (51892 occ.), 2TROISIEME (61810 occ.), 3TROISIEME (46773 occ.)
BASE LEMMATISÉE : "MONTESQU"
TAILLE : 501696 occurrences, 19283 vocables, 7900 hapax
COMPOSITION : 13 textes
Persanes (24316 occ.), Gnide (12151 occ.), Considérations (53447 occ.), EspritLois (266452 occ.), DéfenseLois (20535 occ.), Contes (17848 occ.), Goût (10477 occ.), Pensées (10105 occ.), Angleterre (4000 occ.), Venise (22166 occ.), Rome (25918 occ.), Italie (30518 occ.), Autriche (3763 occ.)
BASE LEMMATISÉE : "MUSSET"
TAILLE : 848589 occurrences, 27598 vocables, 11473 hapax
COMPOSITION : 38 textes
1_POESIES (41285 occ.), Nuit_vénitienne (11387 occ.), Articles_du_Temps (39181 occ.), COUPE_LEVRES (19298 occ.), À_QUOI_REVENT (9116 occ.), 2_POESIES (24969 occ.), Andrea_del_Sarto (19970 occ.), Caprices_de_Marianne (15959 occ.), Fantasio (14244 occ.), On_ne_badine_pas (20327 occ.), Lorenzaccio (52064 occ.), Barberine (22900 occ.), Chandelier (21879 occ.), Jurer_de_rien (22476 occ.), 3_POESIES (37126 occ.), 1_Confession (25641 occ.), 2_Confession (34535 occ.), 3_Confession (51735 occ.), Dupuy_Cotonet (31418 occ.), 4_POESIES (22678 occ.), Caprice (12705 occ.), Frédéric_Bernerette (21537 occ.), Deux_Maîtresses (25627 occ.), Emmeline (18618 occ.), Fils_du_Titien (20169 occ.), Margot (20419 occ.), Croisille (12954 occ.), Merle_blanc (12022 occ.), Pierre_Camille (20692 occ.), Secret_de_Javotte (20829 occ.), Porte_ouverte (8046 occ.), Mimi_Pinson (13542 occ.), 5_POESIES (17864 occ.), Louison (13508 occ.), Penser_à_tout (12415 occ.), Carmosine (26695 occ.), Bettine (17594 occ.), Mouche (15165 occ.)
BASE LEMMATISÉE : "NERVAL"
TAILLE : 648431 occurrences, 30533 vocables, 12599 hapax
COMPOSITION : 11 textes
1Faust (52759 occ.), 2Faust (29911 occ.), Bohême (9421 occ.), Illuminés (131648 occ.), Orient (276460 occ.), Nuits (16027 occ.), Promenades (11217 occ.), Filles (74881 occ.), himères (3379 occ.), Aurélia (37566 occ.), Pandora (5162 occ.)
BASE LEMMATISÉE : "PASCAL"
TAILLE : 256828 occurrences, 12001 vocables, 5243 hapax
COMPOSITION : 11 textes
Arithmétique (6128 occ.), Vide (25787 occ.), Passion (4999 occ.), 1Provinciales (31063 occ.), 2Provinciales (42205 occ.), 3Provinciales (49174 occ.), Persuader (12424 occ.), Discours (18027 occ.), 1Pensées (21097 occ.), 2Pensées (25443 occ.), 3Pensées (20481 occ.)
BASE LEMMATISÉE : "PERSE"
TAILLE : 87836 occurrences, 9838 vocables, 5678 hapax
COMPOSITION : 9 textes
Éloges (6559 occ.), Rois (3200 occ.), Anabase (6526 occ.), Exil (10370 occ.), Vents (19008 occ.), Amer (30464 occ.), Chroniques (3935 occ.), Oiseaux (4468 occ.), Équinoxe (3306 occ.)
BASE LEMMATISÉE : "PROUST"
TAILLE : 1490477 occurrences, 39953 vocables, 15679 hapax
COMPOSITION : 18 textes
1Swann (88830 occ.), 2Swann (94477 occ.), 3Swann (21417 occ.), 1Fleurs (83336 occ.), 2Fleurs (78696 occ.), 3Fleurs (88242 occ.), 1Guermantes (84627 occ.), 2Guermantes (95685 occ.), 3Guermantes (101247 occ.), 1Sodome (128115 occ.), 2Sodome (131309 occ.), 1Prisonnière (95240 occ.), 2Prisonnière (101694 occ.), 1Albertine (67361 occ.), 2Albertine (62731 occ.), 1Retrouvé (12717 occ.), 2Retrouvé (61023 occ.), 3Retrouvé (93730 occ.)
BASE LEMMATISÉE : "RABELAIS"
TAILLE : 334700 occurrences, 33107 vocables, 19229 hapax
COMPOSITION : 10 textes
PANTAGRUEL (46204 occ.), GARGANTUA (51674 occ.), TIERS (64511 occ.), QUART (67018 occ.), CINQ (44122 occ.), INESTIMABLES (8802 occ.), ADMIRABLES (30252 occ.), DISCIPLE (16381 occ.), PROGNOSTICATION (3167 occ.), NOUVELLE (2569 occ.)
BASE LEMMATISÉE :"RACINE"
TAILLE : 201897 occurrences, 9405 vocables, 3858 hapax
COMPOSITION : 12 textes
Thébaïde (16489 occ.), Alexandre (16257 occ.), Andromaque (18128 occ.), Plaideurs (11476 occ.), Britannicus (18622 occ.), Bérénice (16144 occ.), Bajazet (18483 occ.), Mithridate (18043 occ.), Iphigénie (18944 occ.), Phèdre (17204 occ.), Esther (13476 occ.), Athalie (18631 occ.)
BASE LEMMATISÉE : "RIMBAUD"
TAILLE : 53473 occurrences, 8745 vocables, 5308 hapax
COMPOSITION : 6 textes
Poésies (22446 occ.), Zutique (2422 occ.), Saison (9527 occ.), Proses (1814 occ.), Illuminations (10128 occ.), Lettres (7136 occ.)
BASE LEMMATISÉE : "ROUSSEAU"
TAILLE : 1551150 occurrences, 35525 vocables, 13800 hapax
COMPOSITION : 35 textes
Devin (2416 occ.), Sciences (12133 occ.), Inégalité (52101 occ.), Économie (17930 occ.), Alembert (52980 occ.), 1Héloïse (74030 occ.), 2Héloïse (56942 occ.), 3Héloïse (43427 occ.), 4Héloïse (61422 occ.), 5Héloïse (56129 occ.), 6Héloïse (74876 occ.), 1Emile (26634 occ.), 2Emile (59190 occ.), 3Emile (30180 occ.), 4Emile (95027 occ.), 5Emile (83955 occ.), Malesherbes (8101 occ.), 1Social (18333 occ.), 2Social (33930 occ.), Beaumont (23238 occ.), 1Montagne (51335 occ.), 2Montagne (40874 occ.), 1Confessions (40362 occ.), 2Confessions (44167 occ.), 3Confessions (47982 occ.), 4Confessions (61093 occ.), 5Confessions (70218 occ.), 6Confessions (54880 occ.), Paix (16200 occ.), Polysynodie (11749 occ.), Juge (117786 occ.), Pologne (41102 occ.), 1Rêveries (25258 occ.), 2Rêveries (22899 occ.), Corse (22271 occ.)
BASE LEMMATISÉE : "Sade"
TAILLE : nc
COMPOSITION : nc
Téléchargerx
BASE LEMMATISÉE : "SAND"
TAILLE : 5564812 occurrences, 62113 vocables, 19350 hapax
COMPOSITION : 62 textes
Indiana (112968 occ.), Marquise (16048 occ.), Valentine (117700 occ.), Aldo (15387 occ.), Cora (12783 occ.), Lavinia (16887 occ.), 1Lélia (128096 occ.), 2Lélia (83806 occ.), Metella (23157 occ.), Jacques (139833 occ.), Secrétaire (78373 occ.), Leone (60238 occ.), Mattea (24562 occ.), 36Corres (105276 occ.), Simon (66408 occ.), Aldini (77337 occ.), Orco (7943 occ.), Majorque (65185 occ.), Pauline (33545 occ.), Spiridion (97310 occ.), Uscoque (81242 occ.), Gabriel (52916 occ.), Horace (155079 occ.), 1Consuelo (130346 occ.), 2Consuelo (133933 occ.), 3Consuelo (153334 occ.), Comtesse (253249 occ.), Ziska (54041 occ.), Isidora (73878 occ.), Kourroglou (41098 occ.), Meunier (141629 occ.), Mare (46923 occ.), Teverino (67212 occ.), 47Corres (109827 occ.), Lucrezia (103556 occ.), Champi (60367 occ.), Fadette (74721 occ.), Château (64033 occ.), 53Corres (108497 occ.), Sonneurs (155288 occ.), 1MaVie (54209 occ.), 2MaVie (85487 occ.), 3MaVie (141521 occ.), 4MaVie (150818 occ.), 5MaVie (122424 occ.), 1Daniella (123025 occ.), 2Daniella (120030 occ.), Beaux (217784 occ.), Légendes (28845 occ.), ElleLui (82301 occ.), Promenades (54564 occ.), Valvèdre (111991 occ.), Table (121501 occ.), 63Corres (102749 occ.), Quintinie (133710 occ.), Césarine (100233 occ.), 1Voyageur (61391 occ.), Francia (49905 occ.), Nanon (117619 occ.), GrandMère (61269 occ.), 76Corresp (106640 occ.), 2Voyageur (72785 occ.)
10 textes , 85945 occurrences, 10151 mots
Chants 9685 occ , Hosties 9875, Éthiopique 12234, Postface 4585, Nocturnes 9697, Traduction 4908, Hivernage 6497, Élégies 13898, Dialogue 13657, Poèmes 909 Téléchargerx
BASE LEMMATISÉE : "STENDHAL"
TAILLE : 1270340 occurrences, 31329 vocables, 11926 hapax
COMPOSITION : 11 textes
Amour (84801 occ.), Racine (32209 occ.), Armance (74327 occ.), Rouge (216350 occ.), Égotisme (39371 occ.), Leuwen (277421 occ.), Brulard (122904 occ.), Beyle (2200 occ.), Touriste (63291 occ.), Chroniques (133876 occ.), Chartreuse (223590 occ.)
BASES NON LEMMATISÉES : "PASTRE" et "QUASTRE"
TAILLE : 1050160 occurrences, 18238 vocables
SOURCE : Version en orthographe moderne préparée par EGLAL HENEIN, Tufts University : http://astree.tufts.edu/_analyse/accueil.html
COMPOSITION : 45 textes
word_1_liminaires (2077 occ.), word_1_livre_1 (12229 occ.), word_1_livre_2 (15697 occ.), word_1_livre_3 (18467 occ.), word_1_livre_4 (26689 occ.), word_1_livre_5 (20896 occ.), word_1_livre_6 (21510 occ.), word_1_livre_7 (17196 occ.), word_1_livre_8 (27426 occ.), word_1_livre_9 (25342 occ.), word_1_livre_10 (26631 occ.), word_1_livre_11 (17334 occ.), word_1_livre_12 (16656 occ.), word_2_liminaires (1022 occ.), word_2_livre_1 (19915 occ.), word_2_livre_2 (19636 occ.), word_2_livre_3 (19651 occ.), word_2_livre_4 (27173 occ.), word_2_livre_5 (15319 occ.), word_2_livre_6 (35167 occ.), word_2_livre_7 (18109 occ.), word_2_livre_8 (22741 occ.), word_2_livre_9 (19254 occ.), word_2_livre_10 (17878 occ.), word_2_livre_11 (30183 occ.), word_2_livre_12 (41066 occ.), word_3_liminaires (2527 occ.), word_3_livre_1 (15743 occ.), word_3_livre_2 (19289 occ.), word_3_livre_3 (41050 occ.), word_3_livre_4 (30824 occ.), word_3_livre_5 (31228 occ.), word_3_livre_6 (30126 occ.), word_3_livre_7 (43106 occ.), word_3_livre_8 (22313 occ.), word_3_livre_9 (26829 occ.), word_3_livre_10 (26703 occ.), word_3_livre_11 (27537 occ.), word_3_livre_12 (40503 occ.), word_4_liminaires (56 occ.), word_4_livre_1 (25043 occ.), word_4_livre_2 (33622 occ.), word_4_livre_3 (45186 occ.), word_4_livre_4 (48730 occ.), word_4_livre_5 (4481 occ.), Téléchargerx
BASE statistique (texte absent) issue du TLF : "URFÉ"
TAILLE : 1353985 occurrences, 9917 vocables
COMPOSITION : 5 textes
1URFE (242295 occ.), 2URFE (281498 occ.), 3URFE (350733 occ.), 4URFE (414915 occ.), 5URFE (64544 occ.), Téléchargerx
BASE LEMMATISÉE : "URFEalii"
TAILLE : ???? occurrences, ???? vocables, ???? hapax
COMPOSITION : ?? textes
BASE LEMMATISÉE : "VERLAINE"
TAILLE : 79275 occurrences, 9875 vocables, 5699 hapax
COMPOSITION : 8 textes
Saturniens (10389 occ.), Galantes (2997 occ.), B_Chanson (3115 occ.), Romances (3533 occ.), Sagesse (13238 occ.), Jadis (20249 occ.), Amour (16733 occ.), Parallèlement (9021 occ.)
BASE LEMMATISÉE : "VERNE"
TAILLE : 3656992 occurrences, 61947 vocables, 22091 hapax
COMPOSITION : 42 textes
Chanteleine (41705 occ.), Ballon (102023 occ.), CentreTerre (87676 occ.), Hatteras (173841 occ.), TerreLune (67827 occ.), Grant (237577 occ.), AutourLune (70970 occ.), MilleLieues (96822 occ.), Fourrures (168764 occ.), Ville (51526 occ.), Aventures (82196 occ.), IleMyst. (237770 occ.), TourMonde (88569 occ.), DocteurOx (24245 occ.), Drame (8564 occ.), Hivernage (26152 occ.), MontBlanc (9376 occ.), Zacharius (15284 occ.), Chancellor (68140 occ.), Indes (68783 occ.), Strogoff (132842 occ.), Chine (76634 occ.), Begum (65217 occ.), Maison (150153 occ.), Jangada (120184 occ.), Bounty (8420 occ.), Kéraban (141297 occ.), RayonVert (62559 occ.), Archipel (74971 occ.), Loterie (62536 occ.), NordSud (136457 occ.), Robur (75583 occ.), Carpathes (66805 occ.), Mistress (153662 occ.), Drapeau (78848 occ.), Hélice (148303 occ.), Aérien (80479 occ.), Storitz (64559 occ.), Danube (90059 occ.), Phare (63143 occ.), Maître (64204 occ.), Hier (12267 occ.)
BASE lemmatisée : "VianAlii" (cette cbase compare l'oeuvre de Boris Vian à celle de quelques-uns de ses contemporains et particulièrement au roman policier)
TAILLE : 3 190 166 occurrences, 62 979 vocables
COMPOSITION : 43 textes dont 13 de Vian, 3 de Duras, 3 de Gary, 3 de Giono, 3 de Aragon, 3 de Pérec, 3 de Queneau et 12 romans policiers
BASE LEMMATISÉE : "VIGNY"
TAILLE : 482829 occurrences, 22918 vocables, 9511 hapax
COMPOSITION : 15 textes
Helena (9539 occ.), Antiques&M (36199 occ.), CinqMars (158992 occ.), VéritéArt (3166 occ.), Soirée (9007 occ.), Montmorency (1235 occ.), Stello (80966 occ.), DiversPoèm (2846 occ.), Chatterton (29565 occ.), 1Servitude (19627 occ.), 2Servitude (19407 occ.), 3Servitude (32703 occ.), Daphné (40734 occ.), Destinées (27718 occ.), Académie (11125 occ.)
BASE LEMMATISÉE : "VOLTAIRE"
TAILLE : 4019265 occurrences, 70148 vocables, 30430 hapax
COMPOSITION : 52 textes
OEDIPE (15851 occ.), MARIANNE (15727 occ.), HENRIADE (44266 occ.), BRUTUS (17047 occ.), Charles12 (99136 occ.), ZAÏRE (19046 occ.), TEMPLE (8023 occ.), ADELAÏDE (18143 occ.), Lettres_Ph (44961 occ.), Corr35 (286456 occ.), Métaphysique (20650 occ.), MONDAIN (2981 occ.), PRODIGUE (19385 occ.), EPÎTRES (22409 occ.), Nature_feu (18256 occ.), Newton (86020 occ.), ZULIME (16853 occ.), MAHOMET (18295 occ.), MEROPE (16849 occ.), Monde (6932 occ.), SEMIRAMIS (19545 occ.), Zadig (32173 occ.), NANINE (15075 occ.), Siècle (216112 occ.), ALENçON (8861 occ.), Micromégas (8439 occ.), ROME (17510 occ.), PUCELLE (71252 occ.), LISBONNE (3649 occ.), Moeurs1 (306774 occ.), Moeurs2 (313373 occ.), Candide (40221 occ.), Corr59 (276253 occ.), Ecossaise (20006 occ.), TANCRÈDE (19345 occ.), AutresContes (49025 occ.), OLYMPIE (19117 occ.), Tolérance (37935 occ.), DAMES (3777 occ.), 1Dictionnaire (471563 occ.), 2Dictionnaire (284729 occ.), 3Dictionnaire (334311 occ.), Ignorant (21708 occ.), Corr67 (264798 occ.), Ingénu (29336 occ.), Zapata (8415 occ.), Babylone (30273 occ.), Amabed (19379 occ.), PrendreParti (15771 occ.), Taureau (13945 occ.), Jenni (25716 occ.), Corr78 (223593 occ.)
Base YOURCENAR
TAILLE : 971310 occurrences, 42535 vocables
COMPOSITION : 16 textesTéléchargerx
BASE LEMMATISÉE : "ZOLA"
TAILLE : 3379795 occurrences, 45655 vocables, 13442 hapax
COMPOSITION : 20 textes
Fortune (146864 occ.), Curée (133100 occ.), Ventre (142389 occ.), Conquête (150808 occ.), Faute (149652 occ.), Excellence (164952 occ.), Assommoir (206211 occ.), Page (136480 occ.), Nana (187139 occ.), Pot-Bouille (179667 occ.), Bonheur (192856 occ.), Joie (153100 occ.), Germinal (214485 occ.), Oeuvre (171498 occ.), Terre (217760 occ.), Rêve (87410 occ.), Bête (166965 occ.), Argent (185538 occ.), Débâcle (244747 occ.), Pascal (148174 occ.)
HYPERBASE
Langues traitées : Français, Latin, Anglais, Espagnol, Allemand, Italien, Portugais. Domaines d’application : Littérature, Discours politique, Etude de presse, Grands corpus numériques. Plateforme : Windows 10, Seven, XP, 32/64 bits.
Deux bases textuelles sont fournies pour illustrer les fonctions du logiciel et en permettre la maîtrise. Quatre autres sont ajoutées qui sont purement statistiques et qui exploitent les données de Google Books (GOOFRE2.tbk, 70 milliards de mots), ou celles de la BNF (GALLIBASE.tbk 60 milliards) ou celles de FRANTEXT (AUTEURS.tbk, 56 millions et CHRONO.tbk, 117 millions).
Téléchargerx
HYPERDIX
Il s'agit ici d'une version plus légère d'HYPERBASE. Sous un autre nom le logiciel est exactement le même et ses fonctions identiques. Les bases textuelles d'illustration sont les mêmes et les bases statistiques également, à l'exception de la base GOOFRE2.tbk (Google Books) qui à elle seule pèserait autant que tout le reste.
Langues traitées : Français, Latin, Anglais, Espagnol, Allemand, Italien, Portugais. Domaines d’application : Littérature, Discours politique, Etude de presse, Grands corpus numériques. Plateforme : Windows 10, Seven, XP, 32/64 bits
Deux bases textuelles sont fournies pour illustrer les fonctions du logiciel et en permettre la maîtrise. Trois autres sont ajoutées qui sont purement statistiques et qui exploitent les données de la BNF (GALLIBASE.tbk 60 milliards de mots) ou celles de FRANTEXT (AUTEURS.tbk, 56 millions et CHRONO.tbk, 117 millions).
TéléchargerxBASE : "GOOFRE2" (cette base, extraite de GOOGLE BOOKS, rend compte des 70 milliards de mots recueillis en 2012 dans le domaine français. Elle ne donne pas accès au texte, mais seulement aux fréquences)
COMPOSITION : Le corpus est présenté en 12 tranches chronologiques, de 1800 à 2012. Les données ont été lemmatisées. Elles sont accessibles en mode on line ou off line.
GALLIBASE
Le présent programme est une extension du logiciel Gallicagram que Benjamin Azoulay et Benoît de Courson ont développé pour représenter l'évolution des mots ou syntagmes dans les corpus numérisés de Gallica et de beaucoup d'autres bibliothèques.
À partir des fréquences dont les graphiques rendent compte, on vise ici à constituer des tableaux où les mots sont en ligne et les années en colonne. Chaque cellule du tableau restitue la fréquence absolue (et non un pourcentage) du mot i dans l'année j. Comme Gallicagram fournit aussi le poids de chaque année dans le corpus considéré, on peut appliquer les lois classiques de la statistique et notamment le calcul de l'écart réduit sur lequel on fonde la représentation graphique des lignes mais aussi des colonnes. Les nombres traités étant souvent très considérables (cela va jusqu'au miliard), on a préféré la loi normale au calcul hypergéométrique.
L'intérêt principal de cette approche statistique, c'est qu'elle autorise l'analyse des tableaux et principalement l'analyse factorielle ( de correspondance) et l'analyse arborée (soit celle de Luong, soit celle de Splitstree).
BASE LEMMATISÉE : "BLUM"
TAILLE : 371700 occurrences, 17323 vocables, 7263 hapax
COMPOSITION : 10 textes (partition chronologique, 1930-1939)
0_Blum (30621 occ. ; 1930), 1_Blum (37999 occ. ; 1931), 2_Blum (31367 occ. ; 1932), 3_Blum (43838 occ. ; 1933), 4_Blum (30926 ; 1934), 5_Blum (37895 occ. ; 1935), 6_Blum (40734 occ. ; 1936), 7_Blum (48465 occ. ; 1937), 8_Blum (50936 occ. ; 1938), 9_Blum (18919 occ. ; 1939)
BASE LEMMATISÉE
"DISCOURS"
COMPOSITION : de Gaulle,Pompidou,Giscard,Mitterrand,Chirac,Sarkozy,Hollande,Macron
Base De GAULLE
TAILLE : 986819 occurrences, 32746 vocables
COMPOSITION : 13 textesTéléchargerx
BASE LEMMATISÉE : "ELYSEE"
TAILLE : 2286028 occurrences, 35208 vocables, 12870 hapax
COMPOSITION : 8 textes (1958-2012, un texte par mandature présidentielle)
Gaulle (221665 occ.), Pompidou (234314 occ.), Giscard (405772 occ.), 1_Mitterrand (366168 occ.), 2_Mitterrand (336163 occ.), 1_Chirac (337262 occ.), 2_Chirac (117808 occ.), Sarkozy (266876 occ.)
BASE LEMMATISÉE : "FLANDIN"
TAILLE : 318454 occurrences, 17099 vocables, 7420 hapax
COMPOSITION : 10 textes (partition annuelle chronologique 1930-1939)
0_Flandin (24157 occ., 1930), 1_Flandin (26421 occ., 1931), 2_Flandin (27495 occ., 1932), 3_Flandin (30184 occ., 1933), 4Flandin (34556 occ., 1934), 5_Flandin (37902 occ., 1935), 6_Flandin (38554 occ., 1936), 7_Flandin (35826 occ., 1937), 8_Flandin (40342 occ., 1938), 9_Flandin (23017 occ., 1939)
BASE LEMMATISÉE : "GAULLE"
TAILLE : 225616 occurrences, 11846 vocables, 5166 hapax
COMPOSITION : 12 textes (1958-1969, partition annuelle chronologique)
t1958 (10587 occ.), t1959 (12902 occ.), t1960 (23225 occ.), t1961 (20228 occ.), t1962 (19777 occ.), t1963 (19586 occ.), t1964 (19055 occ.), t1965 (35645 occ.), t1966 (16730 occ.), t1967 (22059 occ.), t1968 (16991 occ.), t1969 (8831 occ.)
BASE LEMMATISÉE : "MINISTRE"
TAILLE : 7321363 occurrences, 137247 vocables, 65106 hapax
COMPOSITION : 37 textes composés avec les données de Sketchengine autour des noms propres suivants :
Gaulle (227226 occ.) Mendès (162202 occ.) Debré (116797 occ.) Pompidou (224626 occ.) Chaban (105548 occ.) Marchais (239081 occ.) Giscard (232304 occ.) Barre (138912 occ.) Delors (231975 occ.) LePen (213903 occ.) Mitterrand (204757 occ.) Pasqua (225846 occ.) Mauroy (194016 occ.) Chevènement (202904 occ.) Badinter (224163 occ.) Chirac (226518 occ.) Balladur (224548 occ.) Rocard (218422 occ.) Lang (215339 occ.) Séguin (196072 occ.) Fabius (230028 occ.) Juppé (213983 occ.) Bérégovoy (128834 occ.) Laguiller (152482 occ.) Jospin (225283 occ.) Bayrou (200352 occ.) Sarkozy (204291 occ.) Royal (191629 occ.) Villepin (211809 occ.) Hollande (189633 occ.) Fillon (212554 occ.) Strauss (131440 occ.) Aubry (207118 occ.) Marine (193998 occ.) Copé (209688 occ.) Joly (191533 occ.) Mélenchon (201549 occ.)
BASE LEMMATISÉE : "MITTERRA"
TAILLE : 702567 occurrences, 20816 vocables, 8351 hapax
COMPOSITION : 14 textes (1981-1995, partition annuelle chronologique)
1_Mitterrand (49175 occ. ; mai1981-mai1982), 2_Mitterrand (34460 occ. ; mai1992-mai1983), 3_Mitterrand (57667 occ. ; mai1983-mai1984), 4_Mitterrand (41270 occ. ; mai1984-mai1985), 5_Mitterrand (61772 occ. ; mai1985-mai1986), 6_Mitterrand (44625 occ. ; mai1986-mai1987), 7_Mitterrand (77375 occ. ; mai1987-mai1988), 8_Mitterrand (49200 occ. ; mai1988-mai1989), 9_Mitterrand (48445 occ. ; mai1989-mai1990), 10_Mitterrand (26069 occ. ; mai1990-mai1991), 11_Mitterrand (65379 occ. ; mai1991-mai1992), 12_Mitterrand (61410 occ. ; mai1992-mai1993), 13_Mitterrand (32438 occ. ; mai1993-mai1994), 14_Mitterrand (53282 occ. ; mai1994-mai1995)
BASE LEMMATISÉE : "Sarkozy"
TAILLE : 265053 occurrences, 12048 vocables, 5105 hapax
COMPOSITION : 5 textes (partition chronologique 2007-2012)
1_Sarkozy (61729 occ. ; mai 2007-mai 2008), 2_Sarkozy (55757 occ. ; mai 2008-mai 2009), 3_Sarkozy (52778 occ. ; mai 2009-mai 2010), 4_Sarkozy (57135 occ. ; mai 2011-mai 2012), 5_Sarkozy (37654 occ. ; mai 2012-mai 2013)
TéléchargerxBASE LEMMATISÉE : "TARDIEU"
TAILLE : 391803 occurrences, 20052 vocables, 8778 hapax
COMPOSITION : 10 textes (1930-1939, partition annuelle chronologique)
0_Tardieu (46956 occ. ; 1930), 1_Tardieu (36219 occ. ; 1931), 2_Tardieu (38368 occ. ; 1932), 3_Tardieu (50639 occ. ; 1933), 4_Tardieu (33030 occ. ; 1934), 5_Tardieu (33095 occ. ; 1935), 6_Tardieu (44559 occ. ; 1936), 7_Tardieu (42793 occ. ; 1937), 8_Tardieu (39285 occ. ; 1938), 9_Tardieu (26859 occ. ; 1939)
BASE LEMMATISÉE : "THOREZ"
TAILLE : 389442 occurrences, 17970 vocables, 7558 hapax
COMPOSITION : 10 textes (1930-1939, partition annuelle chronologique)
0_Thorez (27800 occ. ; 1930), 1_Thorez (40199 occ. ; 1931), 2_Thorez (34639 occ. ; 1932), 3_Thorez (40348 occ. ; 1933), 4_Thorez (49920 occ. ; 1934), 5_Thorez (41446 occ. ; 1935), 6_Thorez (51390 occ. ; 1936), 7_Thorez (45165 occ., 1937), 8_Thorez (39496 occ. ; 1938), 9_Thorez (19039 occ. ; 1939)
HYPERBASE
Langues traitées : Français, Latin, Anglais, Espagnol, Allemand, Italien, Portugais. Domaines d’application : Littérature, Discours politique, Etude de presse, Grands corpus numériques. Plateforme : Windows 10, Seven, XP, 32/64 bits.
Deux bases textuelles sont fournies pour illustrer les fonctions du logiciel et en permettre la maîtrise. Quatre autres sont ajoutées qui sont purement statistiques et qui exploitent les données de Google Books (GOOFRE2.tbk, 70 milliards de mots), ou celles de la BNF (GALLIBASE.tbk 60 milliards) ou celles de FRANTEXT (AUTEURS.tbk, 56 millions et CHRONO.tbk, 117 millions).
Téléchargerx
HYPERDIX
Il s'agit ici d'une version plus légère d'HYPERBASE. Sous un autre nom le logiciel est exactement le même et ses fonctions identiques. Les bases textuelles d'illustration sont les mêmes et les bases statistiques également, à l'exception de la base GOOFRE2.tbk (Google Books) qui à elle seule pèserait autant que tout le reste.
Langues traitées : Français, Latin, Anglais, Espagnol, Allemand, Italien, Portugais. Domaines d’application : Littérature, Discours politique, Etude de presse, Grands corpus numériques. Plateforme : Windows 10, Seven, XP, 32/64 bits
Deux bases textuelles sont fournies pour illustrer les fonctions du logiciel et en permettre la maîtrise. Trois autres sont ajoutées qui sont purement statistiques et qui exploitent les données de la BNF (GALLIBASE.tbk 60 milliards de mots) ou celles de FRANTEXT (AUTEURS.tbk, 56 millions et CHRONO.tbk, 117 millions).
TéléchargerxBASE : "GOOFRE2" (cette base, extraite de GOOGLE BOOKS, rend compte des 70 milliards de mots recueillis en 2012 dans le domaine français. Elle ne donne pas accès au texte, mais seulement aux fréquences)
COMPOSITION : Le corpus est présenté en 12 tranches chronologiques, de 1800 à 2012. Les données ont été lemmatisées. Elles sont accessibles en mode on line ou off line.
GALLIBASE
Le présent programme est une extension du logiciel Gallicagram que Benjamin Azoulay et Benoît de Courson ont développé pour représenter l'évolution des mots ou syntagmes dans les corpus numérisés de Gallica et de beaucoup d'autres bibliothèques.
À partir des fréquences dont les graphiques rendent compte, on vise ici à constituer des tableaux où les mots sont en ligne et les années en colonne. Chaque cellule du tableau restitue la fréquence absolue (et non un pourcentage) du mot i dans l'année j. Comme Gallicagram fournit aussi le poids de chaque année dans le corpus considéré, on peut appliquer les lois classiques de la statistique et notamment le calcul de l'écart réduit sur lequel on fonde la représentation graphique des lignes mais aussi des colonnes. Les nombres traités étant souvent très considérables (cela va jusqu'au miliard), on a préféré la loi normale au calcul hypergéométrique.
L'intérêt principal de cette approche statistique, c'est qu'elle autorise l'analyse des tableaux et principalement l'analyse factorielle ( de correspondance) et l'analyse arborée (soit celle de Luong, soit celle de Splitstree).
BASE non lemmatisée : "Auteurs" (cette base, extraite de FRANTEXT, rend compte de 56 millions de mots. Elle ne donne pas accès au texte, mais seulement aux fréquences)
TAILLE : 56 477 618 occurrences, 235 100 vocables
COMPOSITION : 70 écrivains, de Montaigne à Gracq
BASE non lemmatisée : "Chrono" (cette base, extraite de FRANTEXT, rend compte de 117 millions de mots. Elle ne donne pas accès au texte, mais seulement aux fréquences)
TAILLE : 117.551.569 occurrences, 112.367 vocables, 15643 hapax
COMPOSITION : 12 tranches chronologiques (définies ci-dessous par l'année centrale)
1550 : 67014 mots, 1630 : 101892 mots, 1692 : 69612 mots, 1735 : 77841 mots, 1780 : 99028 mots, 1820 : 98905 mots, 1855 : 124845 mots, 1885 : 116085 mots, 1910 : 98488 mots, 1928 : 109218 mots, 1942 : 106498 mots, 1960 : 112367 mots
BASE LEMMATISÉE : "CRITIQUE"
TAILLE : 6834655 occurrences, 160367 vocables, 79361 hapax
COMPOSITION : 50 textes
Rabelais (173353 occ.), Montaigne (173307 occ.), Ronsard (123472 occ.), DuBellay (32491 occ.), Corneille (175577 occ.), Moliere (174524 occ.), Racine (173127 occ.), Fontaine (177733 occ.), LaBruyere (67546 occ.), Pascal (74063 occ.), Marivaux (87807 occ.), Rousseau (168648 occ.), Voltaire (175058 occ.), Diderot (170837 occ.), Montesquieu (173264 occ.), Chateaubriand (175145 occ.), Stendhal (176299 occ.), Lamartine (176994 occ.), Hugo (174709 occ.), Musset (159192 occ.), Vigny (76043 occ.), Nerval (125408 occ.), Dumas (141008 occ.), Balzac (176461 occ.), Sand (134823 occ.), Flaubert (172720 occ.), Maupassant (177359 occ.), Baudelaire (174840 occ.), Verlaine (174234 occ.), Rimbaud (175341 occ.), Verne (172554 occ.), Zola (175175 occ.), Proust (173849 occ.), Gide (170590 occ.), Valéry (85137 occ.), Claudel (169041 occ.), Péguy (170292 occ.), Breton (100629 occ.), Cocteau (170403 occ.), Giraudoux (44519 occ.), Mammeri (45373 occ.), Aragon (46436 occ.), Eluard (82222 occ.), Ionesco (87958 occ.), Exupéry (44597 occ.), Sartre (172745 occ.), Camus (171801 occ.), Giono (101491 occ.), Gracq (81825 occ.), Leclézio (56635 occ.)
BASE LEMMATISÉE : "FRANCIL" (enquête sur les variétés de la langue à travers les genres et les pays francophones)
TAILLE : 2277331 occurrences, 64078 vocables, 25331 hapax
COMPOSITION : 40 textes (issus de la francophonie)
O_Maure (38199 occ.), O_CentreAfr. (61654 occ.), O_Cameroun (39751 occ.), O_Suisse (16160 occ.), O_Belgique (91437 occ.), GloA (90576 occ.), GloM (51556 occ.), Tunis (16231 occ.), Opinion (84539 occ.), Maure (47156 occ.), Watan (22352 occ.), Actualité (26363 occ.), Révolution (55927 occ.), U_Algérie (90452 occ.), U_Maroc (48356 occ.), U_Tunisie (25922 occ.), CongrèsPC (69770 occ.), Alsace (71779 occ.), BO_Suisse (44648 occ.), Adam (72031 occ.), Dubus (56298 occ.), aKoumba (47821 occ.), aEnfant (58840 occ.), aCruel (76680 occ.), aPagne (46489 occ.), aMandinguue (38567 occ.), aBois (118459 occ.), aAmbiguë (48171 occ.), aBrûlée (48935 occ.), aBelleville (73605 occ.), mMère (47515 occ.), mPays (78398 occ.), mPrintemps (65802 occ.), mAube (52301 occ.), (mSoleil 37593 occ.), (mCollege (34200 occ.), mColline (63786 occ.), mSommeil (62431 occ.), mOpium (112374 occ.), mTraversée (44207 occ.)
Quand le téléchargement d'une base a été réalisé, la procédure d'installaiton est enclenchée automatiquement et propose par défaut l'inscription de la base et des fichiers annexes dans le répertoire c:\HYPERBAS. Accepter cettre proposition :
Avant de procéder à la copie, le système exige que l'utilisateur ait les droits d'administrateur et demande l'autorisation expresse. Fournir le cas échéant son mot de passe.
Il peut se faire que le répertoire c:\HYPERBAS soit déjà créé et contienne des fichiers communs à plusieurs bases. Refuser qu'ils soient copiés de nouveau avec l'option "non pous tous" :
La dernière étape, qui vérifie les autorisations et peut durer une minute, exige un peu de patience...
"TOUTES LES BASES ENSEMBLE" 4 bases statistiques, 70 monographies textuelles
Bases statistiques (texte absent)
Google Books (70 milliards de mots), Frantext chronologique (127 millions), Frantext écrivains (56 millions), BNF Gallica (60 milliards)
Monographies d'écrivains (texte présent)
A.France , Aragon, Balzac, Baudelaire, Bernanos, Breton, La Bruyère, Camus, Chateaubriand, Claudel, Colette, Corneille, Daudet, De Gaulle, Dib, Diderot, Dumas, Duras, Échenoz, Éluard, Ernaux, E. Sue, Saint-Exupéry, Flaubert, Correspondance de Flaubert, La Fontaine, Gary, Gautier, Gènevoix, Gide, Giono, Gracq, Hugo prose, Hugo vers, Huysmans, Lamartine, Le Clézio, Loti, Malraux, Mammeri, Marivaux, Maupassant, Mauriac, Molière, Montaigne, Montesquieu, Montherlant, Musset, Nerval, Pascal, Pérec, Proust, Queneau, Rabelais, Racine, Rimbaud, Rousseau, Sade, Saint-John Perse, Sand, Sartre, Stendhal, Tournier,Urfé, Tzara, Verlaine, Verne, Vian, Vigny, Voltaire, Yourcenar, Zola ( au total un millier de textes et 100 millions de mots)
AVERTISSEMENT
Le téléchargement de toutes les bases disponibles présente le grand avantage de disposer d'un coup de l'ensemble de la littérature française, ce qui permet l'étude de chaque écrivain, mais aussi la comparaison de l'un à l'autre. On prévient toutefois l'utilisateur que le téléchargement d'un fichier compressé de 2 gigaoctets reste une opération lourde, comme aussi le dézippage, et qu'on doit disposer de 8 gigaoctets sur le disque dur pour l'installation complète dans le répertoire C:\HYPERBAS\. Une fois l'installation accomplie, on peut réduire l'encombrement en déchargeant les bases les moins utiles sur un support extérieur, quitte à les rapatrier dans le répertoire C:\HYPERBAS\ en cas de besoin. Le programme MENU.tbk permet d'assurer aisément ces échanges, soit avec le support extérieur, soit avec le site http://ancilla.unice.fr. Téléchargerx