La structure lexicale. SOMMAIRE

Retour à la base Rabelais
Dictionnaire hiérarchique (par frés décroissantes)
Tableau de distribution des fréquences
Étendue du vocabulaire et Hapax
Courbe de la richesse lexicale
Courbe de distribution des hapax
Accroissement du vocabulaire
Courbe de l'accroissement lexical
Accroissement du vocabulaire (ordre inverse)
Courbe de l'accroissement inverse
Distance lexicale
Distance de Pantagruel
Distance de Gargantua
Distance du Tiers Livre
Distance du Quart Livre
Distance du Livre Cinquième
Distance des Chronicques Admirables
Distance des Chronicques Inestimables
Distance du Disciple de Pantagruel
Distance de la Pantagrueline Prognostication
Distance de la Prognostication Nouvelle
Analyse factorielle

Sommaire

Dictionnaire hiérarchique (par frés décroissantes)

rang frq mot rang frq mot rang frq mot

1 23847 , 31 1338 n' 61 628 leurs
2 12917 . 32 1315 une 62 622 c'
3 11717 et 33 1205 si 63 611 elle
4 11277 de 34 1203 plus 64 602 Gargantua
5 6455 en 35 1180 nous 65 596 ainsi
6 5515 la 36 1176 son 66 562 comment
7 5417 le 37 1161 estoit 67 561 mon
8 5107 les 38 1155 dist 68 553 sans
9 4865 que 39 1124 à 69 553 Panurge
10 4527 a 40 1073 se 70 551 faict
11 3621 : 41 1042 ? 71 551 bon
12 3374 il 42 1030 mais 72 546 sus
13 3363 l' 43 977 car 73 541 deux
14 2704 par 44 976 y 74 517 non
15 2594 ne 45 954 tous 75 516 ceste
16 2280 je 46 952 tout 76 490 fut
17 2278 d' 47 930 on 77 487 estre
18 2161 qu' 48 916 ilz 78 484 roy
19 2070 est 49 899 tant 79 468 aultres
20 1996 vous 50 883 ( 80 450 Dieu
21 1971 des 51 879 ) 81 440 avecques
22 1942 ce 52 832 ou 82 426 grand
23 1940 un 53 831 sa 83 426 gens
24 1807 comme 54 800 leur 84 426 faire
25 1773 au 55 790 me 85 424 puis
26 1716 qui 56 752 s' 86 417 estoient
27 1710 pour 57 684 ses 87 411 temps
28 1602 du 58 679 sont 88 409 ung
29 1433 bien 59 636 Pantagruel 89 409 ces
30 1351 luy 60 634 avoit 90 390 feut


--------------------------------------------------


91 390 c 121 281 ay 151 215 mer
92 384 j' 122 275 ma 152 209 f
93 383 aultre 123 274 terre 153 208 te
94 369 tu 124 273 sur 154 208 fist
95 369 toutes 125 270 or 155 208 >
96 366 aussi 126 270 grande 156 207 cens
97 365 lors 127 268 vostre 157 205 femme
98 362 laquelle 128 268 m' 158 201 grant
99 361 quelque 129 267 fort 159 201 foys
100 360 es 130 265 frere 160 201 diable
101 354 lequel 131 265 - 161 200 vin
102 351 toute 132 264 pays 162 199 ny
103 347 chapitre 133 259 nostre 163 196 ville
104 335 peu 134 254 eust 164 193 Merlin
105 329 quand 135 251 pas 165 192 feist
106 326 entre 136 246 sera 166 191 homme
107 325 dont 137 244 mal 167 191 chap
108 322 quant 138 243 elles 168 188 heure
109 321 dict 139 239 jusques 169 188 ceulx
110 320 icy 140 238 avoir 170 187 cause
111 317 respondit 141 237 contre 171 186 lieu
112 315 jour 142 236 moy 172 185 beau
113 310 apres 143 231 poinct 173 184 diables
114 304 rien 144 223 encores 174 180 ils
115 303 dedans 145 222 veu 175 179 quatre
116 301 aux 146 222 soy
117 298 monde 147 221 troys
118 293 ont 148 218 chascun
119 287 quoy 149 218 <
120 285 jamais 150 216 dire
Sommaire

TABLEAU DE DISTRIBUTION

1-Le Tableau de distribution des fréquences contient les effectifs des fréquences de 1 à 99. Cela est très largement suffisant pour les calculs ultérieurs.
TABLEAU DE DISTRIBUTION DES CLASSES DE FREQUENCE (de 1 à 100)

Fréq. Effectif Fréq. Effectif Fréq. Effectif Fréq. Effectif

1 19479 26 35 51 6 76 5
2 5005 27 30 52 4 77 7
3 2311 28 34 53 10 78 5
4 1361 29 33 54 4 79 3
5 847 30 33 55 8 80 8
6 630 31 14 56 6 81 4
7 453 32 18 57 5 82 2
8 360 33 16 58 15 83 4
9 286 34 24 59 9 84 3
10 230 35 20 60 8 85 4
11 212 36 19 61 8 86 1
12 179 37 20 62 7 87 2
13 134 38 14 63 5 88 5
14 130 39 15 64 4 89 3
15 91 40 18 65 7 90 5
16 89 41 15 66 10 91 3
17 72 42 13 67 5 92 10
18 70 43 8 68 4 93 4
19 80 44 17 69 4 94 3
20 64 45 11 70 2 95 2
21 63 46 15 71 5 96 4
22 55 47 9 72 1 97 7
23 39 48 9 73 4 98 2
24 49 49 7 74 5 99 2
25 31 50 15 75 6 100 1
Sommaire

ETENDUE DU VOCABULAIRE et HAPAX

2 - Le calcul du vocabulaire théorique de chaque sous-ensembl met en jeu la loi binomiale, selon la méthode de Charles Muller. Il donne lieu à des écarts, le plus souvent négatifs, qui sont convertis en écarts réduits, puis en histogramme.
On trouve également le relevé des hapax (ou mots employés une seule fois dans le corpus). Un écart réduit est là aussi calculé qui donne lieu à une représentation graphique.
TABLEAU DE LA RICHESSE LEXICALE
(Méthode de la loi binomiale)

n¡ réel théo écart réduit Hapax réduit Titre

1 8293 9374 -1081 -11.17 2925 4.90 PANTAGRUEL
2 9368 10128 -760 -7.55 3275 5.31 GARGANTUA
3 11362 11785 -423 -3.9 4424 12.16 TIERS
4 11271 12093 -822 -7.47 4043 2.56 QUART
5 8002 9078 -1076 -11.29 2716 3.14 CINQUIESME
6 1614 2794 -1180 -22.32 150 -16.22 Chron Inestimables
7 4020 6955 -2935 -35.19 818 -23.56 Chroniq Admirables
8 3132 4449 -1317 -19.74 800 -5.09 Le Disciple
9 1135 1306 -171 -4.73 238 3.98 Pantagr Prognost
10 560 1128 -568 -16.91 90 -4.89 Pronost Nouvelle
Sommaire

TABLEAU DE L'ACCROISSEMENT LEXICAL

3 - Deux tableaux rendent compte de l'accroissement du vocabulaire, d'abord dans l'ordre chonologique, puis dans l'ordre inverse. Ici le calcul fait appel à un ajustement des deux séries parallèles (vocabulaire cumulé et étendue cumulée) grâce à une fonction puissance de type:
y = a * x (exposant b)
pour x = vocabulaire cumulé et y = étendue cumulée théorique
L'écart entre étendue théorique et étendue réelle est alors calculé pour chaque texte, puis pondéré, et enfin soumis à une représentation graphique, grâce au programme COURBE.
ACCROISSEMENT CHRONO    Acc  Vocab  VocCum(x)  Occur   OccCum    Ecart   Pondéré

PANTAGRUEL 8293 8293 8293 46204 46204 -1601.42 -.35
GARGANTUA 6213 9368 14506 51674 97878 2374.24 0.46
TIERS 7148 11362 21654 64511 162389 11061.08 1.71
QUART 5442 11271 27096 67018 229407 -1726.40 -.26
CINQUIESME 3455 8002 30551 44122 273529 367.21 0.08
Chron Inestimables 352 1614 30903 8802 282331 -4145.42 -4.71
Chroniq Admirables 1130 4020 32033 30252 312583 -15153.26 -5.01
Le Disciple 934 3132 32967 16381 328964 -3730.95 -2.28
Pantagr Prognost 256 1135 33223 3167 332131 326.78 1.03
Pronost Nouvelle 105 560 33328 2569 334700 -1132.73 -4.41

Fonction y=a(x exposant b): a=.12195 b=1.41964 r2=.99604 r=.99802>
Sommaire

TABLEAU DE L'ACCROISSEMENT LEXICAL (ordre inverse)

ACCROISSEMENT INVERSE Acc Vocab VocCum(x) Occur OccCum Ecart Pondéré

PANTAGRUEL 3207 8293 33328 46204 334700 -7603.32 -1.65
GARGANTUA 4087 9368 30121 51674 288496 -3832.96 -.74
TIERS 5934 11362 26034 64511 236822 1890.80 0.29
QUART 7093 11271 20100 67018 172311 6518.28 0.97
CINQUIESME 5813 8002 13007 44122 105293 9677.69 2.19
Chron Inestimables 308 1614 7194 8802 61171 -6169.68 -7.01
Chroniq Admirables 2725 4020 6886 30252 52369 -8252.86 -2.73
Le Disciple 2661 3132 4161 16381 22117 1977.20 1.21
Pantagr Prognost 940 1135 1500 3167 5736 1987.95 6.28
Pronost Nouvelle 560 560 560 2569 2569 -376.85 -1.47

Fonction y=a(x exposant b): a=.92792 b=1.22749 r2=.99372 r=.99686
Sommaire

Distance lexicale

4 - Enfin le programme DISTANCE permet de calculer à quelle distance respective les textes se tiennent les uns des autres. Ce calcul, qui repose sur l'étendue du vocabulaire commun à deux textes , est réitéré pour chaque paire. La distance obtenue tient compte de l'étendue de l'un et l'autre vocabulaires, selon la formule: d = ((a-ab)/a) + ((b-ab)/b), où ab désigne la partie commune aux vocabulaires a et b ( a-ab et b-ab recouvrant les parties privatives).
Les COURBES offrent une représentation graphique de la distance variable qu'un texte établit avec tous les autres, tandis que l'ANALYSE FACTORIELLE envisage l'ensemble de ces distances et propose une typologie des textes selon les liens lexicaux qu'ils nouent entre eux.

PANTAGRUEL  PANT 1239 1283 1399 1377 1427 1269 1317 1388 1393 1441  
GARGANTUA GARG 1283 1252 1352 1322 1391 1282 1371 1376 1405 1421
TIERS TIER 1399 1352 1225 1255 1377 1396 1442 1449 1381 1350
QUART QUAR 1377 1322 1255 1225 1335 1332 1400 1404 1415 1368
CINQUIESME CINQ 1427 1391 1377 1335 1305 1416 1452 1445 1482 1373
Chron Inest Ines 1269 1282 1396 1332 1416 912 942 1343 1545 1533
Chroniq Adm Admi 1317 1371 1442 1400 1452 942 912 1370 1488 1453
Le Disciple Disc 1388 1376 1449 1404 1445 1343 1370 1313 1547 1501
Pantagr Pro Prog 1393 1405 1381 1415 1482 1545 1488 1547 1351 1480
Pronost Nou Nouv 1441 1421 1350 1368 1373 1533 1453 1501 1480 1320
PANT GARG TIER QUAR CINQ Ines Admi Disc Prog Nouv
(distance globale des textes deux à deux)
Nombre de formes communes

PANT GARG TIER QUAR CINQ Ines Admi Disc Prog Nouv
PANT 0 3155 2881 2978 2332 988 1850 1392 606 293
GARG 0 0 3329 3471 2630 988 1769 1465 602 306
TIER 0 0 0 4215 2924 853 1658 1352 639 347
QUAR 0 0 0 0 3114 943 1779 1460 603 337
CINQ 0 0 0 0 0 784 1467 1249 515 328
Ines 0 0 0 0 0 0 1218 700 303 194
Admi 0 0 0 0 0 0 0 1109 453 269
Disc 0 0 0 0 0 0 0 0 377 237
Prog 0 0 0 0 0 0 0 0 0 195
Nouv 0 0 0 0 0 0 0 0 0 0
Nombre de formes privatives

PANT GARG TIER QUAR CINQ Ines Admi Disc Prog Nouv
PANT 0 5138 5412 5315 5961 7305 6443 6901 7687 8000
GARG 6213 0 6039 5897 6738 8380 7599 7903 8766 9062
TIER 8481 8033 0 7147 8438 10509 9704 10010 10723 11015
QUAR 8293 7800 7056 0 8157 10328 9492 9811 10668 10934
CINQ 5670 5372 5078 4888 0 7218 6535 6753 7487 7674
Ines 626 626 761 671 830 0 396 914 1311 1420
Admi 2170 2251 2362 2241 2553 2802 0 2911 3567 3751
Disc 1740 1667 1780 1672 1883 2432 2023 0 2755 2895
Prog 529 533 496 532 620 832 682 758 0 940
Nouv 267 254 213 223 232 366 291 323 365 0
Indice d'indépendance a->b et b->a

PANT GARG TIER QUAR CINQ Ines Admi Disc Prog Nouv
PANT 0 .6196 .6526 .6409 .7188 .8809 .7769 .8321 .9269 .9647
GARG .6632 0 .6446 .6295 .7193 .8945 .8112 .8436 .9357 .9673
TIER .7464 .7070 0 .6290 .7427 .9249 .8541 .8810 .9438 .9695
QUAR .7358 .6920 .6260 0 .7237 .9163 .8422 .8705 .9465 .9701
CINQ .7086 .6713 .6346 .6108 0 .9020 .8167 .8439 .9356 .9590
Ines .3879 .3879 .4715 .4157 .5143 0 .2454 .5663 .8123 .8798
Admi .5398 .5600 .5876 .5575 .6351 .6970 0 .7241 .8873 .9331
Disc .5556 .5322 .5683 .5338 .6012 .7765 .6459 0 .8796 .9243
Prog .4661 .4696 .4370 .4687 .5463 .7330 .6009 .6678 0 .8282
Nouv .4768 .4536 .3804 .3982 .4143 .6536 .5196 .5768 .6518 0

Sommaire

ANALYSE FACTORIELLE de la DISTANCE LEXICALE

****************************************** * * * B I B L I O T H E Q U E A D D A D * * * * Macintosh (VERSION 89) * * * * 27/05/89 * * 27 Aout 1995 20:50: 4* ****************************************** A D D A D - 89 - ANALYSE DES CORRESPONDANCES (ANCORR) D'APRES : YAGOLNITZER ET TABET INS. 1 - TITRE : TITRE ANALYSE FACTORIELLE; INS. 2 - PARAM (PARAMETRES GENERAUX) : NI,NJ,NF,NI2,NJ2,LECIJ,STFI,STFJ PARAM NI = 10 NJ = 10 NF = 5 ; INS. 3 - OPTIONS : IOUT,IMPVP,IMPFI,IMPFJ,NGR OPTIONS IMPFI=1 IMPFJ=1 NGR=2 ; INS. 5 - GRAPHE (NGR DEMANDES DE GRAPHIQUES) : X,Y,GI,GJ,NCHAR,OPT,NPAGE,CADRE GRAPHE X=1 Y=2 GI = 3 GJ=0; GRAPHE X=3 Y=4 GI = 3 GJ=0; INS. 6 - LISTE (LECTURE DU TABLEAU DES DONNEES - A,F) : FLISTE PANTAGRUEL GARGANTUA TIERS QUART CINQUIESME INESTIMABL ADMIRABLES DISCIPLE PROGNOST NOUVELLE ; (12X,A4,120F5.0) ; LES POIDS DES LIGNES ET DES COLONNES SONT MULTIPLIES PAR 10 ** -2 ------------------------------------------------------------------------ NOMJ(J)| PANT GARG TIER QUAR CINQ INES ADMI DISC PROG NOUV ------------------------------------------------------------------------ PJ(J) | 135 135 136 134 140 130 131 141 145 142 1370 ------------------------------------------------------------------------ LES VALEURS PROPRES VAL(1)= 1.00000 ------------------------------------------------------------------------------ |NUM | VAL PROPRE | POURC.| CUMUL |VARIAT.|*| HISTOGRAMME DES VALEURS PROPRES ------------------------------------------------------------------------------ | 2 | .00435 | 83.727| 83.727|*******|*|***************|***************| | 3 | .00035 | 6.758| 90.485| 76.969|*|** | 4 | .00024 | 4.617| 95.103| 2.141|*|** | 5 | .00016 | 3.020| 98.122| 1.598|*|* | 6 | .00005 | .995| 99.117| 2.025|*| | 7 | .00002 | .412| 99.529| .583|*| | 8 | .00002 | .402| 99.931| .010|*| | 9 | 0.00000 | .048| 99.978| .354|*| | 10 | 0.00000 | .022|100.000| .026|*| --------------------------------------------------------------------- | I1 | QLT POID INR| 1#F COR CTR| 2#F COR CTR| 3#F COR CTR| --------------------------------------------------------------------- 1|PANT| 976 99 23| -7 37 1| 33 884 301| -3 6 3| 2|GARG| 959 98 16| 11 142 3| 23 619 145| 9 87 30| 3|TIER| 992 99 69| 54 815 67| -15 58 60| -8 16 24| 4|QUAR| 995 98 39| 38 700 32| -15 108 62| 7 25 21| 5|CINQ| 968 102 47| 41 690 39| -18 129 90| 13 67 68| 6|Ines| 996 95 309| -129 980 362| -4 1 5| 5 2 11| 7|Admi| 997 96 309| -127 957 353| -14 12 56| -18 20 133| 8|Disc| 999 103 27| -7 32 1| 11 89 35| 29 629 361| 9|Prog| 984 106 79| 52 684 64| 20 100 117| -27 194 331| 10|Nouv| 979 104 83| 57 783 77| -21 107 130| -6 10 17| --------------------------------------------------------------------- | | 1000| 1000| 1000| 1000| --------------------------------------------------------------------- --------------------------------------------------------------------- | J1 | QLT POID INR| 1#F COR CTR| 2#F COR CTR| 3#F COR CTR| --------------------------------------------------------------------- 1|PANT| 976 99 23| 7 37 1| -33 884 301| 3 6 3| 2|GARG| 959 98 16| -11 142 3| -23 619 145| -9 87 30| 3|TIER| 992 99 69| -54 815 67| 15 58 60| 8 16 24| 4|QUAR| 995 98 39| -38 700 32| 15 108 62| -7 25 21| 5|CINQ| 968 102 47| -41 690 39| 18 129 90| -13 67 68| 6|INES| 996 95 309| 129 980 362| 4 1 5| -5 2 11| 7|ADMI| 997 96 309| 127 957 353| 14 12 56| 18 20 133| 8|DISC| 999 103 27| 7 32 1| -11 89 35| -29 629 361| 9|PROG| 984 106 79| -52 684 64| -20 100 117| 27 194 331| 10|NOUV| 979 104 83| -57 783 77| 21 107 130| 6 10 17| --------------------------------------------------------------------- | | 1000| 1000| 1000| 1000| --------------------------------------------------------------------- AXE HORIZONTAL( 1)--AXE VERTICAL( 2)--TITRE:ANALYSE FACTORIELLE NOMBRE DE POINTS : 10 ==ECHELLE : 4 CARACTERE(S) = .010 1 LIGNE = .004 +----------------------------------------PANTAGRUEL --------------------+ | | | | | GARGANTUA | | | Prog-| | | nostication | Disciple | | | | +-----------------------------------------------+-----------------------+ Inestimables | | | | | Admirables | TIERS| | | QUART | | | CINQ Nouvelle +-----------------------------------------------+-----------------------+ NOMBRE DE POINTS SUPERPOSES : 1 CINQ(QUAR) Sommaire AXE HORIZONTAL( 3)--AXE VERTICAL( 4)--TITRE:ANALYSE FACTORIELLE NOMBRE DE POINTS : 10 ==ECHELLE : 4 CARACTERE(S) = .003 1 LIGNE = .001 +---------------------Nouvelle +---------------------------------------+ | | | | | | | | | | | Disciple| | Admirables | | | | CINQ | | | | | | | | | | | PANT| | | | | Prognostication | | +-------------------------------+---------------------------------------+ | | | | | | | | | | | | | | GARGANTUA | | | | | | | | | | | | | | | | | | Inestimables | | | | | | | | TIERS | QUART | +-------------------------------+---------------------------------------+ FIN NORMALE DU PROGRAMME ANCORR PLACE MEMOIRE DEMANDEE : 8000 PLACE MEMOIRE UTILISEE : 160
Sommaire