Retour au sommaire

LE TRAITEMENT DES LISTES

On a vu précédemment comment l'on pouvait constituer des listes de mots, afin de faire une concordance limitée aux formes contenues dans cette liste. Le tableau à deux dimensions qui en résulte se prête aussi et plus encore à l'exploitation statistique. De tels tableaux représentent le plus souvent des mots individuels, nommément désignés ou répondant à des critères de sélection:

- l'initiale

- la finale

- la présence d'une chaîne quelconque

- ou bien encore un seuil de fréquence

- ou l'appartenance à certaines catégories grammaticales à effectif restreint.

Mais certains tableaux regroupent des ensembles constitués autour d'un caractère particulier, en particulier:

-  la longueur du mot

- ou la classe de fréquence.

À chacun de ces modes de sélection est réservé un bouton au haut de l'écran.

Exemple de liste: les pronoms personnels dans le corpus Rabelais

Tout d'abord il est loisible de représenter graphiquement une ligne (c'est à dire un mot) de ce tableau. Il suffit de cliquer sur ce mot. En outre la totalisation complète ou partielle des lignes du tableau peut être réalisée en agissant sur le bouton x(+/-), lequel peut en outre opérer des manipulations soustractives. Parallèlement aux totalisations opérées sur les effectifs absolus, un tableau d'écarts réduits est tenu à jour et peut être porté à l'écran, si on sollicite le bouton ECART/FREQU, comme représenté ci-dessous.

Totalisation et transformation en écart réduits

Histogramme correspondant au total de la série

LA REPRÉSENTATION GRAPHIQUE DES COLONNES

Enfin le programme d'illustration graphique offre une variante qui analyse les éléments d'une colonne, dans un tableau de fréquences où généralement les lignes désignent les mots et les colonnes les textes. Un tel graphique permet non plus de suivre la distribution d'un mot à travers les textes, mais de dresser le profil d'un texte à travers les mots qui s'y trouvent employés ou les faits linguistiques qu'on a soumis au dénombrement.

Dans cette approche comme dans la précédente c'est l'écart réduit qui sert d'ordonnée à l'histogramme. Le clic portera cette fois sur le texte qui correspond à la colonne souhaitée et qui figure avec les autres textes sur la ligne supérieure.

On prendre garde à ignorer le coefficient de corrélation qui dans cette perspective n'a guère de signification. Dans le cas le plus fréquent, l'ordre des mots d'une liste est alphabétique, c'est-à-dire arbitraire, et ne peut donner lieu à aucune découverte. Mais si l'on dispose les mots selon un ordre logique, comme dans l'exemple suivant, où l'on passe progressivement de la première à la troisième personne, le coefficient retrouve son efficience.

Histogramme d'une colonne (d'un texte)

Retour au sommaire