Revenir à l'écran précédent par la commande BACK.

Note brève à propos des calculs statistiques

a - Chaque forme a fait l'objet de test statistiques (généralement des écarts réduits) , soit pour comparer l'emploi du mot chez Balzac à l'usage qui est fait du même mot dans le grand corpus XIX-XXe du Trésor de la langue française, soit pour comparer entre eux les textes du corpus Balzac, à travers la distribution du mot. Le signe du test indique s'il s'agit d'un excédent ou d'un déficit. Excédent et déficit sont proportionnels à la valeur absolue de l'écart réduit. Si cette valeur est inférieure à 2, le hasard ne peut être rejeté et l'écart n'est pas significatif. Pour le calcul des tests et les formules utilisées, nous renvoyons aux ouvrages de Charles Muller (Initiation aux méthodes de la statistique linguistique et Principes et méthodes de statistique lexicale, Champion, Paris).

b - Les formes de grande fréquence (supérieure à 360) ont reçu un traitement spécial: d'une part on restitue le détail des sous-fréquences dans chacun des textes du corpus; d'autre part un histogramme est disponible si l'on sollicite le lien proposé ( courbe du mot ). Le graphique est obtenu à partir des écarts réduits, calculés pour chaque texte compte tenu de son étendue, l'ensermble du corpus Balzac servant de "norme". La tendance chronologique est livrée par un coefficient de corrélation, dont le signe détermine l'orientation, à la hausse ou à la baisse, et dont la pente s'accentue au fur et à mesure qu'on s'approche des valeurs limites -1 et +1.