GALLIBASE
Le présent programme est une extension du logiciel Gallicagram que Benjamin Azoulay et Benoît de Courson ont développé pour représenter l'évolution des mots ou syntagmes dans les corpus numérisés de Gallica et de beaucoup d'autres bibliothèques. À partir des fréquences dont les graphiques rendent compte, on vise ici à constituer des tableaux où les mots sont en ligne et les années en colonne. Chaque cellule du tableau restitue la fréquence absolue (et non un pourcentage) du mot i dans l'année j. Comme Gallicagram fournit aussi le poids de chaque année dans le corpus considéré, on peut appliquer les lois classiques de la statistique et notamment le calcul de l'écart réduit sur lequel on fonde la représentation graphique des lignes mais aussi des colonnes. Les nombres traités étant souvent très considérables (cela va jusqu'au miliard), on a préféré la loi normale au calcul hypergéométrique. L'intérêt principal de cette approche statistique, c'est qu'elle autorise l'analyse des tableaux et principalement l'analyse factorielle ( de correspondance) et l'analyse arborée (soit celle de Luong, soit celle de Splitstree).