Sommaire
Analyse factorielle
Le programme TABLE (ou TABLEAU dans la version PC) constitue un fichier
où les données sont convenablement préparées
pour être la pâture d'un programme d'analyse factorielle connu
sous le nom de ADDAD. Ce logiciel est la propriété de ses créateurs,
à savoir: Association pour le développement de l'Analyse des
Données, 22 rue Charcot, 75013 Paris. Tél. 45 85 40 28. Responsable:
J.P. Fénelon.
On n'en trouvera ici qu'une version limitée, dotée du seul
programme d'analyse de correspondance : ADDAD.apl dans la version Mac, ANCORR.EXE
dans la version PC. Un fichier de paramètres (DATA dans la version
Mac, AFC.PAR dans la version PC) est modifié à chaque lancement
conformément aux données à analyser. En réalité
notre programme n'intervient qu'à cinq endroits:
- - pour préciser (ligne 3) le nom du fichier de données
: TABLEAU (Mac) ou TABLEAU.afc (PC)
- - pour préciser (ligne 4) le nom du fichier des résultats
: ANALYSE (Mac) ou ANALYSE.afc (PC)
- - pour indiquer le nombre de lignes (paramètre NI de la ligne
7)
- - pour indiquer le nombre de colonnes (paramètre NJ de la ligne
7)
- - enfin pour dresser la liste des noms de variables (ligne 11 et suivantes,
derrière le mot clé FLISTE)
Les versions Mac et PC ne sont pas au même niveau. Le programme original,
écrit en fortran, exige une compilation spécifique pour Windows
95, qui est en cours d'élaboration. Le programme ne fonctionne donc
actuellement qu'avec Windows 3, dans une version limitée qui propose
à l'analyse uniquement les données réduites. La version
complète viendra ultérieurement.
La version PC
Activer le bouton FACTOR, dans la page LISTES. Le fichier des paramètres
est alors construit comme suit:
Et les données sont translatées dans la zone positive, le
plus petit écart négatif étant aligné sur 0.
Voir ci-dessous.
Le déroulement du programme est visible à l'écran.
Quand tout est accompli, répondre oui à l'ultime question
(du dialogue représenté ci-dessous). Le code 0 correspond
à un traitement sans problème. Un autre code est le signe
d'une erreur, qui peut être un manque de mémoire. Dans ce cas
on peut déclencher directement le programme ANCORR.EXE, en actionnant le bouton
FAIRE L'ANALYSE ou à
parir du Gestionnaire de Windows, non sans avoir vérifié les
données (fichier TABLEAU.AFC) et les paramètres (fichier AFC.PAR).
Ci-dessous le résultat de l'analyse.
Sommaire
La version MAC
Il est possible de modifier certains autres paramètres (choix des
graphiques, des noms de variables, mise en éléments supplémentaires,
etc). Dans ce cas intervenir dans le champ qui reproduit les paramètres
actuels, dont certains sont imposés - et donc peu modifiables - par
le jeu des données ( à moins de modifier aussi ces dernières).
Eviter par exemple de changer NI ou NJ, ou la ligne de FORMAT (12X, A4,120F5.0)
qui est associée impérativement à la présentation
réelle des données.
La pondération peut être:
- - nulle (si l'on conserve les fréquences absolues),
- - légère (si l'on les transforme en logarithme, selon
la formule
x = round((log(n+1)*10)+100 ),
- - centrée (si elle se fonde sur l'écart réduit
avec translation dans la zone positive, la valeur la plus basse étant
alignée sur zéro)
Il appartient à l'utilisateur de choisir la manière qui lui
convient et qui épouse le mieux les données. Si les écarts
d'étendue ne sont pas trop importants, le choix des fréquences
absolues est celui de la moindre intervention, donc en principe le meilleur.
Mais souvent il n'est pas le plus lisible. On comparera les deux exemples
ci-dessous, issus des mêmes données, avec une pondération
différente.
La première fait appel à l'écart réduit, pour
neutraliser les différences de poids, dans les lignes comme dans
les colonnes, et donner la même chance à chaque cellule du
tableau. Comme tous les mots dans cette perspective égalitaire ont
une importance semblable, le choix de chacun est mieux marqué et
les points sont mieux répartis en formant la ronde autour du centre,
cette zone centrale étant peu fréquentée sinon par
le total de la distribution, qui rejoint, comme on s'y attend, le centre
de gravité. Ce n'est pas le lieu de commenter les résultats,
mais ils sont assez clairs: Flaubert prend parti pour le tu, comme Sartre,
alors que les formes au pluriel (vous, mais aussi nous, elles, eux, leur)
sont davantage prisées de Chateaubriand, Proust et Voltaire. Zola
est seul de son côté, dans la compagnie exclusive de la troisième
personne. Les pronoms de dialogue sont à l'autre bord et la plupart
des écrivains leur font bon accueil.
Analyse factorielle sur écarts réduits
Analyse factorielle sur logarithmes
La seconde analyse ne contredit pas la première: lignes de force
et oppositions s'exercent pareillement parmi les pronoms personnels et les
écrivains, mais elles apparaissent moins marquées.
Sommaire