Retour au sommaire

LA FONCTION CONCORDANCE

2 - Si l'on fait appel à la fonction CONCORDANCE du menu principal (écran ci-dessous), on obtient un contexte étroit qui tient en une ligne et qui montre la forme (ou l'expression) cherchée, en position centrale, avec une demi-douzaine de mots à gauche et à droite. À côté des boutons habituels de navigation, d'enregistrement et d'impression, on remarquera une fonction de tri (bouton TRIER), qui est destinée à fournir une autre présentation des contextes. Au lieu de suivre l'ordre normal qui respecte la suite des textes, les contextes sont groupés selon leur environnement immédiat, à gauche ou à droite du mot-pôle. Cela souligne la résurgence de syntagmes répétitifs qui ressortissent souvent aux contraintes syntaxiques mais révèlent parfois aussi les tendances phraséologiques de l'auteur.

Si l'on estime trop étroite la fenêtre de concordance, un simple clic sur une ligne permet de retrouver la page concernée, qui reste exposée (avec mise en relief du mot) jusqu'au moment où un second clic la fait disparaître, comme on peut le constater ci-dessous pour le premier exemple de la concordance du mot Russie chez Balzac.

Résultats du programme CONCORDANCE

Renvoi au texte intégral

Dans les deux procédures, CONTEXTE et CONCORDANCE, des options sont offertes à l'utilisateur pour qu'il puisse préciser la portée et l'objet de sa recherche.

Portée de la recherche

La recherche peut en effet parcourir l'ensemble du corpus ou être focalisée sur un texte seulement. Si la fréquence est basse (inférieure à 100), la question n'est pas posée et la recherche est exhaustive sans autre forme de procès (car le temps passé à poser la question et à recevoir la réponse dépasserait celui qui est nécessaire à l'action elle-même). Si la fréquence est supérieure à 100, l'utilisateur est invité à choisir le texte qui l'intéresse et qui limitera la portée de la recherche et le volume des résultats. Il peut néanmoins exiger que la portée soit étendue à la totalité du corpus.

Objet de la recherche

La recherche peut porter non seulement sur une forme, mais aussi:

a - sur une EXPRESSION (une suite de mots ou de signes), par exemple bout du tunnel. Les signes de ponctuations sont acceptés à l'intérieur de ces expressions, à condition qu'ils soient précédés et suivis d'un blanc, cette règle s'appliquant aussi au trait d'union. Cas particulier: l'apostrophe, qui doit être suivie mais non précédée d'un blanc:

x(aujourd' hui) ou x(l' amour) qu'on opposera à x(presse - bouton) ou x(à la mode .)

Dans ce dernier cas, le point permet de choisir certaines clausules finales. Ces règles s'appliquent même si le texte d'origine obéit à des conventions différentes, car ce texte a été recomposé dans la phase de préparation, afin que le programme ne soit pas dépendant des particularités de la saisie.

b - sur les DÉBUTS DE MOT, ce qui résout en partie les problèmes de la lemmatisation ou du regroupement des formes. En fournissant la chaîne aim, on atteindra indirectement toutes les formes conjuguées du verbe aimer, mêlées il est vrai à des formes ou dérivés étrangers au paradigme proposé.

c - sur une CHAINE de caractères, où qu'elle se trouve dans un mot. Ainsi en recherchant la chaîne thé, on obtiendra non seulement la boisson anglaise, mais aussi théâtre, athée et Léthé.

d - sur les FINS DE MOT. Il s'agit là d'une forme particulière du cas précédent, un blanc étant ajouté - par le programme - à la chaîne recherchée. Ainsi en formulant une demande sous la forme ment, on filtrera tous les dérivés en -ment . (Attention! il n'y a pas de catégorisation grammaticale dans ce programme simplifié, et le suffixe en -ment récoltera les adverbes (sciemment) aussi bien que les substantifs (jugement) et quelques verbes (aiment) ou adjectifs (dément).

e - sur les COOCCURRENCES (programme CONTEXTE). Seuls sont restitués les contextes qui contiennent la présence simultanée de deux formes choisies. Par contexte il faut entendre la page originale .

f - sur une LISTE DE MOTS, préalablement constituée (programme CONCORDANCE).

LES LISTES DE MOTS

Solliciter d'abord le bouton LISTE de la carte principale, qui adresse l'utilisateur à une page spéciale où divers modules de sélection sont proposés: DEBUT DE MOT, FIN DE MOT, CHAINE dont l'effet est semblable aux options des commandes CONTEXTE ou CONCORDANCE. Le remplissage de la liste courante peut aussi être libre. L'utilisateur fournit alors autant de formes qu'il veut, en signifiant à la machine par un mot vide que la liste est close.

Une fois constituée la liste peut être soumise d'un coup au programme de concordance, mais aussi à l'analyse factorielle (voir plus loin) ou à la représentation graphique, en sorte que son statut relève davantage des fonctions statistiques que nous allons examiner maintenant.

Ci-dessous un exemple de liste empruntée à Rabelais et détaillant la répartition d'une famille de mots à laquelle le nom de Cambronne n'était pas encore attaché.

Liste des mots contenant la chaîne merd chez Rabelais

Noter que cette liste est modifiable et provisoire. On peut effacer un de ses éléments par un clic (associé à la touche MAJUSCULE). On efface la liste entière en en constituant une autre. Mais on peut aussi la compléter, la nouvelle liste s'ajoutant à la première. Un dialogue permet de choisir entre le remplacement ou le complément. Certaines limites liées toutefois à la contenance des pages doivent être respectées. Comme un même champ ne peut accepter plus de 30000 caractères, la liste aura autant de lignes que le champ peut en contenir, ce qui varie avec la longueur de la ligne, et en fin de compte avec le nombre de textes. Quand le détail risque de conduire au dépassement, il est possible de se contenter du cumul de tous les mots en un seul total.

Retour au sommaire