La collecte des données, leur structuration et le développement des outils technologiques et méthodologiques nécessaires à leur exploitation et à leur analyse linguistique constituent donc le "tronc commun" aux diverses activités développées au sein de l'équipe. Les champs d'application étant variés, il va de soi que cette diversité donne lieu à d'utiles confrontations, particulièrement fructueuses au niveau épistémologique .
A partir de ce tronc commun se déploient quatre branches
principales qui constitueront les axes de recherche privilégiés
de l'équipe :
1. La recherche documentaire : elle englobe
- la collecte des données, la constitution des corpus et leur structuration sous forme de bases de données linguistiques ;
- le traitement automatique, le développement d'outils d'indexation et de recherche informatiques, la maîtrise des techniques multi-média ;
- le travail de diffusion : mise sur réseau, création
de CD-Rom.
2. Le traitement quantitatif des données : il comporte
- la recherche théorique permettant de concevoir de nouveaux outils statistiques, toujours mieux adaptés à l'objet linguistique. Il s'agit notamment de poursuivre la recherche dans le domaine de l'analyse multi-dimensionnelle en prenant appui sur les lois de la topologie mathématique ; on échappe ainsi aux contraintes des lois classiques fondées sur le schéma d'urne ;
- l'application des calculs statistiques à des problématiques linguistiques particulières (souvent lexicales, mais aussi parfois syntaxiques) et la nécessaire réflexion sur les apports et les limites de cette application ;
- l'insertion de différents outils statistiques dans des logiciels de traitement global du texte (cf. par exemple ANALYSE ARBOREE, DECRYPT, HYPERBASE, THIEF) ;
- la création de documents, notamment de monographies sur tel auteur ou sur telle oeuvre composées des index fréquentiels et de divers autres relevés statistiques commentés.
A travers ces deux derniers points, le traitement quantitatif
rejoint partiellement la recherche documentaire.
3. L'analyse du changement linguistique : l'ampleur des corpus et les facilités d'accès offertes par les moyens informatiques permettent d'appréhender le changement linguistique sous ses différents aspects :
- dans sa continuité diachronique lorsqu'il s'agit d'une langue nationale à l'histoire assez lisse et transmise par de nombreux textes, notamment littéraires (français de France, mais aussi latin, portugais) ;
- dans ses composantes géographiques et sociales lorsqu'il s'agit du français de la francophonie, de langues régionales, de dialectes ou de langues à tradition orale telles les langues africaines.
Selon le cas, les recherches philologiques ne s'appuient pas sur
les mêmes traditions épistémologiques et ne recourent
pas aux mêmes méthodes d'analyse. Leur confrontation conduira
à une réflexion globale sur les différents modèles
comparatistes et sur la validité de leurs postulats.
4. La linguistique de l'énonciation : le commerce régulier avec les textes, c'est-à-dire avec les données discursives, appelle à pratiquer une linguistique théorique propre à rendre compte des phénomènes énonciatifs.
- Les analyses énonciatives s'appuient en général sur des listes paradigmatiques d'énoncés en relation paraphrastique, toujours étudiés en contexte explicite : la constitution de telles listes est d'autant plus fiable qu'elle prend sa source dans des relevés exhaustifs d'occurrences. Pour les états de langue anciens en particulier, seule cette exhaustivité des emplois attestés permet de pallier en partie l'impossibilité d'avoir accès à la compétence du locuteur.
- La variété des valeurs d'emploi d'un même signifiant dans les textes oblige d'une part à situer les analyses de signifié à un niveau métalinguistique suffisamment abstrait pour expliquer cette variabilité à partir d'une valeur invariante sans devoir recourir à des processus de dérivation ad hoc, d'autre part à intégrer dans l'analyse les contraintes contextuelles, y compris pragmatiques.
- Le cadre théorique adopté conduit à repérer
et à formaliser les opérations mentales et énonciatives
mises en oeuvre et observables dans le discours et remet profondément
en cause les clivages traditionnels, les séparations commodes, mais
sans doute excessivement marquées, entre les diverses catégories
grammaticales, ou bien encore entre syntaxe, sémantique et pragmatique.
Ainsi la pratique du travail sur corpus induit le choix d'une théorie
linguistique appropriée qui, contrairement à ce que son nom
laisse supposer, ne s'intéresse pas seulement aux actes énonciatifs,
mais est aussi - et peut-être surtout - une théorie des catégories
grammaticales.