Le logiciel HYPERBASE Versions Mac et Window

Retour au sommaire

DESCRIPTION

Il existe en France une immense base de données littéraires et linguistiques, qui contient près de 3000 textes et plus de 150 millions de mots, et qui n'a guère d'équivalent au monde. Sous le nom de FRANTEXT, cette base a été réalisée par l'Institut National de la Langue Française, de même que le produit dérivé DISCOTEXT 1 qui utilise le support du CD-Rom et offre quelque 550 titres.

Etienne BRUNET, qui appartient au même Institut, a conçu un logiciel documentaire et statistique, complémentaire des précédents. Un premier prototype, appelé Hyperbase, a vu le jour en 1989, à l'occasion de la célébration du Bicentenaire. Il s'agissait alors de présenter les textes de la Révolution au public du Centre Pompidou. Cette première version était orientée vers le CD-Rom dans lequel sont livrés tout ensemble les données et le logiciel d'exploitation. D'autres produits de ce type ont suivi, notamment un CD-Rom Rabelais, réalisé avec Marie-Luce DEMONET, un CD-Rom THIEF qui facilite l'exploitation statistique de Frantext, en mode off line ou on line, et plusieurs prototypes, non encore commercialisés (CD-ROM Balzac, CD-Rom Julien Gracq, CD-Rom Paul Éluard).

Quoique livrée auussi sur CD-Rom, la présente version d'Hyperbase repose sur des principes plus ouverts. Le logiciel comprend non seulement le programme d'exploitation, mais aussi le module de préparation et d'indexation. L'utilisateur peut donc se débarrasser des données initiales et traiter les siennes propres.

Le programme d'exploitation répond, par les méthodes de l'hypertexte, aux besoins classiques du traitement automatique des textes: index sélectifs ou systématiques, dictionnaires des fréquences, concordances, sélection de contextes élargis, cooccurrences, recherche des segments de mots ou des groupes de mots. Hyperbase, qui entre dans la famille des hypertextes, se distingue toutefois des produits traditionnels: - par l'exhaustivité de l'indexation, qui prend en compte tous les mots (ponctuations incluses), - par l'adaptation des routines de tri et de recherche aux alphabets européens, - par la variété des filtres d'interrogation, des options de traitement et des résultats obtenus, - par l'accessibilité du dictionnaire et du texte, qui sont reproduits en clair, - par la souplesse et la convivialité de l'exploitation - et surtout par l'orientation statistique donnée au produit. Une comparaison est faite avec le corpus du Trésor de la langue française. Une autre, interne, met en relation les textes de la base, ce qui engendre des courbes, des listes de spécificités, des analyses factorielles, et des mesures diverses appréciant la richesse lexicale, l'évolution du vocabulaire, la distance ou connexion des textes, etc..

Hyperbase est à l'origine destiné aux analyses lexicologiques, domaine réservé aux littéraires, aux linguistes, aux historiens, aux philosophes dont la matière première est le texte. Des sociologues, des psychologues, voire des instituts de sondages, utilisent aussi Hyperbase pour l'analyse des enquêtes en texte libre ou des études de marché. Le logiciel est prévu pour les deux standards Macintosh et Windows. Les deux versions (3.1 sur Mac, 2.0 sur PC) fonctionnent sur toute la gamme des machines disponibles, avec ou sans microprocesseurs PowerPC ou G3 sur Mac, avec les systèmes Windows 3.xx , Windows 95 et Windows NT sur compatibles PC. Ses limites sont celles de la machine utilisée, de la mémoire disponible et de la capacité du disque dur. À titre d'exemple, une base a été réalisée qui donne un accès hypertextuel à l'intégralité de la Comédie Humaine de Balzac (soit plus de 20 000 pages). Mais on peut lier les bases les unes aux autres, ce qui étend à l'infini les possibilités d'extension. Dans sa version la plus récente HYPERBASE offre en outre les ressources de la lemmatisation et de la thématisation.

Pour plus de détails consulter Internet à l'adresse http://ancilla.unice.fr (ou à l'adresse http://lolita.unice.fr). Sur ces deux sites on trouvera non seulement le manuel d'utilisation du logiciel, mais aussi deux bases, l'une sur Rabelais et son temps, l'autre sur l'oeuvre de Balzac, qui ont été réalisées avec HYPERBASE et qui sont en libre accès.

COMMANDE

Le prix du logiciel HYPERBASE est de 144,83 €  HT (+port). Les deux versions Mac et Windows sont livrées en même temps sur le même CD-Rom bistandard. Deux manuels, d'utilisation d'une centaine de pages chacun, accompagnent le logiciel.

Les commandes doivent être adressées à:
Prof. Étienne BRUNET,
Institut  de Linguistique Française, UFR Lettres, Arts et Sciences Humaines.
98 bd. Herriot,
BP 3209
06204 NICE CEDEX
fax: 04 93 37 54 45
courriel: brunet@unice.fr

Au reçu de la commande, le laboratoire envoie le produit à l'acheteur, établit la facture (en actualisant les références) et communique cette facture au service comptable de l'Université, qui l'adresse à l'acheteur. L'agent comptable encaisse le paiement.

Pour des renseignements complémentaires (en particulier pour les commandes venant de l'étranger), veuillez prendre contact par courriel avec Etienne Brunet (adresse: brunet@unice.fr)

Retour au sommaire