• Bibliothèque numérique,
  • Concours,
  • Lettres,

Frantext

Accéder

Publié le 28 octobre 2014 Mis à jour le 9 septembre 2021

Cette base, régulièrement mise à jour, comprend actuellement un corpus de 5532 textes français et francophones à dominante littéraire du Moyen-Age au XXIème siècle, soit 262 millions de mots. Elle permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales.

Contenu   :

Frantext comprend plusieurs corpus prédéfinis qui sont communs à l'ensemble des utilisateurs :

  • Le corpus intégral qui contient l'ensemble des textes de la base.
  • 20ème siècle : corpus des œuvres du 20ème siècle
  • Ancien français : corpus des œuvres antérieures à 1300
  • Classique : corpus des œuvres de la période classique (1650-1799)
  • Contemporain : corpus des œuvres de la période contemporaine (1980-aujourd'hui)
  • Moderne : corpus des œuvres de la période moderne (1800-1979)
  • Moyen français : corpus des œuvres de la période du moyen français (1300-1549)
  • Pré-classique : corpus des œuvres de la période préclassique (1550-1649)
  • RL-fr : 1950+ : corpus de référence pour le Réseau Lexical du Français (RL-fr) : textes à partir de 1950
Frantext offre également la possibilité de créer des corpus personnels, en utilisant divers paramètres (auteur, date, genre littéraire, etc.).
Les candidats aux concours de l'agrégation – sections lettres classiques ou lettres modernes – peuvent ainsi exploiter un corpus d'ouvrages au programme de la session 2022. 


Couverture :

Historiquement dévolu à la recherche d’exemples pour le Trésor de la Langue Française, et d’abord centré sur la langue des XIXe et surtout XXe siècle, la base Frantext a poursuivi son évolution en élargissant son empan diachronique : ajout de textes médiévaux, de textes en moyen français, français préclassique et classique. La base continue en parallèle ses enrichissements dans le domaine moderne. Elle contient 10% de textes dits « scientifiques » et techniques et 90% de textes considérés comme « littéraires » regroupant tous les genres : romans, mémoires, autobiographies, journaux personnels, théâtre, poésie, essais. Ce corpus comprend des œuvres françaises, mais aussi francophones.

Outils d'interrogation :

  • Recherche simple : pour rechercher un mot ou une suite de mots dans les textes du corpus
  • Recherche assistée : pour interroger par forme, lemme ou catégories grammaticales ; pour appeler les listes de mots et les grammaires que l'on a créées
  • Recherche avancée : pour faire des recherches en utilisant le langage CQL (Corpus Query Language)

Services :

  • Onglet "Fréquences" pour calculer la fréquence d'un mot ou d'une expression
  • Onglet "Co-occurences" pour rechercher l'apparition simultanée de 2 ou 3 séquences (mot(s), expression régulière, liste de mots ou encore grammaire)
  • Onglet "Voisinage" pour étudier le voisinage d'un mot, liste de mots, expression ou grammaire.

Producteur, éditeur :

ATILF (Analyse et Traitement Informatique de la Langue Française), laboratoire public de recherche du CNRS et de l'Université de Lorraine

Accès et consultation :

  • Accès dans les locaux de Lyon3 : pour les membres de l’université et les lecteurs extérieurs inscrits dans une bibliothèque Lyon3
  • Accès depuis l’extérieur : uniquement pour les membres de l’université Lyon3 après authentification dans l'intranet