Frantext

Publié le 28 octobre 2014 – Mis à jour le 21 octobre 2025

Cette base, régulièrement mise à jour, comprend actuellement un corpus de 5532 textes français et francophones à dominante littéraire du Moyen-Age au XXIème siècle, soit 262 millions de mots. Elle permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales.

Frantext comprend plusieurs corpus prédéfinis qui sont communs à l'ensemble des utilisateurs :

Le corpus intégral qui contient l'ensemble des textes de la base.
20ème siècle : corpus des œuvres du 20ème siècle
Ancien français : corpus des œuvres antérieures à 1300
Classique : corpus des œuvres de la période classique (1650-1799)
Contemporain : corpus des œuvres de la période contemporaine (1980-aujourd'hui)
Moderne : corpus des œuvres de la période moderne (1800-1979)
Moyen français : corpus des œuvres de la période du moyen français (1300-1549)
Pré-classique : corpus des œuvres de la période préclassique (1550-1649)
RL-fr : 1950+ : corpus de référence pour le Réseau Lexical du Français (RL-fr) : textes à partir de 1950

Frantext offre également la possibilité de créer des corpus personnels, en utilisant divers paramètres (auteur, date, genre littéraire, etc.).
Les candidats aux concours de l'agrégation – sections lettres classiques ou lettres modernes – peuvent ainsi exploiter un corpus d'ouvrages au programme de la session 2026.

Format : HTML
Téléchargement : oui, export CVS
Copier/Coller : oui
Recherche avancée : pour faire des recherches en utilisant le langage CQL (Corpus Query Language)

Producteur / Editeur : ATILF (Analyse et Traitement Informatique de la Langue Française), laboratoire public de recherche du CNRS et de l'Université de Lorraine

Accès :
Local pour les membres de Lyon 3 et les lecteurs extérieurs inscrits dans une bibliothèque
Distant uniquement pour les membres de Lyon 3 après authentification dans l'intranet

Mise à jour : 21 octobre 2025

Frantext

Frantext - Tutoriel