- Bibliothèque numérique,
- Concours,
- Lettres,
Frantext
Cette base, régulièrement mise à jour, comprend actuellement un corpus de 5469 textes français et francophones à dominante littéraire du Moyen-Age au XXIème siècle, soit 258 millions de mots. Elle permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales.
Contenu :
Frantext comprend plusieurs corpus prédéfinis qui sont communs à l'ensemble des utilisateurs :
- Le corpus intégral qui contient l'ensemble des textes de la base.
- 20ème siècle : corpus des œuvres du 20ème siècle
- Ancien français : corpus des œuvres antérieures à 1300
- Classique : corpus des œuvres de la période classique (1650-1799)
- Contemporain : corpus des œuvres de la période contemporaine (1980-aujourd'hui)
- Moderne : corpus des œuvres de la période moderne (1800-1979)
- Moyen français : corpus des œuvres de la période du moyen français (1300-1549)
- Pré-classique : corpus des œuvres de la période préclassique (1550-1649)
- RL-fr : 1950+ : corpus de référence pour le Réseau Lexical du Français (RL-fr) : textes à partir de 1950
Les candidats aux concours de l'agrégation – sections lettres classiques ou lettres modernes – peuvent ainsi exploiter un corpus de 16 ouvrages au programme de la session 2021.
Couverture :
Historiquement dévolu à la recherche d’exemples pour le Trésor de la Langue Française, et d’abord centré sur la langue des XIXe et surtout XXe siècle, la base Frantext a poursuivi son évolution en élargissant son empan diachronique : ajout de textes médiévaux, de textes en moyen français, français préclassique et classique. La base continue en parallèle ses enrichissements dans le domaine moderne. Elle contient 10% de textes dits « scientifiques » et techniques et 90% de textes considérés comme « littéraires » regroupant tous les genres : romans, mémoires, autobiographies, journaux personnels, théâtre, poésie, essais. Ce corpus comprend des œuvres françaises, mais aussi francophones.
- Recherche simple : pour rechercher un mot ou une suite de mots dans les textes du corpus
- Recherche assistée : pour interroger par forme, lemme ou catégories grammaticales ; pour appeler les listes de mots et les grammaires que l'on a créées
- Recherche avancée : pour faire des recherches en utilisant le langage CQL (Corpus Query Language)
Services :
- Onglet "Fréquences" pour calculer la fréquence d'un mot ou d'une expression
- Onglet "Co-occurences" pour rechercher l'apparition simultanée de 2 ou 3 séquences (mot(s), expression régulière, liste de mots ou encore grammaire)
- Onglet "Voisinage" pour étudier le voisinage d'un mot, liste de mots, expression ou grammaire.
Producteur, éditeur :
ATILF (Analyse et Traitement Informatique de la Langue Française), laboratoire public de recherche du CNRS et de l'Université de Lorraine
Accès et consultation :
- Accès dans les locaux de Lyon3 : pour les membres de l’université et les lecteurs extérieurs inscrits dans une bibliothèque Lyon3
- Accès depuis l’extérieur : uniquement pour les membres de l’université Lyon3 après authentification dans l'intranet
Frantext - Tutoriel
Frantext pour les nuls