Bienvenue sur le site du projet de recherche Corpus représentatif des premiers textes français (CoRPTeF).
Ce projet vise à élaborer un corpus de référence pour le très ancien français (du IXe au XIIe siècle) et à développer la recherche sur cette période de l’histoire du français.
Ce programme est associé à la Base de Français Médiéval. Les corpus CoRPTeF et BFM sont complémentaires et reposent sur des méthodes de développement et d’exploitation communes.
Le projet a été financé par l’Agence Nationale de la Recherche sur une période de trois ans (2008-2010).
Les spécificités du corpus CORPTEF sont :
sa taille (pour la période)
la diversité des documents qui le composent (textes en vers et en prose, textes littéraires et non littéraires, richesse dialectale, etc.)
son organisation en fonction de paramètres de variation définis
l’enrichissement linguistique pratiqué sur ces textes (étiquetage morphologique et annotation syntaxique pour certains d’entre eux, balisage du discours direct)
Responsable scientifique : Céline Guillot
Pour consulter le projet déposé à l’ANR (document PDF), cliquez sur ce lien.
Pour accéder au corpus CoRPTeF sur le portail BFM, cliquez sur ce lien