Constitution du corpus CoRPTeF

Le projet CoRPTeF vise à fournir à la communauté des chercheurs internes et externes au projet un corpus de textes français antérieurs à 1200, qui soit aussi représentatif que possible, et suffisamment important en taille pour permettre des recherches sur le très ancien français. Ce corpus est exhaustif pour la période antérieure à 1100.

La sélection des données repose sur la caractérisation externe des documents à partir d’un ensemble de descripteurs spécifiques. Elle repose également sur le souci d’équilibrer le mieux possible les données de chaque type.

Ce corpus est organisé en fonction d’un sous-ensemble de descripteurs. L’utilisateur qui le souhaite peut également sélectionner, à partir de la caractérisation externe des documents, son propre sous-corpus.

Enfin, un ensemble de textes hagiographiques en latin tardif constitue un corpus complémentaire et distinct. Ce corpus permet des recherches comparatives sur les très ancien français et le latin tardif.