Année 2008
Tâches
- Choix des textes (mois 1-6)
- Mise à jour de la documentation (mois 1-6)
- Réunion préparation du corpus (mois 3)
- Description des unités textuelles du corpus (mois 3-12)
- Numérisation (1600 pages, mois 1-12)
- Mise au point des outils (mois 6-12)
Livrables - 1600 pages de textes numérisés, relus et balisés, intégrés BFM1
- Protocole de description des textes
- Outil d’exploitation des descripteurs
- Publication de nouvelles taxonomies
- Site web du projet
Année 2009
Tâches
- Numérisation (1600 pages, mois 13-24)
- Enrichissement linguistique (mois 13-24)
- Formation aux outils (mois 13)
- Exploitation du corpus (13-24)
- Journée d’études (mois 24)
Livrables - 1600 pages de textes numérisés, relus et balisés, intégrés BFM1
- Textes étiquetés en morphosyntaxe, procédure automatique
- Création du corpus représentatif des premiers textes français
Année 2010
Tâches
- Exploitation du corpus (mois 25-36)
- Enrichissement linguistique, correction (mois 25-30)
- Colloque DIACHRO-V(mois 25-36)
Livrables - Rapport sur la qualité de l’enrichissement
- Proposition d’extension des normes de description et d’encodage des textes dans le cadre du CCFM
- Actes de DIACHRO-V
- Conférences, articles