Actualité de l'ENS de Lyon

Le nouveau millésime de la BFM : le corpus BFM2016

Image absente
Actualité
Résumé
Description
Le groupe de travail Cactus (IHRIM) a le plaisir d’annoncer le nouveau millésime de la BFM : le corpus BFM2016.
La Base de français médiéval (BFM) diffuse gratuitement des ressources ouvertes (open-source) portant sur la langue et la littérature française médiévale (textes, métadonnées, lexique...) via son portail web.
Le corpus BFM2016 comprend une trentaine de nouveaux textes et atteint environ 4 100 000 mots. Tous les textes de la BFM sont encodés selon les recommandations du consortium TEI, balisés pour le discours direct et automatiquement annotés en morphosyntaxe. L’étiquetage morphosyntaxique a été vérifié pour 20 nouveaux textes (34 textes vérifiés au total, soit près de 1 000 000 mots).
La documentation de la BFM (principes de description et d'encodage des textes, formules de citation) et de ses projets associés est accessible sur le site.

Contact : bfm [at] ens-lyon [point] fr
Disciplines