Accueil > Ressources > TAL > Lexique de la BFM

Lexique de la BFM

vendredi 20 décembre 2013

Ce lexique liste l’ensemble des formes graphiques des unités lexicales utilisées par les éditions critiques composant la Base de français médiéval.

Il est généré automatiquement à partir de la commande « Lexique » de l’outil TXM appliqué au corpus BFM2013.
Bien que par construction un paradigme lexical donné n’y est pas forcément représenté par l’ensemble exhaustif de ses formes, chaque forme de ce lexique est toutefois attestée scientifiquement par au moins un éditeur d’éditions critiques.

À chaque forme est associé le nombre total de fois où elle est utilisée dans le corpus, soit sa « fréquence » dans la terminologie de l’outil TXM. Bien que la fréquence d’une forme soit un indicateur pertinent de la productivité langagière d’une unité lexicale donnée, son interprétation est à relativiser dans le contexte du corpus BFM2013 dans la mesure où l’équilibrage générique (domaine et genre textuel) et diachronique (répartition des textes de la BFM selon les siècles) de ce corpus n’est pas entièrement homogénéisé.

Pour connaître à tout moment les dimensions de variation du corpus BFM2016 et l’état de leur équilibrage, vous pouvez utiliser la fonctionnalité « Création de sous-corpus / textes du portail BFM : http://txm.bfm-corpus.org.

Le lexique est encodé en UTF-8.

Cette ressource est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International.

Nous contacter pour plus de détails techniques.

- Lexique BFM2013