Accueil > Ressources > TAL > Modèle morphosyntaxique du français médiéval pour le logiciel TreeTagger

Modèle morphosyntaxique du français médiéval pour le logiciel TreeTagger

jeudi 3 mars 2011

Ce modèle est basé sur les 39 textes de la BFM étiquetés et vérifiés manuellement par des experts en Cattex 2009. Il est encodé en Unicode (UTF-8). Cette ressource est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International. Notez que ce modèle ne permet pas de lemmatiser les textes.

Un modèle expérimental permettant de lemmatiser les textes peut être fourni sur demande. Il est basé sur un jeu d’étiquettes simplifié compatible avec celui du lexique LGeRM.

Nous contacter pour plus de détails techniques.

- Modèle linguistique BFM (pour le TreeTagger)