Accueil > Ressources > TAL

Ressources

  • Logiciel RNNTagger

    6 janvier 2023, par Alexei Lavrentiev

    Ce logiciel d’étiquetage morphosyntaxique et de lemmatisation développé par Helmut Schmid à l’université de Munich produit des résultats plus précis que TreeTagger. Pour le français médiéval, il a été entraîné sur les textes vérifiés du corpus BFM2022.
    Pour en savoir plus, voir le site https://www.cis.uni-muenchen.de/ schmid/tools/RNNTagger.

  • Lexique morphologique de français médiéval FROLEX

    8 novembre 2016

    La Base de français médiéval met à disposition le lexique morphologique FROLEX du français du IXe au XVe siècle. Il est mis en ligne sur la plate-forme GITHUB sous licence CC-BY-NC-SA 3.0 FR
    https://github.com/sheiden/Medieval...
    Le lexique FROLEX est une compilation de ressources provenant de :
    Le Dictionnaire du moyen français http://www.atilf.fr/dmf
    Le Nouveau corpus d’Amsterdam : http://www.uni-stuttgart.de/lingrom...
    La base de français (...)

  • Lexique de la BFM

    20 décembre 2013

    Ce lexique liste l’ensemble des formes graphiques des unités lexicales utilisées par les éditions critiques composant la Base de français médiéval.
    Il est généré automatiquement à partir de la commande « Lexique » de l’outil TXM appliqué au corpus BFM2013. Bien que par construction un paradigme lexical donné n’y est pas forcément représenté par l’ensemble exhaustif de ses formes, chaque forme de ce lexique est toutefois attestée scientifiquement par au moins un éditeur d’éditions critiques.
    À chaque forme est (...)

  • Modèle morphosyntaxique du français médiéval pour le logiciel TreeTagger

    3 mars 2011

    TreeTagger est un logiciel d’étiquetage morphosyntaxique et de lemmatisation développé dans les années 1990 par Helmut Schmid. Il peut être installé en tant qu’extension à la plateforme TXM. 
    Le modèle linguistique fro.par est basé sur les 47 textes de la BFM étiquetés et vérifiés manuellement par des experts en Cattex 2009. Il est encodé en Unicode (UTF-8). Cette ressource est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les (...)