logo de la Base de français médiéval


Votre navigateur ne permet pas un affichage correct du site :Base de Français Médiéval — Old French Corpus.
Voici cependant une version non graphique vous permettant d'accéder aux contenus.
Nous vous conseillons d'utiliser un navigateur respectueux des standards du Web, comme Safari ou Camino.


accueil > Projets associés > Catégorisation

Catégorisation

Resp. Serge Heiden

Projet : Étiquetage morpho-syntaxique de textes en français médiéval dans un cadre multidimensionnel

Ce projet, financé par l’ILF sur l’exercice 2004-2006, a pour cadre l’équipe ICAR 3 du laboratoire ICAR. Il est dirigé par Serge Heiden et associe des membres de l’équipe (Céline Guillot, Alexei Lavrentiev, Christiane Marchello-Nizia) ainsi que Sophie Prévost (UMR8094 LaTTiCe), Benoît Habert (UPR3251 LIMSI) et Achim Stein (Institut für Linguistik/Romanistik, Universität Stuttgart).

L’enrichissement linguistique de corpus textuels offre de nouvelles formes d’accès aux notions linguistiques que les textes contiennent. Il représente un état de connaissance sur certains aspects linguistiques de leur langue : morpho-syntaxe, lexique de lemmes, etc. Pour certains états de langue l’activité d’enrichissement peut par ailleurs en elle même représenter un problème difficile et en même temps être productrice de nouvelles connaissances sur eux. C’est dans ce cadre que se situe ce projet. La méthode utilisée se propose d’obtenir des avancées « réciproques » à la fois sur la connaissance du système morpho-syntaxique et sur les types de textes dans lesquels le système est analysé. L’hypothèse de travail est que la maîtrise combinée des types de textes et de leur système d’étiquetage offre une garantie sur la qualité de cet étiquetage. L’objectif du projet est donc de développer une méthodologie d’analyse linguistique en corpus selon un paradigme multidimensionnel autant que de fournir des textes étiquetés. L’enjeu est d’aboutir à une généralisation en langue de résultats obtenus à partir d’un corpus, en fondant cette généralisation sur une procédure et des critères précis.



Infos et annonces

+ d’annonces... ]


Dernières mises à jour

  • 3.11.2016
    Lexique morphologique de français médiéval FROLEX > Lire
  • 16.07.2015
    ODD : Spécification de la personnalisation TEI pour le corpus BFM-Manuscrits > Lire
  • 28.11.2014
    Graal Tutoriel Vidéo > Lire



© Équipe du projet de la Base de Français Médiéval / équipe ICAR3 - Laboratoire ICAR UMR5191 ENS de Lyon / CNRS - [ Informations légales ]