Archives (appel à la communauté et réponses, PRESTO)
Etat des lieux : février 2015
Objectifs
Lemmatiser tous les textes de la BFM
Créer des passerelles avec lemmes des textes latins ? est-ce que le lemme ne serait pas un meilleur niveau que la catégorie morphosyntaxique pour créer des liens/continuités ??
Etablir des liens dynamiques entre les mots des textes de la BFM et les articles du DMF (au niveau de l'article et pas du sens précis en contexte)
Créer des passerelles avec d'autres dictionnaires (AND, DEAF, autres ?) ?
Ressources à rassembler
Déjà disponibles : tables de conversion jeu TreeTagger (Achim) et Cattex, lexique de Achim, textes étiquetés
A se procurer maintenant : lexique forme/catégorie/lemme du DMF, principes de création des lemmes du DMF ; pour cela, définir nos objectifs et proposer à l'Atilf un rôle dans l'histoire (par ex., vous nous donnez votre lexique, 1) on l'enrichit et on le diffuse, 2) on fait le lien avec votre dictionnaire)
A voir pour plus tard : la même chose pour le latin
A rendre disponible : tout tout de suite ? les ressources collectées une fois enrichies par nous ?
Le chantier de lemmatisation de la BFM est désormais intégré au projet PaLaFra : palafra_lemmatisation_fro
lemmatisation_de_francais_medieval.txt · Dernière modification: 2015/06/03 10:40 par alexei.lavrentev@ens-lyon.fr