Liste de liens :
Liste de liens :
Intégration d'outils d'annotation URS/Analec et d'exploitation de ces annotations dans le contexte du chantier plus large de développement de fonctionnalités d'annotation dans TXM.
Intégrer des fonctionnalités Analec
Le transfert d'un certain nombre de fonctionnalités d'Analec est discuté dans le document Vers l’annotation de corpus dans TXM : Spécifications fondées sur les réflexions autour d’Analec (FL).
Le manuel d'annotation, la définition de la structure d'annotation et les textes à annoter de DEMOCRAT se trouvent dans ///Dropbox/DEMOCRAT/corpus.
Pour mieux comprendre et porter Analec, des spécifications d'Analec sont en cours.
Étendre le modèle URS
Développer des fonctionnalités d'exploitations de corpus TXM de textes et non pas d'un seul texte Analec en texte brut.
Basé sur la page de discussion du workflow d'annotation de Democrat : https://groupes.renater.fr/wiki/democrat/prive/exploitation_txm
(point de vue de l'IHRIM/Cactus/TXM)
Première intégration d'annotation des unités d'Analec dans TXM : cible Democrat 1.0.
La livraison comprend :
Premiers développements d'exploitation des annotations ANALEC : cible Democrat 2.0.
Première intégration d'annotation des schémas d'Analec dans TXM et aides à l'annotation des unités:
Liste des développements vu par les phases d'annotation :
Pour chaque référent, Pour chaque division, Prendre la première mention Compter les mots qui précèdent la mention dans cette division. Hypothèse : le contexte à gauche détermine (peut-être) la catégorie dans laquelle le référent apparaîtra pour la première fois. plus le contexte est conséquent, plus il y a de possibilité d'ancrer des référents associés et faire jouer des anaphores associatives. contexte court : GN.NAM (nom propre) ou GN.IND (indéfini) contexte long : GN.DEF (défini)
A) WARNING: found more than 2 positions for query [_.text_id="MontesquieuLois" & id="w_N797_12655|w_N797_12659"] -> [] -> WARNING: no position found for query [_.text_id="MontesquieuLois" & id="w_N797_12655|w_N797_12659"] -> [] A.1) WARNING: too many positions found for query ... B) ajouter une synthèse à la fin, par texte : - afficher le nombre total de projections réalisées : "X annotations imported." - afficher le nombre total de projections abandonnées : "X annotations not imported." - afficher le nombre total de warnings de type 'no-position-found' - afficher le nombre total de warnings de type 'too-many-positions-found' C) ajouter une synthèse à la fin, par corpus : - afficher le nombre total de projections réalisées : "X annotations imported." - afficher le nombre total de projections abandonnées : "X annotations not imported." - afficher le nombre total de warnings de type 'no-position-found' - afficher le nombre total de warnings de type 'too-many-positions-found'
Première intégration d'annotation des relations d'Analec dans TXM.
Exploitation par macro
Annotation par scriptage
Notes MD brutes prises lors de la réunion avec les stagiaires de Lyon :
Notes en vrac prises par AL lors de l'annotation de la Chronique de Morée
De façon générale, l'expérience d'annotation a été agréable. Quelques remarques sur l'ergonomie :
Merci de faire vos retours dans la page de suivi du projet DEMOCRAT du wiki txm-users.
N'oubliez pas de renseigner au préalable votre configuration machine.
Cette étape consiste à ajouter depuis TXM des unités dans un texte qui a déjà été annoté dans Analec au préalable.
mise à jour de l'extension
import d'un corpus XML-TEI-Analec (annoté puis exporté depuis Analec)
NAVIGATION DANS LES UNITÉS À PARTIR DE LA LISTE DES MENTIONS
création et modification des propriétés d'une unité
fin de l'annotation
accès aux fonctionnalités Analec
messages d'erreurs
Dernière erreur CQP : Illegal regular expression: *
Préparation
Démarrer l'annotation
Unités recouvrantes
Sélection d'unité inter-page
Correction des limites
Navigation dans les unités depuis l'édition
Création d'unité
Auto-complétion optionnelle par infixe dans les champs de valeur de propriété
Recherche et édition des propriétés d'unité
Concordance d'unités recherchées
Gestion de la structure d'annotation
Values stored in the structure: [un massacre de cerf, ...] The following values are not used: test
Visualisation des CHAINEs
Annotation des propriétés des CHAINEs
Sauvegarde
Exports d'annotation
<span id="u-MENTION-1" from="text:w_fracasseavecmention_17" to="text:w_fracasseavecmention_24" ana="#u-MENTION-1-fs"/>
en
<span id="u-MENTION-1" from="text:w_fracasseavecmention_17" to="text:w_fracasseavecmention_25" ana="#u-MENTION-1-fs"/>
Voir le "Manuel d'utilisation de l'extension Analec de TXM" pour l'installation et l'utilisation de cette extension.