Outils pour utilisateurs

Outils du site


public:annotation

Ceci est une ancienne révision du document !


revenir à l'accueil

Annotation

Pour qu'une annotation existe, nous avons besoin de 4 éléments :

  • une séquence textuelle dont les index de début et fin sont connus
  • un index dans un référentiel auquel cette séquence est associée
  • une date à laquelle a été crée l'annotation
  • l'annotateur, représenté par son identifiant

On peut imaginer associer une à plusieurs notes à la relation (niveau de fiabilité, commentaire pour la construction de la catégorie à travers le processus d'annotation, …)

Cette annotation est associée à un corpus donné.

Deux corpus peuvent être en cours d'annotation simultanément.

Mises en oeuvre de l'annotation

Automatique : TAL

Assistée

Annotation Analec

Étape 1

Étape 2

  • mesures CS, CG…
  • exploitation par scriptage
    • scripts FL
    • script GN/CQP
  • bug de sélection de mot dans Windows 7
  • import TEI Analec (corpus + annotations caractères)
  • montée en charge
    • volume (tous le corpus DEMOCRAT)
    • diversité (à préciser)
  • documentation

Étape 3

  • sélection d'unités inter-pages
    • UI outil principal + outils secondaires
    • analyse temps réel des fréquences d'accès aux outils et déplacement automatique d'outils secondaires en outil principal (nouveau bouton dans la toolbar) qui dépassent un certain seuil de fréquence
  • gestion de la sélection d'unités recouvrantes (cf ticket existant)
  • annoter les schémas
  • correction de bornes d'unités
    • UI outil principal + outils secondaires
    • analyse temps réel des fréquences d'accès aux outils et déplacement automatique d'outils secondaires en outil principal
  • documentation

Étape 4

  • annoter les relations
  • création, utilisation (affichage d'identifiant, de propriété distante…) et persistance de vues
  • ajouter un identifiant personnel et une date à chaque annotation
  • visualiser les annotations
    • schémas (flèches, sommaire, vignettes, chemin de fer…)
  • visualisation de mesures (triangle, rond…)
  • export TEI
    • mots
    • caractères
  • nouvelles déclarations dans une structure d'annotations
    • possibilité de rendre invisible aux vues : une propriété, ses valeurs…
    • valeurs de propriétés d'unités/relations/schémas non modifiables
  • documentation

Les fonctions

Fonctions liées au référentiel (dont paramétrage)

Fonction d'analyse dans TXM

L'analyse dans TXM n'est possible qu'à partir du moment où les annotations sont "enregistrées" lors du "commit".

On peut distinguer :

  • les outils de TXM s'appuyant sur des annotations pour réaliser une analyse
  • le fait de s'appuyer sur des annotations pour faire des annotations (recherche d'annotations → concordance → nouvelle annotation)

Liste des fonctionnalités pouvant utiliser les annotations :

Fonctions d'export

Fonctions de partage

Partage d'annotations entre utilisateurs et peut-être avec une problématique de versionnage.

Scénarii d'usage

  • pour le repérage d'entités nommées
  • pour la lemmatisation, utilisation de dictionnaire

Il faut pouvoir distinguer principalement deux usages :

  • un usage “stabilo” (Approche inductive), ressemblant à l'activité d'analyse qualitative, proche de la méthode par théorisation ancrée. On démarre la réflexion, on est dans “un codage ouvert” avec l'accumulation de nouveaux codes, proche même des séquences textuelles trouvées dans le texte (InVivo). L'annotation reste proche d'un syntagme assez long qui pourra éventuellement donner lieu à un regroupement par la suite.
  • un usage “expert” (Approche déductive), où l'on se situe dans une indexation avec l'utilisation d'ontologies, de référentiels pré-existants.
public/annotation.1476872363.txt.gz · Dernière modification: 2016/10/19 12:19 par slh@ens-lyon.fr