Outils pour utilisateurs

Outils du site


public:specs_import_annotation_syntaxique_auto

Spécification de la gestion de l'annotation syntaxique

Objectif

Intégrer l'annotation syntaxique automatique.

Méthode

Les annotations peuvent être calculées par des parseurs au moment de l'import, par l'import d'annotations pré-existantes ou par le lancement de parseurs sur un corpus TXM depuis TXM.

Prise en compte d'annotations dans les sources à l'import (import de corpus)

Lancement de parseurs au moment de l'import (import de corpus)

Lancement de parseurs sur un corpus TXM depuis TXM (annotation automatique de corpus)

Prise en compte d'annotations externes dans un corpus TXM depuis TXM (import d'annotations)

Ajouter des annotations syntaxiques à un corpus TXM.

CoNLL-U

Ajouter la commande “Corpus > Importer > Annotation syntaxiques : UD” :

  • source : un corpus TXM
  • paramètre : un fichier CoNLL-U
  • résultat
    • un index Icarus d'annotation syntaxiques est créé dans le sous répertoire “icarus”
    • la console affiche le nombre d'annotation syntaxiques qui ont été projetées et qui n'ont pas été projetées

TIGERSearch

Ajouter la commande “Corpus > Importer > Annotation syntaxiques : TIGERSearch” :

  • source : un corpus TXM
  • paramètre : un fichier source de TIGER XML
  • résultat
    • un corpus TIGER est créé dans le sous répertoire “tiger”
    • la console affiche le nombre d'annotation syntaxiques qui ont été projetées et qui n'ont pas été projetées

La commande doit gérer la création d'un index de “décalage de positions” des token CQP non annotés par TIGER. Par exemple, pour SRCMF, les ponctuations.

Solution

État de l'art général et pour le Français

Composants de TAL

Formats

Corpus

Prototypes

Version finale

Documentation

Utilisateur

Développeur

Recette

Protocole de test

Alpha

Beta

État courant

Qui Quand Quoi

public/specs_import_annotation_syntaxique_auto.txt · Dernière modification : 22/09/2020 10:50 de matthieu.decorde@ens-lyon.fr