Outils pour utilisateurs

Outils du site


public:annotation:specs_annotation_analec:exploitation

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:annotation:specs_annotation_analec:exploitation [2019/07/02 10:40]
slh@ens-lyon.fr
public:annotation:specs_annotation_analec:exploitation [2021/11/03 15:35] (Version actuelle)
matthieu.decorde@ens-lyon.fr [Solution]
Ligne 548: Ligne 548:
   * si on se met à utiliser l'​interface d'​annotation par Concordances pour annoter des Unités URS, ça peut ressembler à une alternative plus structurée et plus souple à l'​infrastructure '​annotation par KR'   * si on se met à utiliser l'​interface d'​annotation par Concordances pour annoter des Unités URS, ça peut ressembler à une alternative plus structurée et plus souple à l'​infrastructure '​annotation par KR'
   * si on complète les interfaces d'​annotation URS à Index+Concordance+Édition,​ avec le transfert générique on a une solution complète pour "​éditer"​ le modèle CQP en s'​appuyant sur des structures d'​annotation URS dédiées (TEI, sous-éléments TEI fréquents et utiles, etc.). Cette solution permet également de développer différentes solutions pour gérer le chevauchement de structures quand c'est nécessaire. Les annotations primaires sont stand-off donc n'ont pas de contraintes de ce type. Ce n'est qu'au moment du transfert qu'on cherche à gérer la situation.   * si on complète les interfaces d'​annotation URS à Index+Concordance+Édition,​ avec le transfert générique on a une solution complète pour "​éditer"​ le modèle CQP en s'​appuyant sur des structures d'​annotation URS dédiées (TEI, sous-éléments TEI fréquents et utiles, etc.). Cette solution permet également de développer différentes solutions pour gérer le chevauchement de structures quand c'est nécessaire. Les annotations primaires sont stand-off donc n'ont pas de contraintes de ce type. Ce n'est qu'au moment du transfert qu'on cherche à gérer la situation.
 +
 +==== Solution ====
  
 === macro URSUnits2CQPStruct === === macro URSUnits2CQPStruct ===
Ligne 571: Ligne 573:
               * exemple, propriétéB à la valeur Y -> attribut '​propriétéB="​Y"'​               * exemple, propriétéB à la valeur Y -> attribut '​propriétéB="​Y"'​
               * ...               * ...
-          ​* sinon créer une structure dans le XML-TXM+        ​* sinon  
 +          * créer une structure dans le XML-TXM
             * de nom u@type (exemple '​placeName'​)             * de nom u@type (exemple '​placeName'​)
             * commençant avant le u#start             * commençant avant le u#start
Ligne 599: Ligne 602:
 On projette des informations de mots encodées dans les unités URS pour construire des propriétés de mots dans le XML-TXM, puis dans CQP (déformées). On projette des informations de mots encodées dans les unités URS pour construire des propriétés de mots dans le XML-TXM, puis dans CQP (déformées).
  
-== Algorithme ==+== Algorithme ​v1 ==
  
-      * pour chaque u = une unité URS où u@type = 'mot'+      * pour chaque u = une unité URS où u@type = 'word'
         * ajouter au mot situé au u#start dans le XML-TXM des attributs/​propriétés correspondants à toutes les propriétés de l'​unité :         * ajouter au mot situé au u#start dans le XML-TXM des attributs/​propriétés correspondants à toutes les propriétés de l'​unité :
 +              * exemple, propriétéA à la valeur X -> attribut '​propriétéA="​X"'​ (exemple pos="​N"​)
 +              * exemple, propriétéB à la valeur Y -> attribut '​propriétéB="​Y"'​
 +              * ...
 +
 +== Algorithme v2 ==
 +
 +      * paramètres :
 +        * unit_type : le type d'​unité à projeter. Valeur par défaut **Entity**
 +        * unit_properties : la liste des propriétés à projeter, séparées par des virgules (exemple '​propriétéA,​propriétéB'​) ou **%%*%%** pour projeter toutes les propriétés. Valeur par défaut **Property**
 +        * unit_word : '​START'​ pour projeter sur le premier mot, '​END'​ pour projeter sur le dernier mot. Valeur par défaut **START**
 +      * pour chaque u = une unité URS où u@type = unitType
 +        * ajouter au mot situé au u#unitWord dans le XML-TXM des attributs/​propriétés correspondants aux propriétés unitProperties de l'​unité :
               * exemple, propriétéA à la valeur X -> attribut '​propriétéA="​X"'​ (exemple pos="​N"​)               * exemple, propriétéA à la valeur X -> attribut '​propriétéA="​X"'​ (exemple pos="​N"​)
               * exemple, propriétéB à la valeur Y -> attribut '​propriétéB="​Y"'​               * exemple, propriétéB à la valeur Y -> attribut '​propriétéB="​Y"'​
Ligne 616: Ligne 631:
   - on peut aider à fusionner une séquence de mots en un seul mot   - on peut aider à fusionner une séquence de mots en un seul mot
  
 +==== Recette ====
 +
 +=== V1 ===
 +
 +Création de balises TEI "​persName"​ à partir d'​unités :
 +  * Déclarer le type d'​unité "​TEI"​ dans la structure :
 +    * ajouter la propriété "​type"​ avec la valeur par défaut "​persName"​ (cliquer sur la valeur pour la mettre par défaut)
 +    * ajouter la propriété "​written"​ sans valeur
 +  * annoter 3 segments
 +  * lancer la macro "urs > cqp > URSUnit2CQPStructure (pas de paramètres) ​
 +  * ouvrir le fichier XML éditer et constater la présence de balises "​persName"​
 +  * mettre à jour le corpus CQP avec l'​entrée "​Corpus > Re-import corpus"​ du menu principal (il faut activer le mode expert si l'​entrée n'est pas affichée)
 +  * faire la concordance de %%<​persname>​ []+ </​persname>​%%
 +
 +Création de paragraphes TEI p à partir d'​unités :
 +  * Déclarer "​p"​ dans la structure ...
 +
 +Insertion de sauts de page TEI pb à partir d'​unités :
 +  * Déclarer "​pb"​ dans la structure ...
public/annotation/specs_annotation_analec/exploitation.1562056846.txt.gz · Dernière modification: 2019/07/02 10:40 par slh@ens-lyon.fr