Outils pour utilisateurs

Outils du site


public:xml_tei_urs

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:xml_tei_urs [2017/10/17 10:07]
slh@ens-lyon.fr
public:xml_tei_urs [2019/07/04 13:16] (Version actuelle)
slh@ens-lyon.fr [V2 - évolution pour l'implémentation dans l'extension Analec de TXM]
Ligne 6: Ligne 6:
  
 ===== Solutions ===== ===== Solutions =====
 +
 +==== V0 - Analec 1.5 ====
 +
 +Utilise les éléments : 
 +  * back
 +    * spanGrp@type=AnalecUnite+@n=TypeUnite / span
 +      * linkGrp@type=AnalecRelation|AnalecSchema+@n=TypeRelation|TypeSchema / link
  
 ==== V1 - article ISA 2017 ==== ==== V1 - article ISA 2017 ====
Ligne 13: Ligne 20:
 Utilise les éléments :  Utilise les éléments : 
   * standOff   * standOff
-  ​* div@coréférence +    ​* div@type=coréférence 
-  * spanGrp/​span +      * spanGrp@type=unit ​/ span 
-  * linkGrp/​link+      * linkGrp@type=relation|schema ​/ link
  
-==== V2 - évolutions ​pour l'​implémentation dans TXM de l'​extension Analec ====+==== V2 - évolution ​pour l'​implémentation dans l'​extension Analec ​de TXM ====
  
-On se base sur le modèle d'​annotation proposé par [[https://​github.com/​laurentromary/​stdfSpec]] ​utilisant ​les éléments : +=== annotations et textes === 
-  * stdf (à la place de 'standOff') + 
-  * soHeader/​title +On croise avec le modèle XML-TEI TXM et le modèle d'​annotation proposé par [[https://​github.com/​laurentromary/​stdfSpec]]
-  annotations (à la place de 'div@type=coréférence') + 
-  * annotationGrp avec @type et @subtype ​(à la place respectivement de spanGrp@type et spanGrp@n) +Utilise ​les éléments : 
-  * span avec @xml:id, @ana, @from, @to et @target+  * standOff 
 +    * soHeader 
 +      * titleStmt ​/ title 
 +      revisionDesc / change who="#​clement"​ when="​2019-05-16"​\\ Created with TXM 0.8.0.2082 and URS extension <​version>​ with 'XML-TEI-URS Export....'​ export command on ADEN corpus 
 +    * annotations@type=coréférence 
 +      * annotationGrp avec @type=Unit|Relation|Schema ​et @subtype=TypeUnite|TypeRelation|TypeSchema 
 +        * span (unités) OU link (relations et schémas) ​avec @xml:id, @ana, @from, @to et @target 
 +      * div@type=unit-fs 
 +        * fs / f 
 +      * div@type=relation-fs 
 +        * fs / f 
 +      * div@type=schema-fs 
 +        * fs / f
    
-<​note>​spanGrp/​span et joinGrp/​join sont actuellement utilisés pour les annotations d'​Analec -> ils sont remplacés par annotationGrp/​span</​note>​ +<​note>​spanGrp/​span et joinGrp/​join sont actuellement utilisés pour les annotations d'​Analec -> ils sont remplacés par annotationGrp/​span|link</​note>​ 
-<​note>​linkGrp/​link ​restent pour l'​instant ​utilisés pour les annotations TAL de TXM (en attendant de migrer vers annotationGrp/​span). Exemple : TreeTagger.</​note>​+<​note>​linkGrp/​link ​sont utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers le '​standOff'​). Exemple : TreeTagger.</​note>​
  
-Les annotations sont stockées dans un fichier indépendant du corps du texte. Voir la spécification de la [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] section **implémentation TXM**.+Les annotations sont stockées dans un fichier indépendant du corps du texte pour une V1, et au sein du même fichier pour une V2 (nouvelle option d'​export). Voir la spécification de la [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] section **implémentation TXM**. 
 + 
 +== Pointeurs vers les mots ===
  
 Les annotations pointent vers des mots du format [[public:​xml_tei_txm|XML-TEI TXM]]. Les annotations pointent vers des mots du format [[public:​xml_tei_txm|XML-TEI TXM]].
  
 +Pour la version où les annotations sont dans un fichier séparé du fichier des mots, les pointeurs d'​annotations utilisent le mécanisme de [[http://​www.tei-c.org/​release/​doc/​tei-p5-doc/​en/​html/​ref-prefixDef.html|prefixDef]] de la TEI((utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas)). Voir des exemples de prefixDef dans [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] et [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​xml_tei_txm#​offline_annotations_standoff|XML-TEI TXM standoff]].
 +
 +Pour la version où les annotations sont dans le même fichier que celui contenant les mots (et le texte), les annotations pointent directement sur les éléments <w>.
 +
 +=== Structure d'​annotation ===
  
-Les pointeurs d'​annotations utilisent le mécanisme ​de préfixe de la TEI : [[http://​www.tei-c.org/​release/​doc/​tei-p5-doc/​en/​html/​ref-prefixDef.html|prefixDef]]. Voir l'​exemple de [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_de_chargement_d_annotation_xml-tei-urs|Spécifications de la commande d'​export ​XML-TEI URS de l'​extension Analec]].+En attendant ​de définir un format XML-TEI, on utilise un fichier ".aam" au format ​XML de sérialisation du logiciel Glozz.
  
 +==== V3 - ... ====
  
 +  * Exporter la structure d'​annotation au format XML-TEI URS au lieu de Glozz (aam).
 +  * Lors de l'​import si aucune structure n'est renseignée -> inférer la structure en lisant les annotations
public/xml_tei_urs.1508227641.txt.gz · Dernière modification: 2017/10/17 10:07 par slh@ens-lyon.fr