Outils pour utilisateurs

Outils du site


public:xml_tei_urs

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:xml_tei_urs [2017/10/20 09:11]
matthieu.decorde@ens-lyon.fr
public:xml_tei_urs [2019/07/04 13:16] (Version actuelle)
slh@ens-lyon.fr [V2 - évolution pour l'implémentation dans l'extension Analec de TXM]
Ligne 22: Ligne 22:
     * div@type=coréférence     * div@type=coréférence
       * spanGrp@type=unit / span       * spanGrp@type=unit / span
-        ​* linkGrp@type=relation|schema / link+      ​* linkGrp@type=relation|schema / link
  
 ==== V2 - évolution pour l'​implémentation dans l'​extension Analec de TXM ==== ==== V2 - évolution pour l'​implémentation dans l'​extension Analec de TXM ====
 +
 +=== annotations et textes ===
  
 On croise avec le modèle XML-TEI TXM et le modèle d'​annotation proposé par [[https://​github.com/​laurentromary/​stdfSpec]]. On croise avec le modèle XML-TEI TXM et le modèle d'​annotation proposé par [[https://​github.com/​laurentromary/​stdfSpec]].
Ligne 30: Ligne 32:
 Utilise les éléments : Utilise les éléments :
   * standOff   * standOff
-    * soHeader / title +    * soHeader 
-    annotations@type=coréférence ​<- div@type=coréférence +      * titleStmt ​/ title 
-      * annotationGrp avec @type=Unit|Relation|Schema et @subtype=TypeUnite|TypeRelation|TypeSchema ​<- respectivement spanGrp@type+@n et linkGrp@type+@n +      revisionDesc / change who="#​clement"​ when="​2019-05-16"​\\ Created with TXM 0.8.0.2082 and URS extension ​<version> with 'XML-TEI-URS Export....'​ export command on ADEN corpus 
-        * span (unités) OU link (relations et schémas) avec @xml:id, @ana, @from, @to et @target ​<span et link+    * annotations@type=coréférence 
 +      * annotationGrp avec @type=Unit|Relation|Schema et @subtype=TypeUnite|TypeRelation|TypeSchema 
 +        * span (unités) OU link (relations et schémas) avec @xml:id, @ana, @from, @to et @target 
 +      * div@type=unit-fs 
 +        * fs / f 
 +      * div@type=relation-fs 
 +        * fs / f 
 +      * div@type=schema-fs 
 +        * fs / f
    
-<​note>​spanGrp/​span et joinGrp/​join sont actuellement utilisés pour les annotations d'​Analec -> ils sont remplacés par annotationGrp/​span</​note>​ +<​note>​spanGrp/​span et joinGrp/​join sont actuellement utilisés pour les annotations d'​Analec -> ils sont remplacés par annotationGrp/​span|link</​note>​ 
-<​note>​linkGrp/​link ​restent pour l'​instant ​utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers annotationGrp/​span). Exemple : TreeTagger.</​note>​+<​note>​linkGrp/​link ​sont utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers le '​standOff'​). Exemple : TreeTagger.</​note>​
  
-Les annotations sont stockées dans un fichier indépendant du corps du texte((pour une V1)). Voir la spécification de la [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] section **implémentation TXM**.+Les annotations sont stockées dans un fichier indépendant du corps du texte pour une V1, et au sein du même fichier pour une V2 (nouvelle option d'​export). Voir la spécification de la [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] section **implémentation TXM**. 
 + 
 +== Pointeurs vers les mots ===
  
 Les annotations pointent vers des mots du format [[public:​xml_tei_txm|XML-TEI TXM]]. Les annotations pointent vers des mots du format [[public:​xml_tei_txm|XML-TEI TXM]].
  
-Les pointeurs d'​annotations utilisent le mécanisme de [[http://​www.tei-c.org/​release/​doc/​tei-p5-doc/​en/​html/​ref-prefixDef.html|prefixDef]] de la TEI((utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas)). Voir des exemples de prefixDef dans [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] et [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​xml_tei_txm#​offline_annotations_standoff|XML-TEI TXM standoff]].+Pour la version où les annotations sont dans un fichier séparé du fichier des mots, les pointeurs d'​annotations utilisent le mécanisme de [[http://​www.tei-c.org/​release/​doc/​tei-p5-doc/​en/​html/​ref-prefixDef.html|prefixDef]] de la TEI((utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas)). Voir des exemples de prefixDef dans [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] et [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​xml_tei_txm#​offline_annotations_standoff|XML-TEI TXM standoff]]
 + 
 +Pour la version où les annotations sont dans le même fichier que celui contenant les mots (et le texte), les annotations pointent directement sur les éléments <​w>​. 
 + 
 +=== Structure d'​annotation === 
 + 
 +En attendant de définir un format XML-TEI, on utilise un fichier "​.aam"​ au format XML de sérialisation du logiciel Glozz.
  
 +==== V3 - ... ====
  
 +  * Exporter la structure d'​annotation au format XML-TEI URS au lieu de Glozz (aam).
 +  * Lors de l'​import si aucune structure n'est renseignée -> inférer la structure en lisant les annotations
public/xml_tei_urs.1508483511.txt.gz · Dernière modification: 2017/10/20 09:11 par matthieu.decorde@ens-lyon.fr