Outils pour utilisateurs

Outils du site


public:xml_tei_urs

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:xml_tei_urs [2017/10/20 16:04]
matthieu.decorde@ens-lyon.fr
public:xml_tei_urs [2019/07/04 13:16] (Version actuelle)
slh@ens-lyon.fr [V2 - évolution pour l'implémentation dans l'extension Analec de TXM]
Ligne 22: Ligne 22:
     * div@type=coréférence     * div@type=coréférence
       * spanGrp@type=unit / span       * spanGrp@type=unit / span
-        ​* linkGrp@type=relation|schema / link+      ​* linkGrp@type=relation|schema / link
  
 ==== V2 - évolution pour l'​implémentation dans l'​extension Analec de TXM ==== ==== V2 - évolution pour l'​implémentation dans l'​extension Analec de TXM ====
Ligne 32: Ligne 32:
 Utilise les éléments : Utilise les éléments :
   * standOff   * standOff
-    * soHeader / title +    * soHeader 
-    annotations@type=coréférence ​<- div@type=coréférence +      * titleStmt ​/ title 
-      * annotationGrp avec @type=Unit|Relation|Schema et @subtype=TypeUnite|TypeRelation|TypeSchema ​<- respectivement spanGrp@type+@n et linkGrp@type+@n +      revisionDesc / change who="#​clement"​ when="​2019-05-16"​\\ Created with TXM 0.8.0.2082 and URS extension ​<version> with 'XML-TEI-URS Export....'​ export command on ADEN corpus 
-        * span (unités) OU link (relations et schémas) avec @xml:id, @ana, @from, @to et @target ​<- span et link+    * annotations@type=coréférence 
 +      * annotationGrp avec @type=Unit|Relation|Schema et @subtype=TypeUnite|TypeRelation|TypeSchema 
 +        * span (unités) OU link (relations et schémas) avec @xml:id, @ana, @from, @to et @target
       * div@type=unit-fs       * div@type=unit-fs
         * fs / f         * fs / f
Ligne 46: Ligne 48:
 <​note>​linkGrp/​link sont utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers le '​standOff'​). Exemple : TreeTagger.</​note>​ <​note>​linkGrp/​link sont utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers le '​standOff'​). Exemple : TreeTagger.</​note>​
  
-Les annotations sont stockées dans un fichier indépendant du corps du texte((pour une V1)). Voir la spécification de la [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] section **implémentation TXM**.+Les annotations sont stockées dans un fichier indépendant du corps du texte pour une V1, et au sein du même fichier pour une V2 (nouvelle option d'​export). Voir la spécification de la [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] section **implémentation TXM**. 
 + 
 +== Pointeurs vers les mots ===
  
 Les annotations pointent vers des mots du format [[public:​xml_tei_txm|XML-TEI TXM]]. Les annotations pointent vers des mots du format [[public:​xml_tei_txm|XML-TEI TXM]].
  
-Les pointeurs d'​annotations utilisent le mécanisme de [[http://​www.tei-c.org/​release/​doc/​tei-p5-doc/​en/​html/​ref-prefixDef.html|prefixDef]] de la TEI((utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas)). Voir des exemples de prefixDef dans [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] et [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​xml_tei_txm#​offline_annotations_standoff|XML-TEI TXM standoff]].+Pour la version où les annotations sont dans un fichier séparé du fichier des mots, les pointeurs d'​annotations utilisent le mécanisme de [[http://​www.tei-c.org/​release/​doc/​tei-p5-doc/​en/​html/​ref-prefixDef.html|prefixDef]] de la TEI((utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas)). Voir des exemples de prefixDef dans [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_annotation_analec/​export_import#​commande_d_export_xml-tei-urs|commande d'​export XML-TEI URS]] et [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​xml_tei_txm#​offline_annotations_standoff|XML-TEI TXM standoff]]. 
 + 
 +Pour la version où les annotations sont dans le même fichier que celui contenant les mots (et le texte), les annotations pointent directement sur les éléments <​w>​. 
 + 
 +=== Structure d'​annotation ===
  
-=== structure d'​annotation ===+En attendant de définir un format XML-TEI, on utilise un fichier "​.aam"​ au format XML de sérialisation du logiciel Glozz.
  
-Un fichier ".aam" au format XML de sérialisation du logiciel Glozz.+==== V3 - ... ====
  
 +  * Exporter la structure d'​annotation au format XML-TEI URS au lieu de Glozz (aam).
 +  * Lors de l'​import si aucune structure n'est renseignée -> inférer la structure en lisant les annotations
public/xml_tei_urs.1508508283.txt.gz · Dernière modification: 2017/10/20 16:04 par matthieu.decorde@ens-lyon.fr