Outils pour utilisateurs

Outils du site


public:xml_tei_urs

Ceci est une ancienne révision du document !


Spécifications du format XML-TEI URS

URS = Unite Relation Schema, au sens des logiciels Glozz et Analec.

Ce format sert à sérialiser les annotations de ce type en XML en suivant les recommandations de la TEI.

Solutions

V0 - Analec 1.5

Utilise les éléments :

  • back
    • spanGrp@type=AnalecUnite+@n=TypeUnite / span
      • linkGrp@type=AnalecRelation|AnalecSchema+@n=TypeRelation|TypeSchema / link

V1 - article ISA 2017

"Interoperable annotation of (co)references in the Democrat project", Thirteenth Joint ISO-ACL Workshop on Interoperable Semantic Annotation, Sep 2017, Montpellier

Utilise les éléments :

  • standOff
    • div@type=coréférence
      • spanGrp@type=unit / span
        • linkGrp@type=relation|schema / link

V2 - évolution pour l'implémentation dans l'extension Analec de TXM

annotations et textes

On croise avec le modèle XML-TEI TXM et le modèle d'annotation proposé par https://github.com/laurentromary/stdfSpec.

Utilise les éléments :

  • standOff
    • soHeader / title
    • annotations@type=coréférence ← div@type=coréférence
      • annotationGrp avec @type=Unit|Relation|Schema et @subtype=TypeUnite|TypeRelation|TypeSchema ← respectivement spanGrp@type+@n et linkGrp@type+@n
        • span (unités) OU link (relations et schémas) avec @xml:id, @ana, @from, @to et @target ← span et link
      • div@type=unit-fs
        • fs / f
      • div@type=relation-fs
        • fs / f
      • div@type=schema-fs
        • fs / f
spanGrp/span et joinGrp/join sont actuellement utilisés pour les annotations d'Analec → ils sont remplacés par annotationGrp/span|link
linkGrp/link sont utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers le 'standOff'). Exemple : TreeTagger.

Les annotations sont stockées dans un fichier indépendant du corps du texte1). Voir la spécification de la commande d'export XML-TEI URS section implémentation TXM.

Les annotations pointent vers des mots du format XML-TEI TXM.

Les pointeurs d'annotations utilisent le mécanisme de prefixDef de la TEI2). Voir des exemples de prefixDef dans commande d'export XML-TEI URS et XML-TEI TXM standoff.

structure d'annotation

Un fichier “.aam” au format XML de sérialisation du logiciel Glozz.

1)
pour une V1
2)
utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas
public/xml_tei_urs.1508508283.txt.gz · Dernière modification: 2017/10/20 16:04 par matthieu.decorde@ens-lyon.fr