Outils pour utilisateurs

Outils du site


Panneau latéral

public:xml_tei_urs

Ceci est une ancienne révision du document !


Spécifications du format XML-TEI URS

URS = Unite Relation Schema, au sens des logiciels Glozz et Analec.

Ce format sert à sérialiser les annotations de ce type en XML en suivant les recommandations de la TEI.

Solutions

V0 - Analec 1.5

Utilise les éléments :

  • back
    • spanGrp@type=AnalecUnite+@n=TypeUnite / span
      • linkGrp@type=AnalecRelation|AnalecSchema+@n=TypeRelation|TypeSchema / link

V1 - article ISA 2017

"Interoperable annotation of (co)references in the Democrat project", Thirteenth Joint ISO-ACL Workshop on Interoperable Semantic Annotation, Sep 2017, Montpellier

Utilise les éléments :

  • standOff
    • div@type=coréférence
      • spanGrp@type=unit / span
        • linkGrp@type=relation|schema / link

V2 - évolution pour l'implémentation dans l'extension Analec de TXM

On croise avec le modèle XML-TEI TXM et le modèle d'annotation proposé par https://github.com/laurentromary/stdfSpec utilisant les éléments :

  • stdf ← standOff
    • soHeader / title
    • annotations@type=coréférence ← div@type=coréférence
      • annotationGrp avec @type=Unite|Relation|Schema et @subtype=TypeUnite|TypeRelation|TypeSchema ← respectivement spanGrp@type+@n et linkGrp@type+@n
        • span avec @xml:id, @ana, @from, @to et @target ← span et link
spanGrp/span et joinGrp/join sont actuellement utilisés pour les annotations d'Analec → ils sont remplacés par annotationGrp/span
linkGrp/link restent pour l'instant utilisés pour les annotations TAL de TXM dans le format XML-TXM (en attendant de migrer vers annotationGrp/span). Exemple : TreeTagger.

Les annotations sont stockées dans un fichier indépendant du corps du texte1). Voir la spécification de la commande d'export XML-TEI URS section implémentation TXM.

Les annotations pointent vers des mots du format XML-TEI TXM.

Les pointeurs d'annotations utilisent le mécanisme de prefixDef de la TEI2). Voir des exemples de prefixDef dans commande d'export XML-TEI URS et XML-TEI TXM standoff.

1)
pour une V1
2)
utile quand on permettra de stocker les annotations au sein du fichier texte - les pointeurs seront les mêmes que les annotations soient dans un fichier indépendant ou pas
public/xml_tei_urs.1508239303.txt.gz · Dernière modification: 2017/10/17 13:21 par slh@ens-lyon.fr