Outils pour utilisateurs

Outils du site


public:spec_corpus

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:spec_corpus [2019/07/29 16:53]
slh@ens-lyon.fr [Spécification des Corpus Parallèles]
public:spec_corpus [2019/08/23 11:36] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 22: Ligne 22:
 ==== Spécification des Corpus Parallèles ==== ==== Spécification des Corpus Parallèles ====
  
-Les corpus parallèles servent aux situations suivantes : +Voir la spécifications ​des [[public:spec_corpus:​corpus_parallele|Corpus parallèles]].
-  * on dispose de traductions de textes, alignées ou pas (eg projets AL fr/ru et fr/fro, CS fr/​en/​it/​etc.) +
-  * on dispose de différentes versions de textes +
-  * on dispose de différents textes en rapport avec le même média source (ANTRACT : vidéo/​audio -> notices, transcriptions,​ tapuscrits...) +
- +
-L'​import TMX permet d'​exploiter des corpus parallèles alignés, mais le format est très limité : +
-  * pas d'​encodage des mots +
-  * pas d'​édition particulière +
-  * etc. +
- +
-L'​import XTZ permet de créer des éditions synoptiques alignant ​des pages de versions différentes d'un même texte +
-  * [[https://​groupes.renater.fr/​wiki/​txm-users/​tutoriel_import_multilang_synoptique|pratique dans l'​architecture actuelle de TXM 0.8.0]]\\ Remarque : cette pratique est obligée de dupliquer les éditions, ce qui n'est pas optimal +
- +
-Nous avons besoin de gérer les cas suivants : +
-  * corpus parallèle alignés ou non encodés en TEI +
-  * transcriptions d'​enregistrement parallèles +
- +
-L'​architecture visée peut être : +
-  * pour l'​indexation +
-    * autant de corpus que de langue ou version +
-    * une compilation des langues ou versions au sein d'un même corpus +
-  * pour l'​édition +
-    * éditions synoptiques,​ avec retour au texte depuis chaque langue ou version +
- +
-En import cela peut concerner XTZ ou un nouveau module ou un scénario de choix d'​import différent : 1) type de corpus (parallèle ou non, etc.) avant 2) format de corpus.+
  
 ===== Solution jusqu'​à TXM 0.7.9 ===== ===== Solution jusqu'​à TXM 0.7.9 =====
public/spec_corpus.txt · Dernière modification: 2019/08/23 11:36 par matthieu.decorde@ens-lyon.fr