Cette page sert au suivi du projet « Interaction des langues et des cultures dans l’univers des journaux intimes russes francophones au XIXe siècle ».

Dans la mesure où cette page est actuellement publique, il est recommandé de veiller à maintenir un niveau d'anonymat raisonnable. (merci de nous contacter si cette page doit évoluer vers plus de confidentialité)

Pour éditer cette page, il suffit d'être abonné à la liste de diffusion 'txm-users'.

Analyse et publication de corpus de journaux intimes

Descriptif du projet

Le projet vise premièrement à rendre accessible à la communauté académique une série de journaux intimes écrits par des Russes en langue française au XIXe siècle. Un autre objectif consiste à analyser ces sources dans un cadre complexe basé sur une approche interdisciplinaire et utilisant les dernières avancées méthodologiques en sciences humaines et sociales. Un grand nombre de ces journaux portent en effet un caractère sémiotique complexe, ce qui rend indispensable une approche intermédiale complexe intégrant des méthodes d’analyse élaborées dans le cadre de la linguistique, de la critique littéraire, de l’histoire de l’art et de l’anthropologie historique. Le corpus du projet couvre la période du début au dernier quart du XIXe siècle, une période d’interaction particulièrement intense entre les cultures russe et européenne. La qualité littéraire et le riche aspect visuel de certaines de ces sources en font des phénomènes novateurs et originaux dans la culture russe dont la nature même n’a pas été découverte jusqu’à présent. Le corpus du projet sera numérisé, annoté en XML-TEI, analysé et publié en ligne grâce au logiciel open-source TXM développé au laboratoire du partenaire français (UMR IHRIM). L’équipe du projet est composée de littéraires, de linguistes, de paléographes, d’historiens de l’art et de spécialistes en humanités numériques.

Chaîne philologique commune

V. 1

  1. Préparation de la transcription et éventuellement de la traduction russe sous Word.
  2. Préparation des images pour le fac-simimé des pages du document
    • Les images doivent être placées dans un dossier qui porte le même nom que le document XML (sans extension)
    • L'ordre alphabétique des noms des images doit correspondre à l'ordre des pages. Il peut être nécesssaire d'ajouter des “0” devant les noms numériques (e.g. renommer 9.jpg en 009.jpg)
  3. Conversion en TEI avec Oxgarage
    • DOCX –> TEI P5
    • le document doit être enregistré au format DOCX avec Word (l'export Writer fait perdre la structure en divisions)
    • si le document contient des images, il faut décompresser le résultat, renommer tei.xml en [identifantDuTexte.xml], copier le dossier “media” dans un un sous-dossier “images” des sources pour l'importation TXM
  4. Importation dans TXM
    • module XTZ
    • un pack de feuilles de style XSL

V. 2...

  • Les étapes 3 et 4 sont remplacées par une importation directe du document Word (ou ODT) avec un nouveau module repgroupant les options des modules DOC et XTZ.
  • Intégration automatisée de la traduction
    • option A : corpus unique avec 2 textes (fr et ru), affichage des pages face à face
    • option B : corpus parallèle
  • Annotation du texte et des images dans TXM

Chantier A : corpus DAVYDOVA

préparation du corpus sous Word

import de ce corpus dans TXM

formulation de manipulations dans TXM

discussion sur la façon d'améliorer

production des spécifications de développement

Chantier B : Corpus ATCHITCHERINE

Ce corpus contient des illustrations qui sont annotées et liées au texte du journal.

Préparation du corpus sous Word

  • On prépare 3 documents :
    • transcription en français (avec les images et leurs desctions incorporées)
    • traduction en russe (version complète)
    • traduction en russe synchronisée avec la transcription (extrait de la traduction complète)
      • le nombre de pages et d'images doit être strictement identique dans la transcription et la traduction

import de ce corpus dans TXM

formulation de manipulations dans TXM

  • télécharger le corpus binaire ATCHITCHERINE (mot de passe nécessaire)

discussion sur la façon d'améliorer

production des spécifications de développement

Recettes

Spécifications

Documentations

Tutoriels

Questions de recherche et scénarios d'utilisation TXM

public/novossibirsk_journaux_francophones.txt · Dernière modification: 2017/04/20 17:09 par alexei.lavrentev@ens-lyon.fr