Cette page sert au suivi des projets de l'UMR HISOMA mobilisant TXM.

Dans la mesure où cette page est actuellement publique, il est recommandé de veiller à maintenir un niveau d'anonymat raisonnable. (merci de nous contacter si cette page doit évoluer vers plus de confidentialité)

Pour éditer cette page, il suffit d'être abonné à la liste de diffusion 'txm-users'.

Projet Bible de Bernard

Descriptif du projet

Contexte

L'institut des Sources Chrétiennes est une composante du laboratoire HiSoMa “Histoire et Sources des Mondes Antiques” au sein de la Maison de l'Orient et de la Méditerranée et est également associé à l'université Lumière Lyon II. Ils ont pour activité essentielle l'édition et la traduction d'écrits chrétiens des Pères de l'Église. Les ouvrages de la collection Sources Chrétiennes sont, pour la grande majorité, bilingues, avec le texte original sur la page de gauche et la traduction française sur celle de droite. Ces ouvrages sont publiés par les Éditions du Cerf.

Corpus

Le projet “Bible de Bernard” concerne un corpus de textes au sein de la collection Sources Chrétiennes : les textes parus - et à paraître - de Bernard de Clairvaux. Ce corpus comporte une soixantaine d'ouvrages (liste sur le site de biblindex http://www.sources-chretiennes.mom.fr/index.php?pageid=auteurs_anciens&id=19&sourcepg=auteurs_anciens)
Le projet s'articule autour de deux axes. Le premier consiste en l'implémentation d'une chaîne d'édition allant de l'établissement du texte à sa publication papier (mise en page dans InDesign) en passant par un fichier pivot en XML-TEI. Cette chaîne est issue de la chaîne d'édition structurée Métopes de Caen, adaptée pour répondre aux besoins spécifiques du corpus. Elle permet un encodage fin des données en XML-TEI, en particulier en ce qui concerne l'encodage des citations scripturaires. Le second axe du projet est celui qui intégrerait TXM.

Objectifs généraux

Cette partie du projet “Bible de Bernard” s'appuie sur l'encodage fin des textes et des citations scripturaires et cherche à proposer aux chercheurs un outil personnel sur poste d'interrogation et de consultation de ces textes. Cet outil devra proposer, à la lecture comme à l'interrogation, les textes du corpus Bernard de Clairvaux (textes latin et traduction) ainsi que la Vulgate (Biblia Sacra Vulgata, édition de Weber-Gryson).

Spécifications

Fonctionnalités à développer

Partie consultation

Il faudrait pouvoir choisir d'afficher le latin et la traduction en vis-à-vis. Il faudrait peut-être pouvoir mettre en regard les textes avec la Vulgate.

Partie interrogation

On souhaiterait faire une recherche d'un verset d'un livre de la Vulgate et voir apparaître les passages dans lesquels Bernard de Clairvaux cite ce verset, avec les mots exactement repris de la Bible et un contexte de citation. Le pivot serait alors la citation (encodée avec l'élément <seg>).

On souhaiterait faire une recherche de deux versets en même temps, en spécifiant par exemple “séparés au maximum de 50 mots” et voir apparaître les passages dans lesquels Bernard de Clairvaux cite ces deux versets avec ce paramètre.

Descriptif de l'encodage

L'encodage en XML-TEI des textes du corpus s'appuie sur un système d'identifiants. Le texte latin et sa traduction sont encodés exactement de la même manière ; leurs identifiants sont identiques, mais ils sont préfixés de la langue du document (lat ou fr). Chaque niveau de la structure du document est encodé. Ainsi, les <div> structurelles, mais aussi les titres, les paragraphes, les citations, les incises, les notes et les mots ont un identifiant spécifique. Cet identifiant se présente ainsi (par exemple pour un mot) : [langue du document].w.[titre abrégé du texte].[numéro du mot dans le texte]. Les identifiants des mots de la Vulgate sont : Vg.[titre abrégé du livre].[numéro de chapitre].[numéro de verset].[numéro du mot dans le verset]. Dans le texte latin, les citations scripturaires sont suivies d'une note qui renvoie précisément aux mots de la Vulgate cités.

Changements à opérer

Il sera peut-être nécessaire d'ajouter une XSL à l'import dans TXM afin de modifier l'encodage des textes du corpus, par exemple pour que les mots d'une citation scripturaire aient des identifiants composés de la même manière que ceux des mots de la Vulgate.

Réalisations

Achevées

En cours

  • Effectuer un recensement des fichiers existants et des fichiers à préparer pour mettre en place le corpus test
  • Préparer les fichiers manquants

Prévues

  • Création d'une première XSL pour l'import
  • Soumettre à un test le premier import

Recettes

public/umr_hisoma.txt · Dernière modification: 2017/04/28 17:33 par loucecille93@gmail.com