Outils pour utilisateurs

Outils du site


public:umr_ihrim_projets:umr_ihrim_hobbes_spinoza:projet_ihrim_dth:analyse-citation

Analyse des citations bibliques

Méthode :

  • une requête CQL attrape le maximum de références bibliques explicites
  • ce repérage des références est encodé dans des unités URS
    • peut-être d'autres requêtes CQL ou une annotation manuelle supplémentaires sont nécessaires
  • un prétraitement décompose si possible le texte de chaque référence en propriétés (d'unité)
  • une annotation manuelle règle, et peut-être complète, les propriétés des unités (références)
    • un encodage XML-TEI des citations bibliques explicites peut être encodé à partir des unités
  • un index des citations bibliques explicites est produit à partir des unités URS ou d'un encodage XML-TEI
    • cet index peut faire partie de l'édition des textes, par exemple sous forme d'annexe, ou être un document autonome

Étape 1 - Expérimentation de l'application directe des premiers éléments de la méthode

Retours sur l'usage de la macro HobbesConcordancetoUnit s'appuyant sur la requête CQL v2

D'abord, en ce qui concerne la nouvelle requête : [pos=“crd”]? [word=“Mat\.|Acts|Gen\.|Cor\.|Deut\.|Exod\.|Sam\.|Rom\.|Luke|Matth\.|Iohn|Joh\.|Kings|Act\.|John|Prov\.|Tim\.|Heb\.|Mark|Pet\.|Psal\.|Gal\.|Tit\.|Isaiah|Levit\.|Artic\.|Ezek\.|Math\.|Col\.|Math|Numb\.|Numbers|Zach\.|Chron\.|Eph\.|Epist\.|Isay|Luk\.|Marke|Dan\.|Ephes\.|Esay|Ioh\.|Isai|Jo\.|Job|Josh\.|Mar\.|Paul|Proverbs|Psalm|Vers\.|Colos\.|Ierem\.|Iosh\.|Jer\.|Jerem\.|Judges|Micah|Rev\.|Rom|Thess\.|Titus|Ac\.|Act|Act●|Apoc\.|Apocalypse|Aprill|Baruch|Can\.|Chro\.|Coll\.|Deuteronomy|De●…teronomy|Eccles\.|Ecclesiastes|Ecclus\.|Esdras|Exo\.|Exod|Ezektel|Gen|Greg\.|Gregory|Haggai|Hen|Iames|Ier\.|Iob\.|Ioel|Ioshua|Isa|Isa\.|Iud\.|Iude|Iudg\.|Joel|Joshua|Juages|Jud\.|Judg\.|Leo|Lib\.|Matt\.|Matthew|Num\.|Numb|Par\.|Psa\.|Ruth|Timothy|Zach”] @[word=“[0-9].*”] ([word=“[0-9].*|v.*|\p{P}” & word!=“\)|]”])*

Je me suis rendue compte qu'elle fait la tentative d'insérer entre crochets les chiffres des chapitres et des versets bibliques, selon la typologie - comme le montre l'image ci-dessous :

Toutefois, on voit que parfois la requête n'attrape pas toutes les chiffres du pivot de la concordance : par exemple, on trouve 1 Cor. [3.11]8. ou Psal. [19.7,]8.

  • SLH: la partie @[word="[0-9].*"] est sensée marquer le chapitre de la référence, puis permettre une mise en évidence de cet élément dans les résultats (par des crochets dans la Concordance ou encore en n'utilisant que ce qui est marqué dans l'Index).
    • problème : Je ne comprends pas pourquoi le verset est marqué également.

Parfois, il s'agit d'une erreur de la requête ; voir par exemple 1 Cor. [3.11]8. ci dessous, où “8.” ne fait pas partie de la réference biblique, mais introduit la section huitième du chapitre en question :

HOBBESV81LINOISRC Edition - Page 88
come in the Flesh, 1 Cor. 3.11

8. But if Inspiration be discerned by this Point, and this Point be
  • SLH: il s'agit d'un cas de figure non prévu par la requête : le dernier nombre ou chiffre se trouve dans un autre paragraphe ou section → il faut que la requête ne déborde pas des paragraphes ou sections

Parfois, la référence biblique a été effectivement coupée, comme dans le deuxième exemple, où Hobbes cite deux différents versets, le septième et le huitième :

HOBBESV81LINOISRC Edition - Page 153
The Law of God in his Heart, Psal. 19.7, 8.
  • SLH: il me semble que la version précédente de la requête attrapait le maximum de numéros de versets, voire de combinaisons chapitre+verset
    • → vérifier avec l'ancienne requête

Cela implique qu'il faudra pouvoir modifier les bornes de la référence biblique en phase d'annotation manuelle.

  • SLH: oui,
    • vérifier avec la version précédente de la requête si on peut attraper plus de numéros de versets
    • peut-être prévoir une requête supplémentaire spécialisée pour attraper plus de versets ou chapitre+verset
    • prévoir un réglage manuel des bornes des références (l'outil d'annotation le permet)

En autre, je me suis rendue compte que la requête n'attrape pas les “ver./vers.” avec la minuscule (comme la deuxième image ci-dessous le montre : voir “vers. 24”).

  • SLH: a priori je dirais que c'est prévu, la requête cherchant obligatoirement un nom de livre avant des nombres.
    • → pour repérer des “vers. 26” et autre “vers. 24” isolés (non précédés de nom de livre), il faudra utiliser une autre requête, spécialisée dans cela

Ensuite, j'ai lancé la macro, et j'avoue qu'elle est super ! Elle simplifie enormement mon travail. Il y a des aspects que je voudrais clarifier :

  1. j'avais fait des annotations de test avec “Unit type” Biblical quotation, avec d'autres propriétés (voir notre poster). Je souhaite savoir si c'est possible d'unifier les annotations (Biblical quotations + REF) et de réorganiser la hiérarchie des propriétés (au delà de la situation concrète, c'est une question théorique qui m'intéresse. En effet, cela permettrait aussi de développer des requêtes bibliques spécifiques pour attrapper ce qui nous échappe et de les unifier avec les annotations REF) ;
    • SLH: ça pose plusieurs questions :
      • combien de “Biblical quotations” et de “REF” partagent exactement les mêmes bornes dans le texte ?
      • combien de “Biblical quotations” et de “REF” partagent à peu près les mêmes bornes dans le texte ?
      • en fonction de ces réponses : comment transférer dans des “Biblical quotations” ou à l'inverse dans des “REF” les informations des autres unités, ou bien créer de nouvelles unités ayant les mêmes bornes et fusionnant les propriétés de toutes les unités ayant ces bornes
  2. à propos de la réorganisation de la hiérarchie des propriétés, je souhaite savoir s'il serait possible d'organiser de groupes de propriétés par couches dans le panel d'annotation : par exemple
    • couche 1 qui réunit les propriétés qui permettent l'extraction correcte de la référence biblique ;
    • couche 2 qui réunit les propriétés qui permettent de décrire la forme de la référence annotée ;
    • couche 3 qui réunit les propriétés qui permettent de décrire le contenu de la référence ;
    • couche 4 qui réunit les propriétés qui permettent de décrire le contexte…
    • SLH: la fenêtre “Gestion de la vue” ouverte par la commande “” permet dans l'onglet “Présentation des champs” de choisir pour chaque propriété d'unité :
      • un niveau
      • une position
      • s'il est éditable ou non
      • → je suppose que l'information de “niveau” pourrait permettre de piloter un affichage des champs (propriétés) par couches
        • d'après le ticket de dévellopement #2418, complété à 80%, cela serait peut-être déjà disponible dans TXM
  3. si j'ai compris correctement, les propriétés prévues devraient permettre d'extraire correctement les citations de Hobbes, en distinguant entre la forme graphique de la référence (par exemple : “vers. 24”) et la référence complète (par exemple, “Num. 11.24”, qui permet de générer l'index des citations bibliques explicites). Elles, en outre, permettent d'extraire le nom du livre biblique. Est-ce que la différence entre “chaps” et “raw_chaps” permet l'extraction, pour chaque livre biblique, des chapitres cités par Hobbes ? Est-ce que c'est idem pour la différence entre “verses” et “raw_verses” ?
    • SLH: oui, l'idée est de construire, morceau par morceau, à partir des informations de surface attrapées par la requête, les informations renseignant le plus possible une citation biblique
      • les champs “raw…” sont des extraits de la surface complète de la citation se trouvant à une position précise de la syntaxe des références de citations (c'est leur position qui détermine leur type ou portion d'information de la citation)
      • les champs livre, chapitre, versets sont une interprétation de ces extraits pour construire l'information exacte (le champ livre est un transfert direct d'un champ raw implicite)
        • → avec des unités correctement renseignées en champs livre, chapitre et verset - et entièrement vérifiée automatiquement et manuellement - on peut générer un encodage XML-TEI complet des citations ainsi qu'un index ajouté à l'édition ou produit dans un document externe (avec une mise en forme de surface imitant celle de Hobbes ou originale, resposant sur la forme canonique des citations).
        • → il faudra probablement prévoir une phase d'éclatement des unités “citation bibliques” pour en créer autant qu'il y a de combinaisons livre-chapitre-verset, avec des unités qui partagent les mêmes bornes de positionnement au sein des textes, pour pouvoir manipuler indépendamment ces citations pour la production d'un index
public/umr_ihrim_projets/umr_ihrim_hobbes_spinoza/projet_ihrim_dth/analyse-citation.txt · Dernière modification: 2019/09/09 18:51 par slh@ens-lyon.fr