Outils pour utilisateurs

Outils du site


public:meta_donnees_de_frantext

Nous sommes actuellement en train de préciser très nettement les métadonnées des oeuvres présentes dans la base Frantext. L'ancienne structure présentant peu d'intérêt, suit la description de celle que nous (ou plutôt Lucia Manea) renseignons actuellement. En cas de questions précises sur l'intérêt de ces métadonnées du point de vue linguistique ou littéraire, le mieux est de s'adresser à Véronique Montémont (de l'Atilf). Schématiquement, l'idée est de disposer :

  • de la référence précise de l'édition encodée (qui fait foi quand à la pagination par exemple)
  • de la référence précise de l'édition encodée relativement au contenu textuel (souvent on encode et on massicote une édition de poche dont le contenu textuel est identique à celui d'une édition antérieure laquelle date le texte)
  • de la référence précise de l'édition originale

La structure générale est la suivante :

Un composant (profil) oeuvre contenant :

  • un nombre indéfini supérieur à 1 d'occurence de auteur
  • une unique occurence de édition encodée
  • une unique occurence de édition modifiée (i.e. première édition à contenu textuel identique à l'édition encodée)
  • une unique occurence de édition originale
  • une unique occurence de paratextes
  • une unique occurence de domaine (typologie en genres)
  • une unique occurence de statut juridique
  • une unique occurence de disponibilité (i.e. la source imprimmée)

composant auteur

  • nom d'usage
  • Prénom d'usage
  • nom (état civil)
  • prénom (état civil)
  • date de naissance
  • date de décès
  • genre social (i.e sexe)
  • pays
  • un nombre indéfini de pseudonyme (chacun étant une simple chaîne de caractère)

les composants édition originale, édition modifiée et édition originale sont des composants classiques en matière de bibliographies (Frantext ne s'intéresse qu'à des textes imprimés “récents”) on y trouve donc :

  • date de publication (achevé d'imprimmer)
  • titre de la partie numérisée
  • éditeur partie numérisée
  • titre du volume
  • éditeur commercial
  • lieu d'édition
  • date d'édition
  • éditeur scientifique du volume
  • ISBN
  • série/cycle (ex: les Thibaut)
  • numéro dans la série
  • quantième dans la série (c.a.d. normalisation sous forme de nombre du précédent)
  • série de l'éditeur (= collection)
  • numéro dans la collection
  • quantième dans la collection
  • nombre de page
  • référence des pages numérisées
  • localisation du document

composant paratexte :

  • préface
  • postface
  • autres paratexte

Chacun de ces trois composant a la même structure composé de :

  • auteur
  • pages
  • titre
  • date
  • type

J'essaierais de joindre aussitôt que possible la typologie des domaines qui est un peu vaste et fastidieuse à reproduire ici.

public/meta_donnees_de_frantext.txt · Dernière modification: 2011/12/22 15:58 par bertrand.gaiffe@atilf.fr