Ceci est une ancienne révision du document !


Cette page sert au suivi de projets mobilisant TXM pour analyser des corpus de textes issus de Perseus :

Pour chacune de ces sources on dispose déjà de plusieurs feuilles XSL utiles :

  • txm-filter-perseus-tei-xtz.xsl
    • conversion p4 à p5
    • div1, div2
    • group → subtext
      • teiheader-to-metadata.xsl (injecte des attributs de text à partir de données du teiHeader : premier auteur, premier titre, premier éditeur)
  • feuille pour les références
  • txm-filter-perseustreebank-xmlw.xsl

Il y a des macros utiles :

  • text2metadata à vérifier : produit un metadata.csv à partir des XML-TXM d'un corpus (demander à Matthieu)

Elles seront disponibles dans SF.

Dans la mesure où cette page est actuellement publique, il est recommandé de veiller à maintenir un niveau d'anonymat raisonnable. (merci de nous contacter si cette page doit évoluer vers plus de confidentialité)

Pour éditer cette page, il suffit d'être abonné à la liste de diffusion 'txm-users'.

Projet corpus démo Perseus Latin

Descriptif du projet

  • objectif :
    • demonstrating that one can work on texts available from Perseus project in TXM
    • TEI compliant import
    • if possible, nice editions (could be shown through another corpus)

Spécifications

Metadata : from <teiHeader><fileDesc><titleStmt>, get

  • first <title> content,
  • first <author> content,
  • first <editor> content.

Manage XML-TEI features which wouldn't work with CQP :

  • div1, div2 → div
  • <text><group><text> → <text><group><textgroupitem> (or other better tag name)

Distribute <milestone> attributes' information on word tokens (when available).

Recettes

À venir.

Plannification

Étape 1

Étape 2

etc.

PLAUTELAT & PLAUTEEN TXM demo

Goal

  • Context is 2012-12-05 University of Leipzig eHumanities Seminar
  • goal was to demo TXM on Latin and English translations of Plaute' plays from Perseus

Corpus

Corpus au Plaute's plays in Latin and their translation in English from Perseus.

Import parameters (updated from XML/w to XTZ):

  • 2-front :
    • txm-filter-teiperseus-xmlw.xsl
    • txm-filter-teip5-xmlw-preserve.xsl
  • lat.par TreeTagger model

Retour à la liste des projets.

public/perseus.1493833989.txt.gz · Dernière modification: 2017/05/03 19:53 par slh@ens-lyon.fr