Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:perseus [2017/05/03 19:51]
slh@ens-lyon.fr
public:perseus [2017/12/01 17:54] (version actuelle)
benedicte.pincemin@ens-lyon.fr
Ligne 1: Ligne 1:
-Cette page sert au suivi de projets mobilisant TXM pour analyser des corpus de textes issus de Perseus :+This page is dedicated to projects using TXM on texts taken from the Perseus Digital Library :
  * [[http://www.perseus.tufts.edu/hopper|Perseus Digital Library]]   * [[http://www.perseus.tufts.edu/hopper|Perseus Digital Library]]
-    * version XML dans Github+    * XML edition (Github)
  * [[ https://perseusdl.github.io/treebank_data|The Ancient Greek and Latin Dependency Treebank]] (Github)   * [[ https://perseusdl.github.io/treebank_data|The Ancient Greek and Latin Dependency Treebank]] (Github)
-Pour chacune de ces sources on dispose déjà de plusieurs feuilles XSL utiles : +Please note that this is a public page.
-  * txm-filter-perseus-tei-xtz.xsl +
-    * conversion p4 à p5 +
-    * div1, div2 +
-    * group -> subtext +
-      * teiheader-to-metadata.xsl (injecte des attributs de text à partir de données du teiHeader : premier auteur, premier titre, premier éditeur) +
-  * feuille pour les références +
-  * txm-filter-perseustreebank-xmlw.xsl+
-Il y a des macros utiles : +Anybody who has subscribed to txm-users mailing list can edit this page.
-  * text2metadata à vérifier : produit un metadata.csv à partir des XML-TXM d'un corpus (demander à Matthieu)+
-Elles seront disponibles dans SF.+====== Projects ======
-Dans la mesure où cette page est actuellement publique, il est recommandé de veiller à maintenir un niveau d'anonymat raisonnable. (merci de nous contacter si cette page doit évoluer vers plus de confidentialité) +  * [[public:perseus_201707_plato|July 2017, 29 greek texts from Plato.]] Context : paper submitted to [[https://chs.harvard.edu/CHS/article/display/1167?menuId=66|Classics@]]. 
- +  * [[public:perseus_201705_cicero|May 2017, 29 latin texts from Cicero.]] Context : Conference [[http://www.altphil.uni-freiburg.de/texte-messen/digital-classics-iii-2013-re-thinking-text-analysis|Digital Classics III – Re-thinking Text Analysis]], Concluding conference on the project //Der digital turn in den Altertumswissenschaften: Wahrnehmung - Dokumentation - Reflexion//, Heidelberg, May 11–13, 2017. 
-Pour éditer cette page, il suffit d'être abonné à la liste de diffusion 'txm-users'. +  * [[public:perseus_agdt_201705_plato|May 2017, 1 greek annotated text from Plato (AGDT2).]] Context : Conference [[http://www.altphil.uni-freiburg.de/texte-messen/digital-classics-iii-2013-re-thinking-text-analysis|Digital Classics III – Re-thinking Text Analysis]], Concluding conference on the project //Der digital turn in den Altertumswissenschaften: Wahrnehmung - Dokumentation - Reflexion//, Heidelberg, May 11–13, 2017
- +  * [[public:perseus_201212_plautus|December 2012, 20 latin plays from Plautus.]] Context : presentation at the [[http://www.dh.uni-leipzig.de/wo/e-humanities-seminar/|University of Leipzig eHumanities Seminar]] on December 5th, 2012.
-====== Projet corpus démo Perseus Latin ====== +
- +
-===== Descriptif du projet ===== +
- +
-  * context : Heidelberg, May 2017 : [[http://www.altphil.uni-freiburg.de/texte-messen/digital-classics-iii-2013-re-thinking-text-analysis]] +
- +
-  * objectif : +
-    * demonstrating that one can work on texts available from Perseus project in TXM +
-    * TEI compliant import +
-    * if possible, nice editions (could be shown through another corpus) +
- +
-  * corpus +
-    * Cicero's texts, latin edition : a copy is here : [[https://sharedocs.huma-num.fr/#/948/3789/Projets/Textom%C3%A9trie/Corpus/src/perseus/Cicero/170502latin]] +
-      * we get all files ending with _lat, except cic.pet_lat.xml because it's a text from Q. Tullius Cicero instead of M. Tullius Cicero. +
- +
-===== Spécifications ===== +
- +
-Metadata : from <teiHeader><fileDesc><titleStmt>, get +
-  * first <title> content+
-  * first <author> content, +
-  * first <editor> content. +
- +
-Manage XML-TEI features which wouldn't work with CQP : +
-  * div1, div2 -> div +
-  * <text><group><text> -> <text><group><textgroupitem> (or other better tag name) +
- +
-Distribute <milestone> attributes' information on word tokens (when available). +
- +
-===== Recettes ===== +
- +
-À venir. +
- +
-===== Plannification ===== +
- +
-==== Étape 1 ==== +
- +
-==== Étape 2 ==== +
- +
-etc. +
- +
-====== PLAUTELAT & PLAUTEEN TXM demo ====== +
- +
-===== Goal ===== +
- +
-  * Context is 2012-12-05 Leipzig eHumanities Seminar +
-  * goal is demo TXM on Latin and English translations texts from Perseus to G. Crane +
- +
-===== Corpus ===== +
- +
-Corpus au Plaute's plays in Latin and their translation in English from Perseus. +
- +
-Import parameters (updated from XML/w to XTZ): +
-  * 2-front : +
-    * txm-filter-teiperseus-xmlw.xsl +
-    * txm-filter-teip5-xmlw-preserve.xsl +
-  * lat.par TreeTagger model +
- +
-  * PLAUTELAT: corpus of Plaute' Latin plays +
-    * source: [[https://sharedocs.huma-num.fr/wl/?id=qftriVBBeFES4jmt2BIobq1IqtypXGnK|davs://sharedocs.huma-num.fr/dav.php/@Shares/(948)%20Cactus/(3792)%20Cactus/Projets/Textométrie/Corpus/src/plautelat-src.zip]] +
-    * binary: [[https://sharedocs.huma-num.fr/wl/?id=eOLdijlvM50Qep1BQTz7UICvYHS3bPDq|davs://sharedocs.huma-num.fr/dav.php/@Shares/(948)%20Cactus/(3792)%20Cactus/Projets/Textométrie/Corpus/bin/PLAUTELAT.txm]] +
-  * PLAUTEEN: corpus of Plaute' English translation of plays +
-    * todo +
- +
----- +
--> [[:|Retour à la liste des projets]].+
public/perseus.1493833883.txt.gz · Dernière modification: 2017/05/03 19:51 par slh@ens-lyon.fr