Outils pour utilisateurs

Outils du site


public:umr_ihrim_hobbes_spinoza

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Dernière révision Les deux révisions suivantes
public:umr_ihrim_hobbes_spinoza [2018/05/25 13:32]
slh@ens-lyon.fr
public:umr_ihrim_hobbes_spinoza [2018/11/20 17:10]
francesca.rebasti@gmail.com
Ligne 1: Ligne 1:
-====== Partage de sources textuelles : Hobbes ​et Spinoza ======+====== Partage de sources textuelles : HobbesSpinoza... ======
  
 Diffuser des corpus binaires TXM dédiés aux éditions de référence pour travailler sur des auteurs, pour faciliter leur lecture et leur exploration avec TXM. L'​utilisateur n'a que quatre opérations simples à faire pour travailler sur le corpus : Diffuser des corpus binaires TXM dédiés aux éditions de référence pour travailler sur des auteurs, pour faciliter leur lecture et leur exploration avec TXM. L'​utilisateur n'a que quatre opérations simples à faire pour travailler sur le corpus :
Ligne 9: Ligne 9:
 En gros, des éditions Word qui circulent sous le manteau, ou librement, entre collègues sont de bons candidats pour faire partie d'un corpus qui circulera entre collègues ou étudiants pour les lire avec TXM. L'​idée est que TXM peut être plus utile pour parcourir systématiquement un ou plusieurs textes pour une étude donnée. Sachant que les derniers développements d'​annotation dans TXM offrent une perspective de saisie, d'​exploitation et de transmission de commentaires potentiellement intéressante. En gros, des éditions Word qui circulent sous le manteau, ou librement, entre collègues sont de bons candidats pour faire partie d'un corpus qui circulera entre collègues ou étudiants pour les lire avec TXM. L'​idée est que TXM peut être plus utile pour parcourir systématiquement un ou plusieurs textes pour une étude donnée. Sachant que les derniers développements d'​annotation dans TXM offrent une perspective de saisie, d'​exploitation et de transmission de commentaires potentiellement intéressante.
  
-On commence par des textes philosophiques Hobbes et Spinoza.+On commence par des textes philosophiques ​Hobbes et Spinoza.
  
 ===== Projets ===== ===== Projets =====
Ligne 35: Ligne 35:
  
 Remarques sur la v5.0 : Remarques sur la v5.0 :
-  * les Elements sont maintenant composés du frontispice (contenu de l'​élément <​front>​) de la première partie suivi de la première partie, suivi de la deuxième partie +  * **OK** ordre des textes dans Elements : les Elements sont maintenant composés du frontispice (contenu de l'​élément <​front>​) de la première partie suivi de la première partie, suivi de la deuxième partie 
-  * la ponctuation a disparu : **corrigé** ​(les ponctuations sont devenues des mots et j'ai créé une nouvelle catégorie '​p'​ qui n'​existe pas dans NUPOS) +  ​* **OK** la ponctuation a disparu : (les ponctuations sont devenues des mots et j'ai créé une nouvelle catégorie '​p'​ qui n'​existe pas dans NUPOS - voir la nouvelle XSL '​convert-pc-to-w.xsl'​
-  * les identifiants de texte dans les références ne sont pas corrects +  ​* références : 
-  * les identifiants de texte dans les éditions ne sont pas corrects +    * **OK** les identifiants de texte dans les références ne sont pas corrects ​: (corrigé text@id) 
-  * il faudrait passer les passages en latin du frontispice des Elements ​dans le plan 'hors texte à éditer'​+    * **OK** certaines références ont perdu leur n° de page, paragraphe ou chapitre : ceci est du au fait que les éléments ne sont pas numérotés systématiquement avec @n (il n'y a donc des @n que de temps en temps) : (forcé la numérotation de tous les éléments, pour qu'​elle soit disponible pour la construction des ref et reffull) 
 +    * **OK** certains retour au texte ne fonctionnent plus : (forcé tous les IDs de W et PC avec la macro ForceWordIDs et converti les PC en W) 
 +  ​* **OK** les identifiants de texte dans les éditions ne sont pas corrects ​(corrigé text@id) 
 +  * il faudrait passer les passages en latin du frontispice des //​Éléments// ​dans le plan 'hors texte à éditer' ​  
 +  * il faut comprendre pourquoi une partie du texte (compris dans la balise <hi>) n’est plus en italique et corriger l’affichage de l’édition
   * il faudrait passer les notes de Hobbes dans un nouveau plan 'notes à indexer'​   * il faudrait passer les notes de Hobbes dans un nouveau plan 'notes à indexer'​
-  * les liens vers les images de facsimilés du Léviathan sont absents (il faut les recoder)+  ​* il faut intégrer les //​marginalia//​ de Hobbes dans l’édition (mais, contrairement à la v4.0, en marge et pas dans le texte) et dans les calculs statistiques 
 +  * il faut corriger la numérotation et, éventuellement,​ la structuration des parties, des chapitres et des paragraphes des textes (y compris le //​Léviathan//​) de manière à afficher correctement les références et à créer des sub-corpus et des partitions plus fins. Il faudra modifier ref et fullref en conséquence 
 +  ​* les liens vers les images de facsimilés du //Léviathan// sont absents (il faut les recoder) 
 + 
 +**Problèmes issus de requêtes spécifiques :** 
 +  * une comparaison avec l’index hiérarchique des lemmes de substantifs du corpus Hobbes 4 a révélé la présence d’erreurs même dans la lemmatisation du corpus Hobbes 5 (voir la première image). Des formes graphiques avec des majuscules du lemme « God » n’ont pas été reconnues comme telles sans la neutralisation de la casse (voir la deuxième image)  
 +{{:​public:​lemme_god_h3_et_5.jpg?​1050}} 
 + 
 +{{:​public:​formes_graphiques_du_lemme_god.jpg?​1050}} 
 +  * quand on affiche les dimensions de la partition du //​Léviathan//​ par chapitre, les chapitres n’apparaissent pas dans l’ordre croissant 
 +{{:​public:​07_dimension_des_chapitres_du_leviathan.jpg?​1050}} 
 + 
 +**Bugs :** 
 +  * quand on crée une partition (voir la première image) ou un sub-corpus (par exemple, du //​Léviathan//​),​ TXM génère plus fichiers que prévu (voir la deuxième et la troisième image), même si on redémarre TXM avant de lancer la commande. On a l’impression que TXM se rappelle des requêtes précédentes et propose des résultats mélangés. 
 +  {{:​public:​partition_political_works.jpg?​400}} {{:​public:​resultats_de_la_partition.jpg?​200}} {{:​public:​resultat_du_sub-corpus.jpg?​200}} 
 + 
 +  * quand on lance le calcul de spécificité sur la partition //Political Works// ou sur le sub-corpus //​Leviathan//,​ la console affiche les messages suivants : 
 +**Propriété lemme :**  
 + 
 +**1)** ''​%%Computing Specificites on Political Works and property lemma 
 +Error while computing specificities:​ org.txm.stat.engine.r.RException:​ ** R error: "Error in lexicaltable[types,​ , drop = FALSE] : subscript out of bounds 
 +
 +while evaluating: SpecifResult2<​-specificities(LexicalTable31,​ Vector34, NULL)%%''​  
 + 
 +**2)** ''​%%Computing Specificities on subcorpus Leviathan with corpus HOBBES5. Properties: lemma 
 +** R error: "Error in lexiconsToLexicalTable(lexicon,​ sublexicon) :  
 +  type cannot be more frequent in the sublexicon than in the lexicon 
 +
 +while evaluating: SpecifResult1<​-specificities.lexicon.new(Lexicon1,​ Lexicon2) 
 +Error while computing specificities:​ java.lang.NullPointerException 
 +java.lang.NullPointerException%%''​ 
 + 
 +**Propriété word :**  
 +   
 +**1)** ''​%%Computing Specificites on Political Works and property word 
 +Error while computing specificities:​ org.txm.stat.engine.r.RException:​ ** R error: "Error in lexicaltable[types,​ , drop = FALSE] : subscript out of bounds 
 +
 +while evaluating: SpecifResult3<​-specificities(LexicalTable35,​ Vector38, NULL)%%''​ 
 + 
 +**2)** ''​%%Computing Specificities on subcorpus Leviathan with corpus HOBBES5. Properties: lemma 
 +** R error: "Error in lexiconsToLexicalTable(lexicon,​ sublexicon) :  
 +  type cannot be more frequent in the sublexicon than in the lexicon 
 +
 +while evaluating: SpecifResult2<​-specificities.lexicon.new(Lexicon3,​ Lexicon4) 
 +Error while computing specificities:​ java.lang.NullPointerException 
 +java.lang.NullPointerException%%''​ 
 +  * le calcul des cooccurrences sur le sub-corpus //​Leviathan//​ ne marche pas. La console n’affiche pas de messages 
 +  * la quatrième ligne de la concordance du lemme « God » de l’image ci-dessous renvoie à une page erronée de l’édition anglaise du //De cive//, à savoir à la page 43 (vide) au lieu de la page 42 (table de matières) 
 +{{:​public:​renvoi_errone_au_texte.jpg?​1050}} 
 + 
 +=== Images de fac-simile === 
 + 
 +  * [[http://​diglib.hab.de/​drucke/​sf-4f-5/​start.htm?​image=00013|Leviathan,​ Or The Matter, Forme, & Power Of A Common-Wealth Ecclesiasticall And Civill / Thomas Hobbes. London : Crooke, 1651, p. 13 - (Head) [Herzog August Bibliothek Wolfenbüttel] ]] 
 + 
 +==== Corpus Sanderson ==== 
 + 
 +=== Sanderson 1 === 
 + 
 +Objectifs de la version 1 : 
 +  * utiliser les textes EEBO-TCP 
 + 
 +=== Sanderson 2 === 
 + 
 +Objectifs de la version 2 : 
 +  * utiliser les textes EEBO-TCP lemmatisés par : 
 +    * NWU (MorphAdoner v3.0 - non publique) 
 +    * ou bien lemmatisés par MorphAdoner v2.0 - publique 
 + 
 +=== Sanderson 3 === 
 + 
 +Objectifs de la version 3 : 
 +  * ajouter le texte "ten lectures"​ (encore en page II de EEBO-TCP) 
 + 
 +==== Corpus BibleENG ==== 
 + 
 +=== BibleENG === 
 + 
 +Objectifs de la version 1 : 
 +  * utiliser les bibles early modern English EEBO-TCP : bible de Genêve, bible King James 
 + 
 +==== Corpus BibleLAT ==== 
 + 
 +=== BibleLAT === 
 + 
 +Objectifs de la version 1 : 
 +  * utiliser les bibles EEBO-TCP : bible Vulgate
  
 ==== Corpus Spinoza ==== ==== Corpus Spinoza ====
public/umr_ihrim_hobbes_spinoza.txt · Dernière modification: 2019/02/15 09:34 par slh@ens-lyon.fr