Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:umr_ihrim_hobbes_spinoza [2018/11/20 17:10]
francesca.rebasti@gmail.com
public:umr_ihrim_hobbes_spinoza [2019/02/15 09:34] (version actuelle)
slh@ens-lyon.fr
Ligne 15: Ligne 15:
Les projets ont un répertoire dédié dans Sharedocs : [[https://sharedocs.huma-num.fr/#/634/5640/Partage%20de%20Sources%20Textuelles%20(PST)]] (accès restreint) Les projets ont un répertoire dédié dans Sharedocs : [[https://sharedocs.huma-num.fr/#/634/5640/Partage%20de%20Sources%20Textuelles%20(PST)]] (accès restreint)
-==== Corpus Hobbes ====+==== projet Digital Theological Hobbes ====
-Les versions successives des sources du corpus sont hébergées dans sharedocs : [[https://sharedocs.huma-num.fr/#/634/5640/Partage%20de%20Sources%20Textuelles%20(PST)/Hobbes/Corpus%20Complet/src]] (accès restreint) +  * [[public:projet_ihrim_dth|page de suivi du projet DTH]]
- +
-=== Hobbes 4 === +
- +
-Objectifs de la version 4 : +
-  * intégrer la deuxième partie des Elements (texte EEBO-TCP supplémentaire) dans la première +
- +
-Remarques sur la v4 : +
-  * finalement les Elements sont composés du frontispice de la deuxième partie suivi de la première partie, suivi de la deuxième partie -> erreur +
- +
-=== Hobbes 5 === +
- +
-Objectifs de la version 5 : +
-  * corriger l'ordre et le frontispice utilisé dans les Elements +
-  * utiliser les textes lemmatisés par NWU (MorphAdoner v3.0 - non publique) +
-  * afficher les diagrammes de spécificité et les partitions dans l'ordre chronologique des textes. Solution temporaire : renommer les identifiants de textes avec un préfixe alphanumérique +
- +
-Remarques sur la v5.0 : +
-  * **OK** ordre des textes dans Elements : les Elements sont maintenant composés du frontispice (contenu de l'élément <front>) de la première partie suivi de la première partie, suivi de la deuxième partie +
-  * **OK** la ponctuation a disparu : (les ponctuations sont devenues des mots et j'ai créé une nouvelle catégorie 'p' qui n'existe pas dans NUPOS - voir la nouvelle XSL 'convert-pc-to-w.xsl') +
-  * références : +
-    * **OK** les identifiants de texte dans les références ne sont pas corrects : (corrigé text@id) +
-    * **OK** certaines références ont perdu leur n° de page, paragraphe ou chapitre : ceci est du au fait que les éléments ne sont pas numérotés systématiquement avec @n (il n'y a donc des @n que de temps en temps) : (forcé la numérotation de tous les éléments, pour qu'elle soit disponible pour la construction des ref et reffull) +
-    * **OK** certains retour au texte ne fonctionnent plus : (forcé tous les IDs de W et PC avec la macro ForceWordIDs et converti les PC en W) +
-  * **OK** les identifiants de texte dans les éditions ne sont pas corrects (corrigé text@id) +
-  * il faudrait passer les passages en latin du frontispice des //Éléments// dans le plan 'hors texte à éditer'   +
-  * il faut comprendre pourquoi une partie du texte (compris dans la balise <hi>) n’est plus en italique et corriger l’affichage de l’édition +
-  * il faudrait passer les notes de Hobbes dans un nouveau plan 'notes à indexer' +
-  * il faut intégrer les //marginalia// de Hobbes dans l’édition (mais, contrairement à la v4.0, en marge et pas dans le texte) et dans les calculs statistiques +
-  * il faut corriger la numérotation et, éventuellement, la structuration des parties, des chapitres et des paragraphes des textes (y compris le //Léviathan//) de manière à afficher correctement les références et à créer des sub-corpus et des partitions plus fins. Il faudra modifier ref et fullref en conséquence +
-  * les liens vers les images de facsimilés du //Léviathan// sont absents (il faut les recoder) +
- +
-**Problèmes issus de requêtes spécifiques :** +
-  * une comparaison avec l’index hiérarchique des lemmes de substantifs du corpus Hobbes 4 a révélé la présence d’erreurs même dans la lemmatisation du corpus Hobbes 5 (voir la première image). Des formes graphiques avec des majuscules du lemme « God » n’ont pas été reconnues comme telles sans la neutralisation de la casse (voir la deuxième image)  +
-{{:public:lemme_god_h3_et_5.jpg?1050}} +
- +
-{{:public:formes_graphiques_du_lemme_god.jpg?1050}} +
-  * quand on affiche les dimensions de la partition du //Léviathan// par chapitre, les chapitres n’apparaissent pas dans l’ordre croissant +
-{{:public:07_dimension_des_chapitres_du_leviathan.jpg?1050}} +
- +
-**Bugs :** +
-  * quand on crée une partition (voir la première image) ou un sub-corpus (par exemple, du //Léviathan//), TXM génère plus fichiers que prévu (voir la deuxième et la troisième image), même si on redémarre TXM avant de lancer la commande. On a l’impression que TXM se rappelle des requêtes précédentes et propose des résultats mélangés. +
-  {{:public:partition_political_works.jpg?400}} {{:public:resultats_de_la_partition.jpg?200}} {{:public:resultat_du_sub-corpus.jpg?200}} +
- +
-  * quand on lance le calcul de spécificité sur la partition //Political Works// ou sur le sub-corpus //Leviathan//, la console affiche les messages suivants : +
-**Propriété lemme :**  +
- +
-**1)** ''%%Computing Specificites on Political Works and property lemma +
-Error while computing specificities: org.txm.stat.engine.r.RException: ** R error: "Error in lexicaltable[types, , drop = FALSE] : subscript out of bounds +
-+
-while evaluating: SpecifResult2<-specificities(LexicalTable31, Vector34, NULL)%%''  +
- +
-**2)** ''%%Computing Specificities on subcorpus Leviathan with corpus HOBBES5. Properties: lemma +
-** R error: "Error in lexiconsToLexicalTable(lexicon, sublexicon) :  +
-  type cannot be more frequent in the sublexicon than in the lexicon +
-+
-while evaluating: SpecifResult1<-specificities.lexicon.new(Lexicon1, Lexicon2) +
-Error while computing specificities: java.lang.NullPointerException +
-java.lang.NullPointerException%%'' +
- +
-**Propriété word :**  +
-   +
-**1)** ''%%Computing Specificites on Political Works and property word +
-Error while computing specificities: org.txm.stat.engine.r.RException: ** R error: "Error in lexicaltable[types, , drop = FALSE] : subscript out of bounds +
-+
-while evaluating: SpecifResult3<-specificities(LexicalTable35, Vector38, NULL)%%'' +
- +
-**2)** ''%%Computing Specificities on subcorpus Leviathan with corpus HOBBES5. Properties: lemma +
-** R error: "Error in lexiconsToLexicalTable(lexicon, sublexicon) :  +
-  type cannot be more frequent in the sublexicon than in the lexicon +
-+
-while evaluating: SpecifResult2<-specificities.lexicon.new(Lexicon3, Lexicon4) +
-Error while computing specificities: java.lang.NullPointerException +
-java.lang.NullPointerException%%'' +
-  * le calcul des cooccurrences sur le sub-corpus //Leviathan// ne marche pas. La console n’affiche pas de messages +
-  * la quatrième ligne de la concordance du lemme « God » de l’image ci-dessous renvoie à une page erronée de l’édition anglaise du //De cive//, à savoir à la page 43 (vide) au lieu de la page 42 (table de matières) +
-{{:public:renvoi_errone_au_texte.jpg?1050}} +
- +
-=== Images de fac-simile === +
- +
-  * [[http://diglib.hab.de/drucke/sf-4f-5/start.htm?image=00013|Leviathan, Or The Matter, Forme, & Power Of A Common-Wealth Ecclesiasticall And Civill / Thomas Hobbes. London : Crooke, 1651, p. 13 - (Head) [Herzog August Bibliothek Wolfenbüttel] ]+
- +
-==== Corpus Sanderson ==== +
- +
-=== Sanderson 1 === +
- +
-Objectifs de la version 1 : +
-  * utiliser les textes EEBO-TCP +
- +
-=== Sanderson 2 === +
- +
-Objectifs de la version 2 : +
-  * utiliser les textes EEBO-TCP lemmatisés par : +
-    * NWU (MorphAdoner v3.0 - non publique) +
-    * ou bien lemmatisés par MorphAdoner v2.0 - publique +
- +
-=== Sanderson 3 === +
- +
-Objectifs de la version 3 : +
-  * ajouter le texte "ten lectures" (encore en page II de EEBO-TCP) +
- +
-==== Corpus BibleENG ==== +
- +
-=== BibleENG === +
- +
-Objectifs de la version 1 : +
-  * utiliser les bibles early modern English EEBO-TCP : bible de Genêve, bible King James +
- +
-==== Corpus BibleLAT ==== +
- +
-=== BibleLAT === +
- +
-Objectifs de la version 1 : +
-  * utiliser les bibles EEBO-TCP : bible Vulgate+
==== Corpus Spinoza ==== ==== Corpus Spinoza ====
public/umr_ihrim_hobbes_spinoza.txt · Dernière modification: 2019/02/15 09:34 par slh@ens-lyon.fr