Outils pour utilisateurs

Outils du site


public:umr_ihrim_hobbes_spinoza

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:umr_ihrim_hobbes_spinoza [2018/11/20 17:10]
francesca.rebasti@gmail.com
public:umr_ihrim_hobbes_spinoza [2019/02/15 09:34] (Version actuelle)
slh@ens-lyon.fr
Ligne 15: Ligne 15:
 Les projets ont un répertoire dédié dans Sharedocs : [[https://​sharedocs.huma-num.fr/#/​634/​5640/​Partage%20de%20Sources%20Textuelles%20(PST)]] (accès restreint) Les projets ont un répertoire dédié dans Sharedocs : [[https://​sharedocs.huma-num.fr/#/​634/​5640/​Partage%20de%20Sources%20Textuelles%20(PST)]] (accès restreint)
  
-==== Corpus ​Hobbes ====+==== projet Digital Theological ​Hobbes ====
  
-Les versions successives des sources du corpus sont hébergées dans sharedocs : [[https://​sharedocs.huma-num.fr/#/​634/​5640/​Partage%20de%20Sources%20Textuelles%20(PST)/​Hobbes/​Corpus%20Complet/​src]] (accès restreint) +  * [[public:projet_ihrim_dth|page de suivi du projet DTH]]
- +
-=== Hobbes 4 === +
- +
-Objectifs de la version 4 : +
-  * intégrer la deuxième partie des Elements (texte EEBO-TCP supplémentaire) dans la première +
- +
-Remarques sur la v4 : +
-  * finalement les Elements sont composés du frontispice de la deuxième partie suivi de la première partie, suivi de la deuxième partie -> erreur +
- +
-=== Hobbes 5 === +
- +
-Objectifs de la version 5 : +
-  * corriger l'​ordre et le frontispice utilisé dans les Elements +
-  * utiliser les textes lemmatisés par NWU (MorphAdoner v3.0 - non publique) +
-  * afficher les diagrammes de spécificité et les partitions dans l'​ordre chronologique des textes. Solution temporaire : renommer les identifiants de textes avec un préfixe alphanumérique +
- +
-Remarques sur la v5.0 : +
-  * **OK** ordre des textes dans Elements : les Elements sont maintenant composés du frontispice (contenu de l'​élément <​front>​) de la première partie suivi de la première partie, suivi de la deuxième partie +
-  * **OK** la ponctuation a disparu : (les ponctuations sont devenues des mots et j'ai créé une nouvelle catégorie '​p'​ qui n'​existe pas dans NUPOS - voir la nouvelle XSL '​convert-pc-to-w.xsl'​) +
-  * références : +
-    * **OK** les identifiants de texte dans les références ne sont pas corrects : (corrigé text@id) +
-    * **OK** certaines références ont perdu leur n° de page, paragraphe ou chapitre : ceci est du au fait que les éléments ne sont pas numérotés systématiquement avec @n (il n'y a donc des @n que de temps en temps) : (forcé la numérotation de tous les éléments, pour qu'​elle soit disponible pour la construction des ref et reffull) +
-    * **OK** certains retour au texte ne fonctionnent plus : (forcé tous les IDs de W et PC avec la macro ForceWordIDs et converti les PC en W) +
-  * **OK** les identifiants de texte dans les éditions ne sont pas corrects (corrigé text@id) +
-  * il faudrait passer les passages en latin du frontispice des //​Éléments//​ dans le plan 'hors texte à éditer' ​  +
-  * il faut comprendre pourquoi une partie du texte (compris dans la balise <hi>) n’est plus en italique et corriger l’affichage de l’édition +
-  * il faudrait passer les notes de Hobbes dans un nouveau plan 'notes à indexer'​ +
-  * il faut intégrer les //​marginalia//​ de Hobbes dans l’édition (mais, contrairement à la v4.0, en marge et pas dans le texte) et dans les calculs statistiques +
-  * il faut corriger la numérotation et, éventuellement,​ la structuration des parties, des chapitres et des paragraphes des textes (y compris le //​Léviathan//​) de manière à afficher correctement les références et à créer des sub-corpus et des partitions plus fins. Il faudra modifier ref et fullref en conséquence +
-  * les liens vers les images de facsimilés du //​Léviathan//​ sont absents (il faut les recoder) +
- +
-**Problèmes issus de requêtes spécifiques :** +
-  * une comparaison avec l’index hiérarchique des lemmes de substantifs du corpus Hobbes 4 a révélé la présence d’erreurs même dans la lemmatisation du corpus Hobbes 5 (voir la première image). Des formes graphiques avec des majuscules du lemme « God » n’ont pas été reconnues comme telles sans la neutralisation de la casse (voir la deuxième image)  +
-{{:public:lemme_god_h3_et_5.jpg?​1050}} +
- +
-{{:​public:​formes_graphiques_du_lemme_god.jpg?​1050}} +
-  * quand on affiche les dimensions de la partition du //​Léviathan//​ par chapitre, les chapitres n’apparaissent pas dans l’ordre croissant +
-{{:​public:​07_dimension_des_chapitres_du_leviathan.jpg?​1050}} +
- +
-**Bugs :** +
-  * quand on crée une partition (voir la première image) ou un sub-corpus (par exemple, du //​Léviathan//​),​ TXM génère plus fichiers que prévu (voir la deuxième et la troisième image), même si on redémarre TXM avant de lancer la commande. On a l’impression que TXM se rappelle des requêtes précédentes et propose des résultats mélangés. +
-  {{:​public:​partition_political_works.jpg?​400}} {{:​public:​resultats_de_la_partition.jpg?​200}} {{:​public:​resultat_du_sub-corpus.jpg?​200}} +
- +
-  * quand on lance le calcul de spécificité sur la partition //Political Works// ou sur le sub-corpus //​Leviathan//,​ la console affiche les messages suivants : +
-**Propriété lemme :**  +
- +
-**1)** ''​%%Computing Specificites on Political Works and property lemma +
-Error while computing specificities:​ org.txm.stat.engine.r.RException:​ ** R error: "Error in lexicaltable[types,​ , drop = FALSE] : subscript out of bounds +
-+
-while evaluating: SpecifResult2<​-specificities(LexicalTable31,​ Vector34, NULL)%%''​  +
- +
-**2)** ''​%%Computing Specificities on subcorpus Leviathan with corpus HOBBES5. Properties: lemma +
-** R error: "Error in lexiconsToLexicalTable(lexicon,​ sublexicon) :  +
-  type cannot be more frequent in the sublexicon than in the lexicon +
-+
-while evaluating: SpecifResult1<​-specificities.lexicon.new(Lexicon1,​ Lexicon2) +
-Error while computing specificities:​ java.lang.NullPointerException +
-java.lang.NullPointerException%%''​ +
- +
-**Propriété word :**  +
-   +
-**1)** ''​%%Computing Specificites on Political Works and property word +
-Error while computing specificities:​ org.txm.stat.engine.r.RException:​ ** R error: "Error in lexicaltable[types,​ , drop = FALSE] : subscript out of bounds +
-+
-while evaluating: SpecifResult3<​-specificities(LexicalTable35,​ Vector38, NULL)%%''​ +
- +
-**2)** ''​%%Computing Specificities on subcorpus Leviathan with corpus HOBBES5. Properties: lemma +
-** R error: "Error in lexiconsToLexicalTable(lexicon,​ sublexicon) :  +
-  type cannot be more frequent in the sublexicon than in the lexicon +
-+
-while evaluating: SpecifResult2<​-specificities.lexicon.new(Lexicon3,​ Lexicon4) +
-Error while computing specificities:​ java.lang.NullPointerException +
-java.lang.NullPointerException%%''​ +
-  * le calcul des cooccurrences sur le sub-corpus //​Leviathan//​ ne marche pas. La console n’affiche pas de messages +
-  * la quatrième ligne de la concordance du lemme « God » de l’image ci-dessous renvoie à une page erronée ​de l’édition anglaise ​du //De cive//, à savoir à la page 43 (vide) au lieu de la page 42 (table de matières) +
-{{:​public:​renvoi_errone_au_texte.jpg?​1050}} +
- +
-=== Images de fac-simile === +
- +
-  * [[http://​diglib.hab.de/​drucke/​sf-4f-5/​start.htm?​image=00013|Leviathan,​ Or The Matter, Forme, & Power Of A Common-Wealth Ecclesiasticall And Civill / Thomas Hobbes. London : Crooke, 1651, p. 13 - (Head) [Herzog August Bibliothek Wolfenbüttel] ]+
- +
-==== Corpus Sanderson ==== +
- +
-=== Sanderson 1 === +
- +
-Objectifs de la version 1 : +
-  * utiliser les textes EEBO-TCP +
- +
-=== Sanderson 2 === +
- +
-Objectifs de la version 2 : +
-  * utiliser les textes EEBO-TCP lemmatisés par : +
-    * NWU (MorphAdoner v3.0 - non publique) +
-    * ou bien lemmatisés par MorphAdoner v2.0 - publique +
- +
-=== Sanderson 3 === +
- +
-Objectifs de la version 3 : +
-  * ajouter le texte "ten lectures"​ (encore en page II de EEBO-TCP) +
- +
-==== Corpus BibleENG ==== +
- +
-=== BibleENG === +
- +
-Objectifs de la version 1 : +
-  * utiliser les bibles early modern English EEBO-TCP : bible de Genêve, bible King James +
- +
-==== Corpus BibleLAT ==== +
- +
-=== BibleLAT === +
- +
-Objectifs de la version 1 : +
-  * utiliser les bibles EEBO-TCP : bible Vulgate+
  
 ==== Corpus Spinoza ==== ==== Corpus Spinoza ====
public/umr_ihrim_hobbes_spinoza.txt · Dernière modification: 2019/02/15 09:34 par slh@ens-lyon.fr