Outils pour utilisateurs

Outils du site


public:chantier_vm_txm_template_v00

Recettes v0.0

Recette v0.1 - retours pages d'accueil

SLH - 09/07/2020

  • page d'accueil du portail
    • lien “ouvrir l'édition” : modifier paramètre CGI ' editions=“default,facs” '
      • MD OK
    • lien “Wikisource” : ajouter ' target=“_blank” '
      • MD OK
    • les deux liens “corpus binaire TXM” de TDM80J ne fonctionnent pas
      • MD OK
    • lien “formation initiale à TXM” : ajouter ' target=“_blank” '
      • MD OK
    • ajouter un titre 2 “Vérification du bon fonctionnement du portail” avant le paragraphe “Vous pouvez vérifier le bon fonctionnement de ces corpus”
      • MD OK
    • ajouter un lien vers https://txm.gitpages.huma-num.fr/textometrie/Documentation/#documentation-pour-ladministrateur-du-logiciel-portail-txm au texte “procédure d’installation d’un portail web TXM”
      • MD OK
  • page d'accueil de TDM80J
    • sauter une ligne avant “Il s'agit de l'édition”
      • MD OK
    • “depuis le site Wikisource” → “du site Wikisource”
      • MD OK
    • modifier le paramètre CGI du lien de “[lire] le texte” en ' editions=“default,facs” '
      • MD OK
    • modifier + remonter “(double-cliquer sur une ligne [de lexique] pour calculer la concordance du mot)” à droite du titre “Lexique”
      • MD OK
    • peut on faire afficher en tooltip ou en zone de message l'URL quand on survole un lien interne ?
      • MD oui l'attribut 'title' focntionne
    • après “lexique des verbes au futur ;” ajouter “lexique des verbes au passé ;”
      • MD OK
    • remonter “adjectifs” après les NOMs
      • MD OK
    • remonter “adverbe” après les VERBs
      • MD OK
    • trouver un autre radical que “.*patri.*”
      • MD OK
    • le lien “télécharger le [corpus binaire]” ne fonctionne pas
      • MD OK
    • lien “TXM pour poste” : ajouter ' target=“_blank” '
      • MD OK
  • styles CSS
    • tous les titres de sections <h[123456]> doivent être en police sans serif
      • MD OK
    • <h1> doit être plus grand que <h2>, etc.
      • MD OK
  • corpus
    • modifier les références de concordances des corpus TDM80J et VOEUX

Recette v0.2 - autres retours VM TXM template

SLH - 10/07/2020

Tests après redémarrage du portail

    Se connecter au portail
    Vérifier la présence des corpus : BROWN, VOEUX, GRAAL, etc
    Lancer la sélection sur le corpus BROWN : Selection dans BROWN
    Lancer un lexique sur le corpus BROWN : Lexique de 'I' dans BROWN

Instructions pour gérer la plateforme :

    Cliquez sur le bouton "Administrer" pour accéder aux outils
    Dans l'onglet "Profils", vous pouvez éditer les profils, les supprimer et en créer de nouveaux
    Dans l'onglet "Utilisateurs", vous pouvez attribuer ou enlever un profil à un utilisateur, importer ou exporter des utilisateurs, changer les informations attachées à un utilisateur
    Dans l'onglet "Bases", vous pouvez charger une base

→ (+ mettre à jour les liens)

Tests après redémarrage du portail

    Se connecter au portail
    Vérifier la présence des corpus : TDM80J, VOEUX
    Lancer la sélection sur le corpus VOEUX : Selection dans VOEUX
    Lancer un index sur le corpus VOEUX : Index de 'France' dans VOEUX

Instructions pour gérer la plateforme :

    Cliquez sur le bouton "Administrer" pour accéder aux outils d'aministration
    Dans l'onglet "Corpus", vous pouvez charger un corpus
    Dans l'onglet "Profils", vous pouvez éditer les profils d'accès, les supprimer et en créer de nouveaux
    Dans l'onglet "Utilisateurs", vous pouvez attribuer ou enlever un profil d'accès à un utilisateur, importer ou exporter des utilisateurs, changer les informations attachées à un utilisateur
    

Recette v0.3 - autres retours VM TXM template

SLH - 21/07/2020

  • splash screen
    • centrer la splash
    • ajouter logo TXM (pour que le portal master puisse mettre son propre logo facilement)
      • MD : j'ai ajouté l'image (images/SplashLogo.png) sous le titre dans un paragraphe (id=SplashLogo)
  • page d'accueil du portail
    • lien “ : ouvrir l’édition” : ouvrir l'édition en mode synoptique
      • MD déjà fait dans la recette 0.1
    • “il vous reste à configurer le portail et à y ajouter vos propres corpus en suivant la « procédure d’installation d’un portail web TXM ».” → utiliser le bon nom du document + lien
  • rafraîchir la page d'Aide
  • post-clonage
    • régler l'adresse de contact dans le script post-clonage
      • MD OK
    • le nom de la machine dans le sujet du mail du lien de contact doit être mis à jour dans le script post-clonage
      • MD quel lien ?
    • fenêtre de connexion
      • “Se connecter à IHRIM” → “Connexion au portail txm-ihrim”
    • le bouton 'Contact' en haut à gauche doit être mis à jour avec la bonne adresse mail de contact
  • pourquoi Anonymous peut faire un sous-corpus+partition+liste des textes dans VOEUX ?
  • accueil TDL80J
    • “lire le texte ;” → “lire le texte, en vue synoptique 'images du fac-similé | édition de la transcription TEI' ;”
      • MD OK
    • “lemmatisé et étiqueté morpho-syntaxiquement” : ajouter lien vers définitions ou jeu d'étiquettes ou notes explicatives
    • indenter noms > noms propres
    • ajouter noms > nom communs après
    • indenter sous-catégories de verbes etc.
    • “d'une combinaison de lemme et de partie du discours : « [frlemma='jeune' & frpos='NOM'] » ou « [frlemma='pouvoir' & frpos='VER.*'] » ;” → “d'une combinaison de lemme et de partie du discours : « [frlemma='pouvoir' & frpos='VER.*'] » ou « [frlemma='pouvoir' & frpos='NOM'] » ;”
  • ajouter un lien vers les sources du corpus + tutoriel import, dans le paragraphe d'introduction
  • ajouter un lien vers TreeTagger
  • “Lexique (double-cliquer sur une ligne pour calculer la concordance du mot)” → “Lexique (double-cliquer sur une ligne pour calculer la concordance d'un mot)”
    • MD OK
  • supprimer les deux “(double-cliquer sur une ligne de concordance pour lire l'occurrence de la séquence en plein texte dans l'édition)” en trop
  • “calculer la fréquence du mot « jour » ;” → “calculer la fréquence du mot « jour » (son nombre d'apparitions) ;”
    • MD OK
  • “lister les réalisations du radical .*patri.* ;” → trouver un autre radical
  • inverser “lister ce qui est français (index de [frpos='NOM'] [word='français.*']) ;” et “… anglais”
    • MD OK
  • “lister les séquences de mots comprenant des insertions ou des discontinuités (index de [word='mon|ma|mes'%c] []? [frpos='NOM']) ;” → “lister des séquences de mots comprenant des insertions ou des discontinuités (index de [word='mon|ma|mes'%c] []? [frpos='NOM']) ;”
    • MD OK
  • “télécharger le corpus binaire à utiliser dans l'application TXM pour poste” → “télécharger le corpus binaire, à utiliser dans l'application TXM pour poste”
    • MD OK
  • pied de page :
    Copyright © 2020 Serge Heiden. Licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported
    
    Veuillez nous contacter pour plus d’informations.
    • MD OK
  • édition TDM80J
    • ordre 'fac-similé | transcription'
      • MD ça semble ne pas fonctionner #2886

Recette v0.4 - autres retours VM TXM template

SLH - 30/08/2020

Recette v0.5 - autres retours VM TXM template

BP - 19/10/2020

accueil du portail

  • Le texte de la page est un peu plus large que ma fenêtre plein écran (4:3), et j'ai donc un ascenseur horizontal pour voir en gros le dernier mot de chaque ligne : je ne sais pas si c'est normal ni si on peut faire autrement (ajustement automatique du texte à la largeur de l'affichage ?).
    • SLH MD : solution ?
      • AL : Pour .textzone, il faut remplacer width:100% par width:94% car il y a padding de 3% de chaque côté.
        • SLH OK
  • pour tous les liens commande, pas d'accès à “ouvrir dans un nouvel onglet”. Idéalement, ce serait super d'expliciter que le lien ouvre un nouvel onglet *dans TXM* ? (mais à vrai dire je crains que ce ne soit compliqué, je ne vois pas bien comment faire).
    • SLH ???
  • avoir la description de la manière de construire la même sortie (notamment nom/icone de la commande utilisée ?)
    • SLH icone : assez lourd à mettre en oeuvre
    • SLH nom de commande en flyover ? (déjà le cas)
    • AL Ce n'est pas trop compliqué d'afficher l'icone (cf. le livre sur la page d'accueil du portail BFM), à voir si ça vaut le coup…
      • SLH lourd (visuellement), pas compliqué → j'ai mis des icones dans la page d'accueil du portail et de TDM80J. Je ferai VOEUX si c'est OK
  • La description générale de VOEUX ne semble pas à jour, si on interroge le corpus on trouve des informations différentes :
    • “de 1959 à 2009” → 2012
      • SLH OK, mis à jour les accueils de corpus et synchronisé avec la page d'accueil du portail
    • “54 716 mots” → 61 143 mots et ponctuations (commande Dimensions)
      • SLH OK
    • “51 discours” → 54 (commande Dimensions)
      • SLH OK
  • (Pour TDM80J ce n'est pas complètement clair non plus :
    • “71 927 mots”
      • SLH OK
    • Nombre de mots et de ponctuations (T): 85 130
    • INDEX de [word!=“\p{P}+”] : 71185 occurrences
    • Bon je pense donc que le décompte des mots doit être à jour mais simplement qu'on n'a pas la requête définissant ce qu'on appelle mot.)
      • SLH ces décomptes variés étaient le résultat de l'histoire de ces pages d'accueil, des versions de ces corpus, etc.
      • SLH j'utilise désormais systématiquement le calcul des Dimensions du portail pour les deux corpus
  • TreeTagger : préciser le modèle de langue utilisé ? par ex. “avec le modèle de langue général pour le français (“French parameter file” sur la page de TreeTagger).”
    • SLH est-ce vraiment nécessaire ?
  • Est-ce que le lien contact est implémenté de telle sorte qu'il n'expose pas l'adresse textometrie ? (Je n'ai aucune idée de la réponse, c'est juste une question que je me pose.)
    • SLH Normalement oui : demander confirmation à Matthieu
    • AL Non, l'adresse est en clair sur la page JSP. Pour info, sur le portail BFM, je pointe vers la page SPIP de contact.
      • SLH : @MD pourquoi utiliser un lien mailto au lieu de code interne récupérant l'adresse dans la configuration du portail ?

accueil du corpus TDM80J

  • Quand le calcul d'un Lexique passe par la commande Index, je pense que cela aiderait de l'indiquer.
    • SLH ajouté pour le premier : (tous les lexiques suivants sont calculés à partir de la commande Index)
  • Si les noms désignent les noms communs, alors les noms propres sont frères pas fils.
    • SLH OK : précisé nom commun et retiré indentation
  • Pour les différentes extractions par partie du discours, il est très souvent intéressant de prendre le lemme comme propriété d'analyse et d'affichage, mais j'imagine que ce réglage de paramètre n'est peut-être pas possible avec ce mécanisme d'appel de la commande par hyperlien ?
  • Si cela était possible et qu'on l'introduise, il faudrait trouver des reformulation pour désigner ces nouveaux résultats, par exemple dans le cas des verbes au conditionnel :
  • lexiques des verbes au conditionnel : formes apparaissant dans le texte, regroupement par verbe.
    • SLH comme il s'agit de formes pour l'instant, et que ça ferait très lourd de formuler un “formes apparaissant dans le texte, ” pour toutes ces commandes, je propose de laisser tel quel pour l'instant
  • concordance de plusieurs mots ou séquences de mots
    → un peu ambigu. Peut-être plutôt :
    • de différents mots (A OU B)
      • SLH de plusieurs mots ou séquences de mots → d'une séquence de deux mots ou d'un mot particulier
  • d'un préfixe : “voyag.*”
    → d'un début de mot, d'un mot tronqué, d'un mot sans la terminaison
    → (ou bien mettre un élément qui est vraiment un préfixe, mais ça ne sera pas parfait, et c'est moins approprié à un exemple en concordance.)
    • SLH OK, “début de mot”
  • Le langage CQL semble accepter simple et double quote dans le portail, alors qu'il ne gère que les doubles dans la version bureau. Ici on utilise les simples dans le portail pour des raisons techniques des liens hypertextes ? (Sinon on pourrait préférer donner des exemples avec les doubles qui sont plus “universels”.)
    • SLH je ne sais pas : c'est intéressant, il faudrait faire un ticket pour clarifier pourquoi on n'a pas '…' dans la version pour poste
    • SLH il y a la difficulté pour les liens internes de devoir gérer systématiquement un double niveau de délimitation de chaines dans ces pages web :
      • niveau 1 : valeur d'attribut XML
      • niveau 2 : valeur de propriété CQL
    • SLH j'ai inversé tous les ' par un “ dans les 30 requêtes et exemples de TDM80J et les 26 de VOEUX → vérifier qu'il n'y a pas d'erreur
  • [frlemma='jeune' & frpos='NOM']
  • → pas cet exemple car il ne montre que des erreurs, cela va plus troubler qu'aider.
    • SLH OK retiré
  • [frlemma='pouvoir' & frpos='VER.*']
    → le verbe ne montre pas bien l'effet de la conjonction de conditions ; le nom ne donne pas un résultat convainquant.
  • L'exemple avec “devoir” (de préférence nom) marche mieux, et on voit mieux l'effet en ciblant le nom :
  • [frlemma='devoir' & frpos='NOM']
    • SLH OK, remplacé
  • [word='pays|nation'] [frpos='ADJ']
    → j'enlèverais nation
    • SLH OK retiré nation
  • [frlemma='air' & frpos='NOM'] [frpos='ADJ']
    → j'enlèverais & frpos='NOM'
    • SLH OK retiré & frpos='NOM'
  • [frlemma=“ne”] [frpos=“VER.*”]
    • mettre la requête vraiment utilisée :
      • [frlemma='ne'] [frpos='VER.*' & frlemma!='avoir|être']
    • en même temps c'est un exemple complexe (car il reste “suis”, “sommes” pour lesquels il faudrait une requête plus complexe :
      • [frlemma='ne'] [frpos='VER.*' & frlemma!='avoir|((suivre|sommer)\|)?être']
    • voire encore plus complexe pour attraper les verbes par delà les clitiques etc.
    • On peut aussi ne pas mettre cet exemple.
    • Ou assumer une requête un peu simpliste mais claire :
      • [frlemma=“ne”] [frpos=“VER.*”]
    • SLH OK supprimé l'exemple
  • insertions ou discontinuités
    • l'exemple des deux parties de la négation serait plus attendu et plus productif :
      • [frlemma=“ne”][]{1,3}[frlemma=“pas”]
    • SLH OK remplacé par [frlemma=“ne”][frlemma!=“pas”]{1,3}[frlemma=“pas”]

accueil du corpus VOEUX

  • “61.102 mots” : commande Propriétés :
    • Nombre de mots et de ponctuations (T): 61 143
    • Il y a sans doute une mise à jour à faire, car je ne vois pas comment on trouverait si peu de ponctuations ?
    • SLH OK
  • lire directement le discours de 1968 de De Gaulle ;
    → …le début : lire directement *le début du* discours de 1968 de De Gaulle
    • SLH OK ajouté “le début du”
  • Mêmes remarques que sur TDM80J pour les différents index (désignation, propriété d'affichage, etc.)
  • d'une disjonction
    → je rajouterais :
    • (mot A OU mot B)
    • ou (A OU B)
    • ou (OU)
    • SLH OK
  • combinaison lemme et POS :
    → je ne mettrais pas l'exemple jeune & NOM car il y a une erreur d'étiquetage dès la première ligne : c'est intéressant dans le cadre d'un cours, où l'on peut expliquer, mais là ça peut être déstabilisant.
    • SLH OK supprimé
  • “lister sur quels verbes portent principalement les négations (index de [frlemma=“ne”] [frpos=“VER.*”])“
    → garder la même requête entre l'ancrage du lien et le calcul lancé
  • Ca peut être plus simple de ne pas gérer les cas de avoir et être, car si on s'en occupe de façon simple (comme c'est fait actuellement) il reste “ne sommes” en bonne place (4e ligne).
  • Même suggestion que TDM80J pour l'exemple sur les discontinuités :
  • [frlemma=“ne”][]{1,3}[frlemma=“pas”]
    • SLH OK, remplacé par l'exemple ne … pas
  • Sous-corpus : j'ai l'impression que le compte demo (avec mdp demo) n'est pas disponible sur MACHINE, du coup les exemples ne marchent pas ?
    • SLH Supprimé la mention du compte demo
    • SLH Il faut configurer la VM TXM pour qu'Anonymous ai accès à ces deux sous-corpus
public/chantier_vm_txm_template_v00.txt · Dernière modification: 2020/10/20 17:59 par slh@ens-lyon.fr