Outils pour utilisateurs

Outils du site


public:retours_de_bugs_web:txmweb_0.6.3beta1

Retours Portail 0.6.3 alpha

Cette page contient les discussions et les retours de bugs du portail TXM 0.6.3.

Le portail TXM 0.6.3 est défini par la Cible de tickets Portail 0.6.3.

Méthode

Merci d'ajouter vos initiales, le numéro de version testée et la date des tests dans la section Testeurs après les descriptions de recettes ci-dessous.

Merci d'ajouter vos retours dans les sections thématiques, ou dans de nouvelles sections, situées après la section Testeurs.

Vous pouvez vous inspirer des pages de retours de TXM 0.8.1 beta et TXM 0.8.1 alpha pour le format de vos retours.

Les sections thématiques pointent sur différents tickets spécifiques.

Pour information, la liste des bugs non résolus, c'est-à-dire que cette version ne cherche pas à résoudre, se trouve ici : known-bugs (bugs connus). Les autres bugs ou développement prévus sont listés dans les Tickets du portail

Testeurs

SJ: comparaison avec TXM 0.8.1 (2020-06-29 09h05). Date des tests : juin 2021.

Les comparaisons de tableaux de résultats sont faites entre les données récupérées depuis l'UI de la RCP (TXM pour poste) via copier/coller (vers fichier) et les données récupérées directement dans un fichier depuis la fonction Export du Portail (UI RCP ↔ Export Portail sans vérification des tableaux UI).

Les données sont traitées dans Calc pour tri, suppression de colonne vide, ajout/suppression des entêtes, etc. pour ensuite être vérifiées à l'oeil dans Calc ou copiées/collées dans 2 fichiers TXT (RCP/Portail) pour exécution d'un diff.

Commandes

Lexique

SJ :

  • Comparaison des résultats : tri sur fréquences décroissantes :
    • commande diff via WinMerge (fichiers TXT avec tabulations) : aucune différence trouvée sur les 6406 lignes

Index

  • [VL, 15/07] : BUG, dans VOEUX, l'Index ne s'affiche pas
    • [SLH, 15/07] : l'index de “l.*” indique “0 forme (5691 occurrences) - In 787 msec”
    • [MD, 16/07] : c'est corrigé OK
  • [VL, 15/07] : BUG, pas d’assistant de requête
    • [MD, 16/07] : c'est maintenant disponible OK

Concordances

  • [VL, 15/07] : BUG, corpus VOEUX, la propriété d'affichage par défaut est 'frlemma'
    • [MD, 16/07] : c'est sûrement un réglage de test du corpus VOEUX que j'avais fais. Cela ne devrait pas se reproduire dans le portail DTEPS
  • [VL, 15/07] : BUG, corpus VOEUX, pas de tri par contexte gauche ou droit
    • [MD, 16/07] : le tri en concordance n'est accessible que depuis le panneau des réglages
  • [VL, 15/07] : BUG, pas d’assistant de requête
    • [MD, 16/07] : OK c'était une fausse alerte

Contextes

  • [VL, 15/07] : BUG, corpus VOEUX, la propriété d'affichage par défaut est 'frlemma'
    • [MD, 16/07] : c'est sûrement un réglage de test du corpus VOEUX que j'avais fais. Cela ne devrait pas se reproduire dans le portail DTEPS
  • [VL, 15/07] : OK, assistant de requête
  • Changer la taille des contextes par défaut de la commande contextes
    • [SLH, 15/07] : ???
    • [SJ: 19/07] : je pense que c'était un réglage de test ici aussi qui montrait qu'on pouvait interdire l'accès à un empan supérieur à une taille choisie via une préférence sur les droits d'accès au texte. Les empans des commandes Contexte et Concordance sont bien maintenant de -8 + 12, comme dans la RCP

Edition

  • [SJ, 19/07] : j'ai regardé vraiment très rapidement, juste ça semblerait pas mal que le bouton “page suivante” ne bloque pas au texte courant mais passe au texte suivant après la dernière page du texte courant, comme dans la RCP

Table lexicale

SJ :

  • la commande “Table lexicale” n'est pas présente sur le Portail

Sous-corpus par Textes

  • [VT, 15/07] : QUESTION, dans la fenêtre de dialogue « Finalisation de la sélection », je suppose que le premier choix « Afficher le récapitulatif dans un onglet ? » est en discussion. Est-ce que les discussions portent sur la pertinence de la fonctionnalité ? Besoin d'avis? Nb :Si maintenu, supprimer point d’interrogation.
    • [SLH, 15/07] : RÉPONSE, si tu coches cette option, un récapitulatif est affiché dans un nouvel onglet → ce n'est pas en discussion
      → OK pour supprimer le '?'
      → par contre on n'est pas sensés empêcher la création de sous-corpus pour le cours ?
    • [MD, 16/07] : c'est corrigé OK

Tableaux

Comportement des tableaux, d'une manière générale.

SJ :

  • Portail : les entêtes de colonnes apparaissent souvent tronquées, il ne semble pas y avoir de calcul automatique de la largeur des colonnes en fonction de l'entête (mais peut-être en fonction du contenu de la colonne ?)
    • MD tout à fait la largeur ne dépend pas de l'entête
  • Portail : les lignes sont sélectionnables dans les résultats de type tableau mais ne sont pas copiables par un CTRL + C ou par menu contextuel
    • MD : je pense que la sélection a été activée pour les concordances
      • SJ : apparemment non
        • MD après discussion avec Seb, c'est bon la sélection des caractères fonctionne, il n'y pas de menu contextuel pour copier une ou plusieurs lignes

Description de corpus / Dimensions de corpus

SJ :

  • comme leur nom l'indique, la commande “Description” (RCP) est plus aboutie que la commande “Dimensions” (Portail)
  • les propriétés et structures utilitaires ont été supprimées de la RCP mais sont présentes dans le Portail
  • la commande RCP ne contient pas le nombre de textes
  • la commande Portail ne contient pas les valeurs des propriétés de mot et de structure
  • la commande RCP annonce “Nombre de mots” alors que la commande Portail annonce “Nombre de mots et de ponctuations (T)”
  • les propriétés et structures décomptées semblent similaires bien que l'on ne puisse pas le vérifier complètement à cause de la différence de prise en compte des entités utilitaires
  • Portail : sur le sous-corpus “DG”, le nombre de textes annoncé est égal à zéro ce qui semble être un bug

Calculs statistiques

Les tests se font sur les sous-corpus et partitions déjà préparés :

  • le corpus VOEUX de TXM 0.8.1 et la versions downgradé de 0.8.1 à 0.7.9 du portail test
  • le sous-corpus VOEUX/DG
  • la partition VOEUX/locs

Cooccurrences

  • [SLH, 19/07]
    • BUG, les résultats ne sont pas triés par défaut (trié par indice par défaut dans la RCP)
    • LANG, 'score' → 'indice'
    • MD j'ai maj le ticket correspondant #3119

Bugs connus :

  • calcul des distances et empans corrigés dans TXM 0.8.1 : #2662

Différences connues :

  • BP (Mattermost) : de mémoire il y avait eu une révision en profondeur du calcul à l'occasion de TXM 0.8.1, il me semble qu'on en a des traces dans le wiki txm-info, ici par exemple : https://groupes.renater.fr/wiki/txm-info/public/specs_cooccurence
  • BP (Mattermost) : Le décompte même de la fréquence des cooccurrents n'est pas le même, avec la gestion des cas où une même occurrence pourrait être comptabilisée plusieurs fois ou non, où il y a plusieurs cooccurrents dans un même contexte, etc. etc.
  • BP (Mattermost) : Bref le calcul a beaucoup bougé

Vérifier pour le corpus VOEUX et VOEUX/DG les résultats exportés (Le bouton “Exporter” ouvre un onglet, il faut enregistrer le fichier si l'encodage utilisé par le navigateur n'est pas le bon)

  • les tris
  • les filtres
  • les co-fréquences
  • les distances
  • les indices de spécificités

Le format de l'export est celui de la Cooccurrence de la Toolbox 0.7.9 :

SJ : VOEUX

Différence notable : la RCP ne génère pas de score/indice négatif.

  • MD oui, la RCP n'affiche pas les cooc négatifs ce qui est le bon comportement

Première question : comment régler les empans pour qu'ils soient équivalents sur la RCP et le Portail ?

J'ai l'impression qu'en mettant “-9 +9” dans la RCP, cela correspond à “-10 +10” dans le Portail ?

  • MD oui c'est tout à fait possible, il y avait eu une discussion sur la distance, la RCP a raison
  • SLH : difficile de répondre. Le bug #2662 de la RCP mentionne une correction de distance à droite mais on ne sait pas si ça impacte le calcul des fenêtres de cooccurrence (et donc des cooccurrents potentiels) ou seulement la distance moyenne.
    • En attendant de clarifier, je propose de ne travailler qu'avec :
      • une fenêtre en mots (ou occurrences)1) à gauche du pivot (de -9 à 0 à gauche et de 0 à 0 à droite)
      • seuils
        • Fmin : 1
        • Cmin : 1
        • Indice : 0
      • si on veut tester avec une fenêtre en structure, je propose de n'utiliser que les cooccurrents se trouvant dans la structure où se trouve le pivot 2) et pas d'autres structures situées à gauche ou à droite de celle-ci

requête “faire” :

Les différences semblent trop grandes pour pouvoir comparer, doit-on persister les tests ? sachant que :

  • le nombre de ligne de résultats est différent (RCP : 22, Portail : 15)
    • SLH : le nombre de lignes dépend des calculs et des seuils, c'est ce qui varie le plus, ce n'est pas le plus important
      • avec les seuils ci-dessus, la RCP annonce un 'v cooc' de 414
        • l'export de la RCP fournit les 414 lignes (les 414 formes qui rencontrent au moins 1 fois la forme “faire”)
        • l'export du portail ne fournit que les 55 lignes affichées
  • les fréquences semblent similaires mais certaines co-fréquences sont différentes (vivre RCP : 9, vivre Portail : 7)
    • SLH : il faut clarifier le bug #2662 et essayer avec des fenêtres gauche exclusivement
  • j'ai beau jouer sur tous les paramètres dans le Portail, le mot “su” n'apparaît jamais dans les résultats alors qu'il apparaît dans la RCP
    • SLH : le résultat du portail ne dépasse pas 55 lignes, alors que la RCP en annonce 414 max → on ne peut pas comparer tout le lexique
      • SJ : précision : les tests étaient dans le contexte “RCP : 22, Portail : 15”, “su” apparaît dans les 22 lignes sur la RCP mais “jamais” dans le Portail peu importe les réglages
  • réduire l'empan sur le Portail augmente le nombre de résultats, est-ce possible ?
    • SLH : non

SLH : test complémentaires

Attention :

  • dans mes tests, changer les paramètres de la fenêtre de résultats de Coocs et relancer le calcul ne change pas les résultats (comme si les paramètres n'étaient pas pris en compte) → il faut fermer la fenêtre et en ouvrir une autre cooc pour pouvoir faire varier les paramètres
    • SJ : après tests supplémentaires, tout semble marcher sauf les valeurs de l'empan de gauche qui ne sont jamais prises en compte
  • avec les paramètres ultra-restreints suivants :
    • fenêtre en mots de 0 à 0 à gauche et de 0 à 0 à droite3), Fmin = 1, Cmin = 1, Indice = 0
      → on obtient toujours les mêmes résultats
  • si vous confirmez, il faut abandonner les tests et diagnostiquer le code
    • MD ouip, plusieurs diagnostiques du code Portail client, Portail serveur et TBX

requête “f.*” :

  • le nombre de ligne de résultats est différent (RCP : 25, Portail : 35)
  • le taux de mots similaires est tellement faible que l'on peut difficilement comparer

Spécificités

  • [VL, 15/07] : OK, le tri et les réglages
  • [VL, 15/07] : BUG, export, l’intitulé de la colonne des indices de spécificité est actuellement « index » et non « indice »
    • [MD, 16/07] : pour l'instant le code qui fait l'export ne connait pas la langue de l'utilisateur et j'utilise “index” comme nom de colonne
      • [SLH, 19/07] : peut on utiliser le mot anglais 'score' en attendant ?
      • [SJ, 20/07] : les colonnes ne sont pas triées par ordre alpha des parties
      • [SJ, 20/07] : peut-on facilement remplacer les entêtes “f” par le nom de leur partie ?
        • MD OK pour la colonne “score” et remplacer “f” par le nom de la partie → #3100
  • [SLH, 19/07] : BUG, le Fmin n'est pas le bon par défaut (2 au lieu de 1 dans la RCP ?) [le point (.) est à 17,4 au lieu de 18,8 pour chirac
    • [SJ, 20/07] : OK le fmin n'était pas pris en compte, cela a été corrigé et maintenant les indices et fréquences du portail correspondent bien avec ceux de la RCP (sur VOEUX/text@loc)
    • [SJ, 20/07] : le fmin par défaut est toujours de 2 dans le Portail et de 1 dans la RCP
      • MD pb de rafraichissement faire un ctrl + shift +r
  • [SJ, 20/07] : le fmin sur des spécifs depuis un sous-corpus ne fonctionne pas (et on dirait qu'il n'est pas de 2 comme indiqué ?)
    • MD oui y'a pas le paramètre dans cette toolbox

Bugs connus :

  • si le nombre de parties de la partition est trop grand les colonnes sont trop étroites : #3103 Corrigé
  • Les réglages de la LT ne sont pas accessibles, on trouve les fréquences de partie seulement. La LT est créée sans filtre de fréquence.
  • le score maximum des spécificités ? (probablement non)

Vérifier pour la partition VOEUX/locs et le sous-corpus VOEUX/DG les résultats exportés (Le bouton “Exporter” ouvre un onglet, il faut enregistrer le fichier si l'encodage utilisé par le navigateur n'est pas le bon)

  • les fréquences de chaque partie
  • les indices de spécificités

Le format de l'export n'est pas celui de la Spécificité de la Toolbox 0.7.9. Chaque partie a son propre tableau :

SJ :

Notes :

J'ai dû passer le format d'indice de la RCP à “%,.4f” pour coller avec le nombre de décimales du Portail.

Les co-fréquences n'apparaissant pas dans la RCP elles n'ont pas été vérifiées.

VOEUX/text@locs

Après retraitement du fichier exporté depuis le Portail pour coller avec le format de tableau de la RCP, le “diff” de WinMerge ne signale aucune différence de valeurs de fréquence ou de score/indice entre les 6406 lignes de la RCP et du Portail.

VOEUX/text@loc=dg

Différence notable : le Portail affiche 2 tableaux, les tests sont faits sur le tableau : “guest:DG”

Après retraitement du fichier exporté depuis le Portail pour coller avec le format de tableau de la RCP, le “diff” de WinMerge ne signale aucune différence de valeurs de fréquence ou de score/indice entre les 6406 lignes de la RCP et du Portail.

Tests complémentaires Portail ↔ Portail : Spécificités du corpus DG depuis la commande sur le sous-corpus comparée avec celles extraites de la commande depuis la partition LOCS

Le “diff” de WinMerge ne signale aucune différence de valeurs de fréquence ou de score/indice entre les 6406 lignes issues des 2 commandes du Portail.

Bugs Portail

  • l'affichage par défaut “Nb. mots” occulte toutes les X lignes
  • l'affichage “Tout” ne permet pas de définir le nombre de lignes a posteriori, il faut donc le faire avant puis repasser en mode “Tout”
  • l'affichage “Seuil” occulte toutes les X lignes

AFC

Bugs connus :

  • aucun

Vérifier pour la partition VOEUX/locs le résultat exporté (Le bouton “Exporter” ouvre un onglet, il faut enregistrer le fichier si l'encodage utilisé par le navigateur n'est pas le bon)

  • les fréquences de chaque partie
  • les positions
  • les indicateurs de lecture

Le format de l'export est celui de l'AFC de la Toolbox 0.7.9 : les données brutes de FactoMineR au format R :

  • [SJ, 19/07] : BUG: popup d'erreur “Erreur 500, The call failed on the server; see server log for details”
    • le graphique est quand même généré
    • on dirait que les checkboxes d'affichage des lignes et colonnes font l'effet inverse (décocher “lignes” masque les colonnes)
    • on ne peut pas afficher les lignes
      • MD y'a un soucis avec ces 2 checkbox →
    • les onglets infos col et lignes sont vides
      • MD pb de rafraichissement faire un ctrl + shift +r ou alors R est crashé → il faut redémarrer le portail
  • [SLH, 19/07] : BUG, Fmax = 2 dans la popup de lancement → est-ce que c'est pour ça qu'on ne voit jamais de lignes dans les plans ?
    • Remarques :
      • changer Fmax n'affiche pas plus de lignes
      • le Fmax de la RCP est t(CORPUS)
      • MD oups j'ai écrit Fmax au lieu de Fmin. C'est bien le paramètre fmin utiliser pour la table lexicale
1)
comprends pas le “forme” de la RCP
2)
comme je faisais dans Weblex
3)
pas de fenêtre !
public/retours_de_bugs_web/txmweb_0.6.3beta1.txt · Dernière modification : 06/12/2021 16:40 de slh@ens-lyon.fr