Outils pour utilisateurs

Outils du site


public:retours_de_bugs_logiciel:ext_urs_1.0

Retours Extension « Annotation URS (Unité-Relation-Schéma) » version 1.0

Cette page contient les discussions et les retours de bugs de l'extension « Annotation URS (Unité-Relation-Schéma) » version 1.0.

Vous pouvez ajouter vos discussions et retours à la fin de cette page.

BETA

Retours de la phase BETA : merci de répartir vos retours dans les sections thématiques ci-dessous ou dans de nouvelles sections.

([LRV 2019-06-06] installation effectuée et réussie sous Ubuntu mais toujours nommée 7.9 dans la barre de menu)

Recette

AL 2019-05-27

  • Ré-import des annotations XML-TEI URS
    • opération boguée : seuls les premiers mots de chaque mention restent annotés après le ré-import → #2590
  • Gestion de la structure d'annotation : annuler la suppression
    • la fenêtre de confirmation s'ouvre seulement si la référence est utilisée. Sinon, la suppression est immédiate (à préciser dans la recette)
  • Recherche et édition de propriétés
    • Le nombre total d'occurrences trouvées est caché derrière le bouton “flèche droite”
  • Supprimer des annotations
    • Après la suppression par la touche “Supprimer” aucune annotation n'est plus surlignée. Il faut changer de page ou la recharger pour retrouver la mise en évidence des annotations. Cet effet ne se produit pas si on utilise le bouton “croix rouge” dans l'interface
  • Sauvegarder les annotations
    • Contrairement à ce que dit la recette, l'interface d'annotation ne se ferme pas lorsqu'on clique sur “crayon + disquette”
    • Lorsqu'on sauvegarde par le menu URS, l'étoile disparait, mais le bouton “Crayon + disquette” n'est pas grisé
    • Lorsqu'on passe par “Ctrl+S”, on revient à la page 1
  • Export / Renommer
    • Si on a édité la structure d'annotation, on ne voit pas que le corpus a été modifié (pas d'astérisque et le bouton crayon + disquette reste grisé). Il faut cependant sauvegarder les annotations avant de lancer l'opération
    • Le nouveau corpus est bien enregistré au format binaire et le dossier est créé, mais il n'apparait pas dans la liste des corpus
  • Export XML TEI URS
    • La commande Export XML-TEI URS est accessible dans le menu contextuel URS (clic droit sur corpus), mais pas dans le menu principal URS

BP 2019-06-03 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • La macro Democrat d'annotation Frpos2Categorie (ou de façon équivalente Frpos2CategorieDemocrat), lancée sur le corpus PERRAULTCONTES2 (fichier TXM de la livraison 1 Democrat) avec la propriété frpos (en accord avec ce qui apparaît dans les propriétés du corpus) donne une sortie inquiétante :
Exécution du script Groovy Frpos2CategorieDemocratMacro.groovy…
Result:
- 3105 units of type MENTION have been modified.
- 0 units of type MENTION have not been modified.

Some rules should be added to this macro to process the following remaining 'FROPOS / words' values:
fropos=[VER:pres]	words=[avoit]
fropos=[KON]	words=[que]
fropos=[VER:pres]	words=[dit]
fropos=[DET:ART, ADJ]	words=[l', autre]
fropos=[DET:ART]	words=[les]
fropos=[PRP, ADV]	words=[par, tout]
... [etc. il y a 229 lignes en tout, pour l'une comme pour l'autre macro]
  • pourquoi est-il question de fropos ?
  • pourquoi des règles aussi courantes que [VER:pres]/[dit] ou [DET:ART]/[les] manqueraient ?

FMB 2019-06-14 (Ubuntu 16.04, TXM8.0 / Annotation URS (Unité-Relation-Schéma) 1.0.0.201905241540)

* la macro ConcordanceToUnit ne se lance pas, et ce quelque soit l'endroit depuis laquelle on l'appelle (menu contexctuel URS>outils>annotations OU vue>macro …). Alors que cette macro fonctionne dans la version 7.9.

Exécution du script Groovy ConcordanceToUnitsMacro.groovy…
** Erreur dans la déclaration du nom de l'@Option prop
** Erreur dans la déclaration du nom de l'@Option value
Effectué en 8 ms.

[LRV 2019-06-06 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]

Annotation

Import de corpus annotés

Import d'un corpus XML-TEI Analec (annoté puis exporté depuis Analec)

  • importer le texte “Le capitaine Fracasse” depuis le fichier XML-TEI (dans le répertoire “LeCapitaineFracasse”) avec la commande “Importer un corpus XML-TEI Analec” du menu Fichier > Importer) il serait utile d'indiquer le nom du fichier avec l’extension
  • Ré-import des annotations XML-TEI URS

la modification dans le fichier “annotations/BossuetDiscours-urs.xml” ne semble pas être prise en compte (“avoir” n'est pas sélectioné).

Structure et vue d'annotation

Gestion de la vue

  • éditer la vue : ouvrir la fenêtre à partir du menu “URS > Editer la vue…”
  • modifier l'ordre d'affichage des propriétés des unités MENTION
    • ouvrir l'onglet “Présentation des champs”
    • remplacer “0” par “2” pour “Accessibilité”
    • remplacer “2” par “0” pour “REF”
    • Valider ajouter “en cliquant préalablement sur la croix”
  • modifier l'affichage ou non de propriétés des unités MENTION
    • ouvrir l'onglet “Extraction de propriétés”
    • dans la zone “Propriétés à visualiser”, faire un clic droit sur “Accessibilité”, puis sélectionner “Supprimer le champ…”
    • Valider ajouter “en cliquant préalablement sur la croix”
FMB :

Dans l'édition de la vue actuellement…

-ok pour le changement de position. Mais le changement de niveau ne fonctionne pas. Il n'est donc pas possible de gérer l'affichage des champs d'annotation sur plusieurs lignes.

https://groupes.renater.fr/wiki/txm-users/_media/public/retours_de_bugs_logiciel/vueniveau.png?w=120&h=71&t=1560414928&tok=e3c795

- ok pour la suppression de l'affichage d'une propriété.

- sauf erreur de manipulation de ma part… le coloriage d'éléments n'est pas encore incrémenté.

Fonctionnalités partagées

Sélection d'annotations superposées

  • trouver 2 annotations superposées celles qui ont une couleur plus foncée
FMB (2019-06-07) : Petite remarque qui n'est qu'un détail pour aller vers plus de confort de relecture dans l'annotation…

Lorsque l'on se balade sur les annotations existantes, il est difficile de faire la différence entre :

- la surbrillance de l’élément actif (élément annoté dont on regarde l’annotation)

- la surbrillance d’un élément annoté 2 fois, c'est-à-dire “2 annotations superposées”

par exemple : (corpus DEMOCRATLYON3 recette URS1) quand on est sur la mention-1 (annotation du terme “vous”) la surbrillance du terme est proche de celle de la mention 1O (“j’” → qui est annoté 2 fois, est dans 2 unités donc a une surbrillance plus forte)

Peut-être faudrait-il une surbrillance d’une autre couleur pour l’élément actif (jaune?…) ou peut-être faut-il mettre en gras la police du (ou des) termes actif(s) ?

Modifier les propriétés d'annotations

création et modification des propriétés d'une unité

  • dans l'édition, première page, sélectionner avec la souris le texte “expliqué”
  • créer une mention ajouter “en cliquant préalablement sur la croix”

Auto-complétion optionnelle par infixe dans les champs de valeur de propriété

  • dans la page de préférences utilisateur Annotation>“URS” cocher l'option “Autocompletion search pattern of field is prefix”

Supprimer des annotations

  • la supprimer avec le bouton “Supprimer” (croix rouge en haut à droite) ou la touche “Suppr” du clavier

Annoter des unités

Commencer à annoter

Démarrer l'annotation

  • les unités s'affichent en vert clair :
    • comme “trois choses” sur la 2e ligne il n'y a que “trois” qui s'affiche en vert clair chez moi
Affichage des unités

Sélection d'unité inter-page

  • sélectionner l'unité “Dieu” MENTION-320 de la 5e page qui recouvre les mots “leur créateur”
Modifier les limites des unités

Correction des limites

  • corriger la limite gauche d'une unité

4. la MENTION-2 commence à “général”

  • corriger la limite droite d'une unité

4. la MENTION-2 fini à “cét”

Annoter des schémas

Visualisation des CHAINEs

  • la première unité de la CHAINE est sélectionnée → L'unité “ces collines décharnées” est mise en évidence dans l'édition. c'est la mention “vous” qui est sélectionnée pour moi
  • les autres unités de la CHAINE sont aussi mises en évidence mais de façon plus discrète

Exploitation

Retours généraux

Recette et Bugs

BP 2019-06-05 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK pour le menu URS : L'accès aux commandes par menu est très convaincant et tout-à-fait opérationnel, c'est cet accès que j'ai principalement utilisé pour mes tests et je n'ai rencontré aucun problème.
  • Pour Schemas Progression, Units Index, Units List, il m'est arrivé que la largeur du formulaire de saisie des paramètres soit maximisée (peut-être suite au test de génération de CQL dans Schemas List ?)

BP 2019-06-03 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • lorsque minimum_schema_size = 1 alors il semble que le filtre maximum_schema_size ne s'applique pas (résultat pour toutes les chaînes) (observé pour toutes les commandes sur les Schemas -Schemas List, Schemas Summary, Schemas Lengths, Schemas Progression-, pas testé pour les commandes sur les unités).
    • MD C'est un bug, il ne fonctionne pas du tout peu importe la valeur de minimum_schema_size #2593
    • [BP 2019-06-06] il me semble qu'il fonctionne quand minimum_shema_size = maximum_schema_size =/= 1 (par exemple j'ai utilisé plusieurs fois un filtrage sur les chaînes de longueur 5, ou de longueur 8, et cela semblait bien fonctionner).

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • Je ne sais pas si c'est un bug ou une trop grande concision de la documentation, mais je n'arrive pas à exprimer une alternative entre plusieurs valeurs de propriétés en URSQL.
    • Sur le corpus PERRAULTCONTES2, avec Schemas List, j'ai essayé par exemple sans succès :
MENTION@REF=Dieu|Anne
MENTION@REF=(Dieu|Anne)
  • MD je n'ai pas eu de soucis avec SchemaList et une URSQL pour les unités de la forme MENTION@REF=A|B
  • [BP 2019-06-06] Autant pour moi, je pense que je situais ma requête au niveau des unités alors que pour ce que je cherchais il fallait plutôt la faire porter sur le schéma : avec CHAINE@REF=Anne|Dieu ça marche très bien.
  • En revanche la sélection semble en partie fonctionner dans Schema Lengths mais avec un effet de bord curieux :
Longueur moyenne des chaînes de référence : 34/137 = 0.2481751825
Index hiérarchique des longueurs de chaînes :
len	freq	cfreq
0	135	135	[le petit chaperon rouge, emploi générique du pronom, la mère du petit chaperon rouge, la grand-mère du petit chaperon rouge, la galette que le petit chaperon rouge porte chez mère grand, une galette et un petit pot de beurre que le petit chaperon rouge doit aller porter chez mère-grand, le petit pot de beurre que le petit chaperon rouge porte chez mère-grand, le loup, la maison de la grand-mère du petit chaperon rouge, le chemin du loup, la voix du loup, le lit de la grand-mère du petit chaperon rouge, la chevillette, la porte de la maison de la grand-mère, une certaine sorte de loup, Barbe-Bleue, la vaisselle d'or et d'argent, l'argent, la barbe de Barbe-Bleue, la voisine de Barbe-Bleue, les deux filles de la voisine de Barbe-Bleue, la cadette des deux soeurs, les femmes que Barbe-Bleue a épousé, emploi générique du pronom (texte 2), tous les gens chez BB : Barbe-Bleue, la voisine, ses filles, les amis, le voisinage, le voyage de BB, les bonnes amies de la cadette, les deux grands gardemeubles, la clef du cabinet, le cabinet, l'appartement bas, les voisines et les bonnes amies, la maison de BB, la porte du cabinet, le sang des femmes du cabinet, l'ensemble des clefs de BB, là-haut, les frères de la cadette, le soleil, l'herbe, les deux cavaliers, la curiosité, un plaisir bien léger, époux, le chat botté, le meusnier, le cadet des fils du meunier, le sac du chat botté, les cordons du sac du chat botté, le lapin entré dans le sac du chat botté, le roi, le marquis de Carabas, les deux perdrix attrapées par le chat botté, la rivière, la fille du roi, les gardes du roi, le carosse du roi, des paysans, le pré fauché par les paysans, des moissonneurs, les blés, un beau château, le maître du château, la grande salle du château, les amis du maître du château, la veuve, l'ainée des deux filles de la veuve, la veuve et sa fille ainée, emploi générique du pronom (texte 4), la cadette des deux filles de la veuve, l'honneteté, de l'eau, la maison de la veuve, la grande cruche, la fontaine, la fée, le don, la bouche de la cadette des deux filles de la veuve, les diamants, le plus beau flacon d'argent, le fils du roi, le roi (texte 4), Le petit poucet, le bucheron, le bucheron et la bucheronne, la bucheronne, les enfants des bucherons, l'ainé des enfants des bucherons, emploi générique du pronom (texte 5), les enfants, la maison du PP, les frères du PP, le bois (texte 5), les petits cailloux du PP, le bucheron, la bucheronne et leurs enfants, la porte de la maion du PP, le seigneur du village, les dix écus, beaucoup d'autres gens, le pain du PP, une petite lueur, la maison de l'ogre, la porte de la maison de l'ogre, la femme de l'ogre, l'ogre, les petits enfants, le mouton, le lit de l'ogre, la chair fraiche, le veau que la femme de l'ogre vient d'habiller, trois ogres, le couteau de l'ogre, la peur, les sept filles de l'ogre, le grand lit des septs filles, l'or (texte 5), la tete des bébés ogresses, la chambre des ogresses, l'autre lit dans la chambres des bébés ogresses, les couronnes d'or des ogresses, les bonnets des enfants des bucherons, en haut, l'évaouissement, les bottes de sept lieues, sept lieues, un rocher creux, les voleurs, des gens qui ne demeurent pas d'accord avec l'action du PP, l'armée présente à deux cents lieues de la cour, le roi (texte5), quelques femmes qui chargent le PP de lettres pour leurs maris, le bucheron, la bucheronne, les enfants sauf le PP, le bucheron et les frères du PP, beaucoup d'enfants, l'un des enfants]
31	1	136	[Anne]
3	1	137	[Dieu]

Propositions d'améliorations

  • [BP 2019-06-04] Réfléchir à l'ordre de présentation des commandes et l'homogénéiser.
    • Ordre recette :
      • Units Summary
      • Schemas Summary
      • Units List
      • Schemas List
      • Units Index
      • Units Interdistance
      • Units Referential Density
      • Units Stability Score
      • Schemas Progression
    • Ordre documentation :
      • Units Summary
      • Units Index
      • Units List
      • Units Interdistance
      • Units Referential Density
      • Units Referential Stability
      • Schemas Summary
      • Schemas List
      • Schema Lengths
      • Schemas Progression
    • Ordre Interface (= ordre alphabétique) :
      • Schema Lengths
      • Schemas List
      • Schemas Progression
      • Schemas Summary
      • Units Index
      • Units Interdistance
      • Units List
      • Units Referential Density
      • Units Referential Stability
      • Units Summary
    • Ordre proposé, mais à continuer à réfléchir et discuter ensemble :
      • Units Summary
      • Schemas Summary
      • Units Index
      • Schema Lengths
      • Units List
      • Schemas List
      • Units Interdistance
      • Units Referential Density
      • Units Stability Score
      • Schemas Progression
  • [BP 2019-06-04] Dans la livraison actuelle, les mesures se lancent séparément et le résultat prend le plus souvent la forme d'une sortie rédigée dans la console (avec le détail du calcul, etc.). Il serait intéressant de réfléchir à la manière de prévoir la production de tableaux de mesures, croisant des textes (ensemble de corpus ou partition) et un ensemble de mesures, à des fins éventuellement de présentation synthétique mais peut-être surtout d'exploitation automatique (analyse des données : ACP, classification - cela dit ces fonctionnalités ne sont pas encore interfacées dans TXM, il faudrait avancer aussi en parallèle de ce côté là). La macro AllMesures qui avait été écrite à l'occasion de la toute première génération de mesures (https://groupes.renater.fr/wiki/txm-info/public/spec_analec_mesures) était une manière de répondre à ce besoin.
  • [BP 2019-06-04] Le langage ursql est très pratique.
    • Outre l'expression d'alternatives (cf. retour dans la partie recette et bugs ci-dessus), on pourrait souhaiter aussi principalement la possibilité d'exprimer des négations (tout sauf X ; tout sauf X, Y, Z).
    • Par ailleurs, ce serait bien de toujours prévoir un message d'erreur quand la sélection ursql n'a pas fonctionné (pb au moment du parsage), actuellement il me semble que lorsque le parsage échoue alors il n'y a pas de filtrage et on affiche tous les résultats. Or si l'utilisateur s'attend à un filtrage large, il peut ne pas s'apercevoir que le filtrage a échoué.
  • [BP 2019-06-05] Les ressemblances et différences entre les commandes Units Index et Schema Lenths donnent des idées de généralisation/extension :
    • création de Shemas Index qui procéderait comme Units Index et s'appliquerait à des propriétés de type énumératif ;
    • ajout de Units Distribution et Schemas Distribution, qui seraient des INDEX sur valeurs de type entier, triés sur la valeur décroissante de l'entier (et non hiérarchiquement sur la fréquence comme dans le Schema Lengths actuel, ni alphabétiquement sur la valeur comme dans le Units/SchemasIndex) et complétés par des indicateurs type quartiles etc. L'application de SchemasDistribution à la propriété NB MAILLONS des schémas serait plus ou moins un équivalent à Schemas Length (qu'on pourrait vouloir garder quand même car la longueur d'un schéma est une propriété intrinsèque, éventuellement implicite mais calculable, de tout schéma).
    • si on garde Schemas Length, on pourrait définir son cousin Units Length, s'appuyant de même sur une propriété intrinsèque des unités.
  • [BP 2019-06-06] La macro LongueurDesMentions ajoute aux unités une propriété LONGUEUR qui peut prendre trois valeurs : 1, 2, 3 ou plus. Il serait probablement intéressant (à confirmer avec les linguistes) de pouvoir aller un peu plus loin, jusqu'à 10 par exemple, ou bien de passer en paramètre la longueur jusqu'à laquelle on détaille.
  • [BP 2019-06-07] Avoir un rappel des valeurs de paramètres avec le résultat dans la console (tous les paramètres, ou éventuellement seulement ceux qui n'ont pas les valeurs par défaut).

Commande Units Summary

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), résultat avec les paramètres par défaut :
Statistiques des unités de PERRAULTCONTES2
	PERRAULTCONTES2
Units	2188
REF	137

Propositions d'améliorations

  • [BP 2019-06-04] La question pourrait se poser d'ajouter un paramètre word_property_display, qui permettrait de récupérer un décompte du nombre de valeurs différentes non seulement pour les propriétés des unités mais aussi pour une propriété des tokens sous-jacents. (Usage visé : calcul plus direct d'une mesure de “Diversité”, qu'on obtient actuellement dans le détail du calcul de la mesure de Stabilité Référentielle.)
    • MD cela correspond à un Index de TXM dont les matchs ont été sélectionné avec une URSQL ?
    • BP pas un INDEX, juste un décompte : le nombre de lignes (V) de l'index.

Commande Schemas Summary

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat)
    • résultat avec les paramètres par défaut :
Statistiques des schémas de PERRAULTCONTES2
	PERRAULTCONTES2
Schemas	137
Average len	15.9708029197
Median len	42
REF	137
  • Cependant, après avoir fait tourner la macro Frpos2Categorie, j'obtiens :
Statistiques des schémas de PERRAULTCONTES2
	PERRAULTCONTES2
Schemas	137
Average len	15.9708029197
Median len	42
REF	137
CATEGORIE	1
  • Mais si je consulte la structure d'annotation, je n'ai pas la propriété CATEGORIE sur les Schemas de type CHAINE (elle existe mais sur les unités de type MENTION), et en revanche j'ai sur les CHAINE une propriété NB MAILLONS qui n'apparaît pas dans le résultat de SchemasSummary.
    • MD la macro ne met pas à jour la structure d'annotation, mais les valeurs sont bien là. → on va proposer des guide lines pour manipuler les annotations URS depuis Groovy.

LRV 2019-06-17 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540

  • En faisant tourner la commande avec les paramètres par défaut j'obtiens d'autres valeurs que celles obtenues par BP. Les voici :
statistiques des schémas de PERRAULTCONTES2
	PERRAULTCONTES2
Schemas	133
Average len	16.2255639098
Median len	35
REF	133
CATEGORIE	1

Commande Units List

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), résultat pour les paramètres par défaut sauf unit_ursql = MENTION@REF=les voleurs :
PERRAULTCONTES2 units: 5
#   1, 10438-10438, "voleurs" {REF=les voleurs}
#   2, 10440-10440, "qui" {REF=les voleurs}
#   3, 10449-10449, "leur" {REF=les voleurs}
#   4, 10463-10463, "ils" {REF=les voleurs}
#   5, 10514-10514, "ils" {REF=les voleurs}

Commande Schemas List

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), résultat pour les paramètres par défaut sauf sélection limitée aux schémas de taille 5:
PERRAULTCONTES2 schemas (14):
[REF:le lit de la grand-mère du petit chaperon rouge, NB MAILLONS:5]: où, le lit, le lit de la mere - grand, le lit, son lit
[REF:la maison de la veuve, NB MAILLONS:5]: chez elle, le logis, au logis, du logis, du logis
[REF:les deux perdrix attrapées par le chat botté, NB MAILLONS:5]: deux perdrix, les, toutes deux, les, deux perdrix
[REF:le carosse du roi, NB MAILLONS:5]: qui, son carosse, du carosse, du carosse, le carosse
[REF:la bouche de la cadette des deux filles de la veuve, NB MAILLONS:5]: la bouche, la bouche, sa bouche, la bouche de vôtre soeur, la bouche
[REF:les petits enfants, NB MAILLONS:5]: les petits enfans, les petits enfans, les petits enfans, en, les petits enfans
[REF:la galette que le petit chaperon rouge porte chez mère grand, NB MAILLONS:5]: une galette, une galette, la galette, galette, une galette
[REF:l'honneteté, NB MAILLONS:5]: l' honnesteté, veut, sa, elle, l' honnesteté
[REF:la maison de BB, NB MAILLONS:5]: y, chez la jeune mariée, sa maison, y, toute la maison
[REF:les voleurs, NB MAILLONS:5]: ils, voleurs, leur, ils, qui
[REF:la voisine de Barbe-Bleue, NB MAILLONS:5]: luy, Une de ses voisines, luy, elle, leur mere
[REF:emploi générique du pronom (texte 4), NB MAILLONS:5]: on, on, on, on, on
[REF:la barbe de Barbe-Bleue, NB MAILLONS:5]: cela, la barbe bleuë, sa barbe bleuë, la barbe si bleuë, qui
[REF:le petit pot de beurre que le petit chaperon rouge porte chez mère-grand, NB MAILLONS:5]: le petit pot de beurre, un petit pot de beurre, un petit pot de beurre, ce petit pot de beurre, un petit pot de beurre

Propositions d'améliorations

  • [BP 2019-06-04] Je ne comprends pas l'ordre actuel de la liste des Unités (MENTIONs) (qui termine chaque ligne), je pense que ce serait intéressant de présenter cette liste dans l'ordre des occurrences dans le texte.
    • MD fait
  • [BP 2019-06-06] Pour l'option buildCQL, adopter une écriture compacte de la CQL comme dans l'option output_mode = CQL de Units List ? Exemple de sorties actuelles pour l'une et l'autre commande (pour le référent Anne) :
    • requête générée par Units List :
b:[][]|a:[]|c:[][][]::b=1140|b=2545|a=2549|c=2553|a=2558|a=2563|a=2565|a=2576|a=2599|a=2603|c=2612|a=2627|b=2635|a=2644|c=2650|a=2657|a=2733|a=2742|c=2748|a=2754|a=2805|a=2814|a=2819|c=2823|a=2852|a=2894|a=2903|a=2908|a=2913|c=3277|a=3285
  • requête générée par Schemas List :
([id="w_FM_NAR_EXT_PerraultContes_24319"] [id="w_FM_NAR_EXT_PerraultContes_24320"])|([id="w_FM_NAR_EXT_PerraultContes_24242"])|([id="w_FM_NAR_EXT_PerraultContes_24237"] [id="w_FM_NAR_EXT_PerraultContes_24238"] [id="w_FM_NAR_EXT_PerraultContes_24239"])|([id="w_FM_NAR_EXT_PerraultContes_24587"])|([id="w_FM_NAR_EXT_PerraultContes_24961"] [id="w_FM_NAR_EXT_PerraultContes_24962"] [id="w_FM_NAR_EXT_PerraultContes_24963"])|([id="w_FM_NAR_EXT_PerraultContes_24334"] [id="w_FM_NAR_EXT_PerraultContes_24335"] [id="w_FM_NAR_EXT_PerraultContes_24336"])|([id="w_FM_NAR_EXT_PerraultContes_24426"])|([id="w_FM_NAR_EXT_PerraultContes_24296"] [id="w_FM_NAR_EXT_PerraultContes_24297"] [id="w_FM_NAR_EXT_PerraultContes_24298"])|([id="w_FM_NAR_EXT_PerraultContes_24592"])|([id="w_FM_NAR_EXT_PerraultContes_22824"] [id="w_FM_NAR_EXT_PerraultContes_22825"])|([id="w_FM_NAR_EXT_PerraultContes_24969"])|([id="w_FM_NAR_EXT_PerraultContes_24328"])|([id="w_FM_NAR_EXT_PerraultContes_24283"])|([id="w_FM_NAR_EXT_PerraultContes_24597"])|([id="w_FM_NAR_EXT_PerraultContes_24438"])|([id="w_FM_NAR_EXT_PerraultContes_24229"] [id="w_FM_NAR_EXT_PerraultContes_24230"])|([id="w_FM_NAR_EXT_PerraultContes_24311"])|([id="w_FM_NAR_EXT_PerraultContes_24233"])|([id="w_FM_NAR_EXT_PerraultContes_24498"])|([id="w_FM_NAR_EXT_PerraultContes_24489"])|([id="w_FM_NAR_EXT_PerraultContes_24249"])|([id="w_FM_NAR_EXT_PerraultContes_24507"] [id="w_FM_NAR_EXT_PerraultContes_24508"] [id="w_FM_NAR_EXT_PerraultContes_24509"])|([id="w_FM_NAR_EXT_PerraultContes_24247"])|([id="w_FM_NAR_EXT_PerraultContes_24287"])|([id="w_FM_NAR_EXT_PerraultContes_24503"])|([id="w_FM_NAR_EXT_PerraultContes_24578"])|([id="w_FM_NAR_EXT_PerraultContes_24417"])|([id="w_FM_NAR_EXT_PerraultContes_24341"])|([id="w_FM_NAR_EXT_PerraultContes_24536"])|([id="w_FM_NAR_EXT_PerraultContes_24432"] [id="w_FM_NAR_EXT_PerraultContes_24433"] [id="w_FM_NAR_EXT_PerraultContes_24434"])|([id="w_FM_NAR_EXT_PerraultContes_24260"])

[LRV 2019-06-17 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]

  • Lancer le calcul à partir du menu “URS > Outils > Exploitation > Schemas list” avec les paramètres par défaut sauf :
  • schemaunit_ursql=CHAINE@REF=l'ouvrage

Commande Units Index

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), résultat avec les paramètres par défaut (et après avoir équipé le corpus de propriétés CATEGORIE sur les MENTIONS avec la macro Democrat Frpos2Categorie) :
Index de la propriété CATEGORIE des unités MENTION[0] de PERRAULTCONTES2.PERRAULTCONTES2
CATEGORIE	PERRAULTCONTES2
GN	844
POSS	237
PRO	73
PR_CL_O	163
PR_CL_S	573
PR_REL	116
UNDEFINED	182
SVG file: /home/bpincemi/TXM-0.8.0/results/txm1319277005571839254.svg
  • et le graphique s'affiche dans la fenêtre des résultats.

Propositions d'améliorations

  • [BP 2019-06-04]
    • Le tri alphabétique sur la valeur de la propriété est très bien, il facilite notamment les comparaisons d'un texte à l'autre. Cela étant dans certains cas un tri hiérarchique pourrait aussi être utile (par exemple, Units Index sur les REF des MENTION, si on ne passe pas par Schemas Length). Le choix du tri pourrait se faire par un (nouveau) paramètre (avec par défaut le tri alphabétique sur la valeur de proriété).
  • [LRV 2019-06-20 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]

2. lancer la macro UnitsIndex avec les paramètres suivants1) :

  • schema_ursql : CHAINE
  • minimum_schema_size : 0
  • maximum_schema_size : 0
  • unit_ursql : MENTION
  • unit_property_display : CATEGORIE
  • word_property_display
  • position_in_schema
  • limit_cql_limit :
  • strict_inclusion : true
  • position_in_matches
  • limit_distance : 0
  • output_2D : true
  • output_showlegend : true
  • output_fmin : 0
  • output_histogram : true
  • output_lexicaltable : false
  • debug : OFF

1. sélectionner la partition “Textes”

2. lancer la macro UnitsIndex avec les paramètres suivants2) :

  • schema_ursql : CHAINE
  • minimum_schema_size : 0
  • maximum_schema_size : 0
  • unit_ursql : MENTION
  • unit_property_display : CATEGORIE
  • word_property_display
  • position_in_schema
  • limit_cql_limit :
  • strict_inclusion : true
  • position_in_matches
  • limit_distance : 0
  • output_2D : true
  • output_showlegend : true
  • output_fmin : 0
  • output_histogram : true
  • output_lexicaltable : false
  • debug : OFF

Commande Units Interdistance

Recette et Bugs

BP 2019-05-23 (et 2019-06-03 pour corriger les retours sur la cadence) (Ubuntu 16.04, TXM 0.8 XX, Extension URS 1.0 YY)

  • dans l'exemple de la recette, qui s'applique à des distances entre mentions de type pronom, l'ordre de grandeur de la distance maximum est étrangement élevé
  • j'ai testé cette commande sur une chaîne courte (4 mentions) du corpus Commynes (CHAINE@REF=Cambrais) :
    distance moyenne inter-mayonnaise : 54 / 4 = 13.5
    distance medianne inter-mayonnaise : 11
    distance quartils : 0 2 11 41 41
    cadence moyenne : 13 / 4 = 3.25
    cadence medianne : 2
    cadence quartils : 0 0 2 11 11
    • retour à l'édition pour visualiser les 4 mentions de cette chaîne :
      à [Cambray], [où] pour lors estoit ledict duc Philippes ; et luy joinct [audict lieu] et le mareschal de Bourgongne, qui estoit de la maison de Neufchastel, ledict conte de Charroloys feist une grande assemblée de gens de conseil et autres des gens de son père en l'hostel de l'evesque de [Cambray],
    • sortie que j'aurais attendue :
      distances : [1, 10, 40]
      distance moyenne : 51 / 3 = 17
      distance médiane : 10
      distance quartiles : 1 1 10 40 40
      cadences : [1, 1, 10, 40]
      cadence moyenne : 52 / 4 = 17.33
      cadence médiane : 10
      cadence quartiles : 1 1 1 40 40
  • Rq. 1. Pour mesurer la distance, j'ai donc compté les mots entre deux mentions, il me semble que c'est le plus intuitif (distance zéro ⇔ les mentions se touchent) et que cela correspond à l'idée que l'on se fait quand on lit la doc : “La distance est calculée en mots : depuis le dernier mot d'une unité jusqu'au premier mot de l'unité suivante dans le corpus.”
  • Rq. 2. J'ai remis la liste des distances et et celle des cadences (même si bien sûr il faudrait prévoir de les tronquer ou de ne pas les donner lorsqu'elles sont longues), comme cela semblait fait dans une version précédente de la commande, d'après le résultat de la recette ici : https://groupes.renater.fr/wiki/txm-info/public/spec_exploitation_annotation/spec_urs_mesures2#units_inter_distance
    • J'ai pensé que cela s'afficherait peut-être en changeant de valeur le paramètre Debug, mais celui-ci a affiché d'autres infos.
  • Rq. 3. Pour N mentions il y a N-1 distances (les distances sont définies par les intervalles entre les mentions) alors qu'il y a N cadences (les cadences sont définies pour chaque mention en prenant le min de ses 2 distances aux mentions précédente et suivante, ou bien la seule distance définie pour cette mention -pas de précédente ou pas de suivante). S'il n'y a qu'une seule mention, la mesure n'est pas définie.
  • Rq. 4. Noter que la liste des cadences ne peut pas se calculer uniquement à partir de la liste des distances triée par valeur croissante, elle se calcule sur la liste des distances triée selon l'ordre d'occurrence dans le texte.
  • MD, il y a un soucis sur le nombre de distance et sur le calcul de la distance #2594
  • [LRV 2019-06-06 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]
  • Je rejoins les commentaires de BP
  • Pour info, je n'ai pas les mêmes résultats en mettant les mêmes paramètres que vous
DEMOCRATLYON3 distances:
distance moyenne inter-mayonnaise : 325162 / 1853 = 175.4786832164
distance medianne inter-mayonnaise : 10
distance quartils : 0 0 10 48 9561
cadence moyenne : 61288 / 1853 = 33.0750134916
cadence medianne : 4
cadence quartils : 0 0 4 14 4130
Effectué en 638 ms.
  • Suggestion d'amélioration (qui me serait très utile) : afficher, en plus de ces calculs globaux, le calcul pour chaque chaine :
G
distance moyenne inter-mayonnaise : 3549 / 118 = 30.0762711864
distance medianne inter-mayonnaise : 12
distance quartils : 0 5 12 29 332
cadence moyenne : 1327 / 118 = 11.2457627119
cadence medianne : 7
cadence quartils : 0 4 7 12 88
Girafons
distance moyenne inter-mayonnaise : 1461 / 31 = 47.1290322581
distance medianne inter-mayonnaise : 10
distance quartils : 0 4 10 23 941
cadence moyenne : 196 / 31 = 6.3225806452
cadence medianne : 4
cadence quartils : 0 2 4 9 41
S
distance moyenne inter-mayonnaise : 2922 / 55 = 53.1272727273
distance medianne inter-mayonnaise : 19
distance quartils : 0 8 19 53 580
cadence moyenne : 1295 / 55 = 23.5454545455
cadence medianne : 12
cadence quartils : 0 5 12 28 346
Z
distance moyenne inter-mayonnaise : 3932 / 83 = 47.3734939759
distance medianne inter-mayonnaise : 22
distance quartils : 0 10 22 56 283
cadence moyenne : 1754 / 83 = 21.1325301205
cadence medianne : 11
cadence quartils : 0 5 11 22 144

Commande Units Referential Density

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), résultat pour les paramètres par défaut :
PERRAULTCONTES2 referential density: nUnites/nMots = 2188/11106 = 0.1970106249 = 19.7010624900%

Propositions d'améliorations

  • [BP 2019-06-04] Arrondir l'écriture % à deux décimales et l'introduire par un signe 'approximativement-égal'. (Ou : proposer un paramètre pour régler l'arrondi ; considérer cependant la complémentarité de précision entre la valeur brute et l'écriture en %).
    • MD fait
  • [BP 2019-06-04] Pourrait s'appeler plutôt Density (car non spécialisée Democrat dans le traitement effectué et son paramétrage).

Commande Units Referential Stability

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), résultat pour schémas de taille 5, MENTION@CATEGORIE=GN et word_property=frlemma :
** PERRAULTCONTES2 schemas: 
la galette que le petit chaperon rouge porte chez mère grand (5 units) : 5 selected units / 3 frlemmas = 1.6666666667
le petit pot de beurre que le petit chaperon rouge porte chez mère-grand (5 units) : 5 selected units / 3 frlemmas = 1.6666666667
le lit de la grand-mère du petit chaperon rouge (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
la barbe de Barbe-Bleue (5 units) : 2 selected units / 2 frlemmas = 1
la voisine de Barbe-Bleue (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
la maison de BB (5 units) : 3 selected units / 3 frlemmas = 1
les deux perdrix attrapées par le chat botté (5 units) : 2 selected units / 1 frlemmas = 2
le carosse du roi (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
emploi générique du pronom (texte 4) (5 units) : 0 selected units / 0 frlemmas = NA
l'honneteté (5 units) : 2 selected units / 1 frlemmas = 2
la maison de la veuve (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
la bouche de la cadette des deux filles de la veuve (5 units) : 5 selected units / 3 frlemmas = 1.6666666667
les petits enfants (5 units) : 4 selected units / 1 frlemmas = 4
les voleurs (5 units) : 1 selected units / 1 frlemmas = 1
  • Remarque : on peut contrôler à l'aide du résultat vu précédemment de Schemas List pour les schémas de taille 5 :
PERRAULTCONTES2 schemas (14):
[REF:le lit de la grand-mère du petit chaperon rouge, NB MAILLONS:5]: où, le lit, le lit de la mere - grand, le lit, son lit
[REF:la maison de la veuve, NB MAILLONS:5]: chez elle, le logis, au logis, du logis, du logis
[REF:les deux perdrix attrapées par le chat botté, NB MAILLONS:5]: deux perdrix, les, toutes deux, les, deux perdrix
[REF:le carosse du roi, NB MAILLONS:5]: qui, son carosse, du carosse, du carosse, le carosse
[REF:la bouche de la cadette des deux filles de la veuve, NB MAILLONS:5]: la bouche, la bouche, sa bouche, la bouche de vôtre soeur, la bouche
[REF:les petits enfants, NB MAILLONS:5]: les petits enfans, les petits enfans, les petits enfans, en, les petits enfans
[REF:la galette que le petit chaperon rouge porte chez mère grand, NB MAILLONS:5]: une galette, une galette, la galette, galette, une galette
[REF:l'honneteté, NB MAILLONS:5]: l' honnesteté, veut, sa, elle, l' honnesteté
[REF:la maison de BB, NB MAILLONS:5]: y, chez la jeune mariée, sa maison, y, toute la maison
[REF:les voleurs, NB MAILLONS:5]: ils, voleurs, leur, ils, qui
[REF:la voisine de Barbe-Bleue, NB MAILLONS:5]: luy, Une de ses voisines, luy, elle, leur mere
[REF:emploi générique du pronom (texte 4), NB MAILLONS:5]: on, on, on, on, on
[REF:la barbe de Barbe-Bleue, NB MAILLONS:5]: cela, la barbe bleuë, sa barbe bleuë, la barbe si bleuë, qui
[REF:le petit pot de beurre que le petit chaperon rouge porte chez mère-grand, NB MAILLONS:5]: le petit pot de beurre, un petit pot de beurre, un petit pot de beurre, ce petit pot de beurre, un petit pot de beurre
  • Remarque 2 : on peut aussi activer l'option “show values”, qui donne une sortie intermédiaire, plus complète :
la galette que le petit chaperon rouge porte chez mère grand (5 units) : 5 selected units / 3 frlemmas = 1.6666666667
	frlemmas=[le galette, galette, un galette]
le petit pot de beurre que le petit chaperon rouge porte chez mère-grand (5 units) : 5 selected units / 3 frlemmas = 1.6666666667
	frlemmas=[le petit pot de beurre, un petit pot de beurre, ce petit pot de beurre]
le lit de la grand-mère du petit chaperon rouge (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
	frlemmas=[le lit de le mere - grand, le lit, son lit]
la barbe de Barbe-Bleue (5 units) : 2 selected units / 2 frlemmas = 1
	frlemmas=[son barbe bleuë, le barbe bleuë]
la voisine de Barbe-Bleue (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
	frlemmas=[luy, leur mere, un de son voisin]
la maison de BB (5 units) : 3 selected units / 3 frlemmas = 1
	frlemmas=[son maison, chez le jeune marié, tout le maison]
les deux perdrix attrapées par le chat botté (5 units) : 2 selected units / 1 frlemmas = 2
	frlemmas=[deux perdrix]
le carosse du roi (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
	frlemmas=[son carosse, le carosse, du carosse]
emploi générique du pronom (texte 4) (5 units) : 0 selected units / 0 frlemmas = NA
	frlemmas=[]
l'honneteté (5 units) : 2 selected units / 1 frlemmas = 2
	frlemmas=[le honnesteté]
la maison de la veuve (5 units) : 4 selected units / 3 frlemmas = 1.3333333333
	frlemmas=[du logis, le logis, au logis]
la bouche de la cadette des deux filles de la veuve (5 units) : 5 selected units / 3 frlemmas = 1.6666666667
	frlemmas=[le bouche, son bouche, le bouche de vôtre sœur]
les petits enfants (5 units) : 4 selected units / 1 frlemmas = 4
	frlemmas=[le petit enfans]
les voleurs (5 units) : 1 selected units / 1 frlemmas = 1
	frlemmas=[voleur]

Propositions d'améliorations

  • [BP 2019-06-04] Pourrait s'appeler Stability, voire plus génériquement Token/Type Ratio (car non spécialisée Democrat dans le traitement effectué et son paramétrage).
  • [BP 2019-06-04] Adopter un ordre identique et interprétable pour les lignes correspondant au schémas dans les macros qui produisent un résultat de ce type (donc au moins Units Referential Stability et Schemas List) (tri sur la taille du schéma décroissante puis alphabétiquement sur le REF du schéma ?).
  • [LRV 2019-06-20 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]
  • Pour info, je n'ai pas les mêmes résultats en mettant les mêmes paramètres que vous
DEMOCRATLYON3 referential density: nUnites/nMots = 6292/33557 = 0.1875018625 = 18.7501862500%

Commande Schemas Progression

Recette et Bugs

BP 2019-06-05 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), testé sur la base des paramètres par défaut avec les filtrages suivants :
    • test 1 : schema_ursql = CHAINE@REF=.*loup.*
    • test 2 : minimum_schema_size = 30 et struct_prop = id (magnifique !)

Propositions d'améliorations

  • [BP 2019-06-05] Aider à l'utilisation de la légende :
    • liens hypertextes entre les items de la légende et les courbes ?
    • ordre de la légende : actuellement cela semble être par ordre d'entrée en scène (position de la première unité), à préciser dans la documentation, + réfléchir si cela pourrait être opportun de proposer d'autres tris (alphabétique, hiérarchique).
  • [LRV 2019-06-20 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]

2. supprimer la CHAINE des singletons, de référent “SI” je n'ai pas compris comment faire → à la main dans la structure des annotations (schémas > ref) ? 4. lancer la macro analec/exploit/SchemasProgression avec les paramètres suivants : sélection de schémas :

  • unit_ursql : MENTION
  • position_in_schema
  • limit_cql_limit :
  • strict_inclusion : false
  • position_in_matches
  • limit_distance : 0
  • struct_name : div
  • struct_prop_name : n
  • line_width : 1
  • cummulative
  • bande_width : 1.0f
  • show_title : false
  • show_legend : true

5. toujours avec le sous-corpus MontesquieuLois, lancer la macro analec/exploit/SchemasProgression avec les paramètres suivants :

  • sélection de schémas :
    • schema_ursql : CHAINE
    • minimum_schema_size : 3
    • maximum_schema_size : 999999
  • schema_property_display : REF
  • sélection d'unités :
    • unit_ursql : MENTION
    • limit_cql_limit : <div> [] expand to div
    • strict_inclusion : true
    • position_in_matches
    • limit_distance : 1
  • struct_name : div
  • struct_prop_name : n

Commande Schema Lengths

Recette et Bugs

BP 2019-06-04 (Ubuntu 16.04, TXM 0.8.0.201905291054 (0.8.02118), Extension URS 1.0.0.201905291052)

  • OK sur PERRAULTCONTES2 (corpus TXM pour 1ère livraison Democrat), aperçu du résultat avec les valeurs par défaut :
Longueur moyenne des chaînes de référence : 2188/137 = 15.9708029197
Index hiérarchique des longueurs de chaînes :
len	freq	cfreq
3	46	46	[emploi générique du pronom, le chemin du loup, la voix du loup, une certaine sorte de loup, la vaisselle d'or et d'argent, l'argent, le voyage de BB, les bonnes amies de la cadette, les deux grands gardemeubles, l'appartement bas, la porte du cabinet, l'ensemble des clefs de BB, là-haut, Dieu, la curiosité, les cordons du sac du chat botté, le marquis de Carabas, la rivière, les gardes du roi, la grande salle du château, les amis du maître du château, la veuve et sa fille ainée, la grande cruche, le don, les diamants, le plus beau flacon d'argent, les petits cailloux du PP, le bucheron, la bucheronne et leurs enfants, le seigneur du village, beaucoup d'autres gens, la porte de la maison de l'ogre, le mouton, le lit de l'ogre, la chair fraiche, le veau que la femme de l'ogre vient d'habiller, trois ogres, le grand lit des septs filles, l'or (texte 5), la tete des bébés ogresses, la chambre des ogresses, les bonnets des enfants des bucherons, en haut, l'évaouissement, le bucheron, la bucheronne, les enfants sauf le PP, le bucheron et les frères du PP, beaucoup d'enfants]
4	20	66	[la maison de la grand-mère du petit chaperon rouge, la chevillette, la porte de la maison de la grand-mère, tous les gens chez BB : Barbe-Bleue, la voisine, ses filles, les amis, le voisinage, le soleil, l'herbe, un plaisir bien léger, époux, les blés, le roi (texte 4), les enfants, la porte de la maion du PP, les dix écus, le couteau de l'ogre, la peur, l'autre lit dans la chambres des bébés ogresses, les couronnes d'or des ogresses, sept lieues, l'armée présente à deux cents lieues de la cour, quelques femmes qui chargent le PP de lettres pour leurs maris]
5	14	80	[la galette que le petit chaperon rouge porte chez mère grand, le petit pot de beurre que le petit chaperon rouge porte chez mère-grand, le lit de la grand-mère du petit chaperon rouge, la barbe de Barbe-Bleue, la voisine de Barbe-Bleue, la maison de BB, les deux perdrix attrapées par le chat botté, le carosse du roi, emploi générique du pronom (texte 4), l'honneteté, la maison de la veuve, la bouche de la cadette des deux filles de la veuve, les petits enfants, les voleurs]
8	7	87	[les deux filles de la voisine de Barbe-Bleue, les femmes que Barbe-Bleue a épousé, le sang des femmes du cabinet, le sac du chat botté, des moissonneurs, un beau château, la maison de l'ogre]
7	6	93	[la mère du petit chaperon rouge, une galette et un petit pot de beurre que le petit chaperon rouge doit aller porter chez mère-grand, les deux cavaliers, le lapin entré dans le sac du chat botté, le pain du PP, le roi (texte5)]
6	6	99	[le meusnier, de l'eau, une petite lueur, un rocher creux, des gens qui ne demeurent pas d'accord avec l'action du PP, l'un des enfants]
12	3	102	[emploi générique du pronom (texte 2), le fils du roi, le bois (texte 5)]
10	3	105	[la fille du roi, l'ainé des enfants des bucherons, emploi générique du pronom (texte 5)]
16	2	107	[les frères de la cadette, les bottes de sept lieues]
15	2	109	[le cabinet, la maison du PP]
9	2	111	[le pré fauché par les paysans, la fontaine]
161	1	112	[Le petit poucet]
158	1	113	[l'ogre]
145	1	114	[les enfants des bucherons]
129	1	115	[la cadette des deux soeurs]
107	1	116	[le chat botté]
106	1	117	[Barbe-Bleue]
80	1	118	[le cadet des fils du meunier]
70	1	119	[la femme de l'ogre]
67	1	120	[le petit chaperon rouge]
65	1	121	[la cadette des deux filles de la veuve]
54	1	122	[le loup]
53	1	123	[le roi]
47	1	124	[la bucheronne]
46	1	125	[le bucheron et la bucheronne]
42	1	126	[l'ainée des deux filles de la veuve]
41	1	127	[le bucheron]
35	1	128	[la veuve]
33	1	129	[le maître du château]
31	1	130	[Anne]
28	1	131	[la fée]
27	1	132	[la grand-mère du petit chaperon rouge]
26	1	133	[les frères du PP]
24	1	134	[les sept filles de l'ogre]
20	1	135	[la clef du cabinet]
14	1	136	[des paysans]
11	1	137	[les voisines et les bonnes amies]

Propositions d'améliorations

  • [BP 2019-06-04, 2019-06-07]
    • Un tri par longueur décroissante serait plus intéressant qu'un tri par fréquence décroissante (y compris pour l'interprétation de la colonne des fréquences cumulées). Le choix du tri pourrait éventuellement être un paramètre (avec comme valeur par défaut la longueur décroissante).
    • Ajouter 1 ou 2 colonne(s) de % (quel % représente la fréquence cumulée, et éventuellement idem pour la fréquence).
    • On a perdu le diagramme en bâtons de la distribution qu'on avait dans la mesure 1ère génération LongueurMoyenne ?
    • Pourrait s'appeler Schemas Length (avec Schemas au pluriel comme dans les autres commandes)
  • [LRV 2019-06-20 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]

Annotation d'unités par sélection

3. lancer la macro analec/edit/UnitsAnnotate avec les paramètres suivants :

  • schema_ursql : CHAINE
  • minimum_schema_size : 3
  • maximum_schema_size : 999999
  • unit_ursql : MENTION
  • position_in_schema
  • limit_cql_ limit : <div> [] expand to div
  • strict_inclusion : true
  • position_in_matches
  • limit_distance : 1
  • unit_property_nameto_set : PREMIERMAILLONDIV
  • unit_property_value_to_set : true
  • debug : false

Export

[LRV 2019-06-06 Windows 8.1 TXM 0.8.0.201905221544, Extension URS 1.0.0.201905241540]

Renommer un corpus

4. une fois l'export terminé, charger le corpus “RECETTEDEMOCRAT.txm” dont le chemin est indiqué dans la console ce n'est pas le cas pour moi

Export XML Glozz

4. importer les fichiers .aa, .aam et .ac générés dans Analec et vérifier les annotations je n'ai que .aa de créé

public/retours_de_bugs_logiciel/ext_urs_1.0.txt · Dernière modification: 2019/06/20 13:39 par vercruyssenlucie@gmail.com