Specifications des Mesures

Les mesures

Un chantier développe des mesures d'un point de vue théorique.

Un chantier développe une réponse à des demandes appliquées de mesures :

Interface

Ouverture de l'interface des mesures

A partir d'une sélection :

  • d'une partition
  • ou peut-être de plusieurs corpus/sous-corpus
    • Permettrait de comparer des corpus CQP indépendants (par ex. de -gros- romans)
    • Mais où accrocher le résultat dans la vue corpus ?
      • dans un seul des corpus sélectionné ? (bof)
      • Dans tous les corpus/sous-corpus sélectionnés ? (pas terrible non plus)

Description général de l'éditeur Mesures

  • 2 zones :
    • zone formulaire
    • zone tableau résultat
  • Les mesures sont ajoutées au fur et à mesure
  • Le nom de la mesure est unique
    • donné par l'utilisateur
    • Cela permet de savoir si il faut rajouter un résultat ou le remplacer.
    • Rq. Une mesure peut correspondre à plusieurs lignes du tableau (lorsqu'on utilise plusieurs synthèses, ou pour une mesure de proportions)
  • possibilité de repartir de mesures déjà définies :
    • les paramètres peuvent être sauvés dans:
      • $TXMHOME/parametres/mesures/
      • ou dans un corpus binaire (import.xml pour l'instant).
        • Permet une certaine cohérence de la mesure ?
    • Format de stockage
      • XML : éditable et transportable facilement
      • BDD

Zone Formulaire

  • on doit pouvoir cacher/afficher cette zone qui peut être assez volumineuse.
  • un bouton “Ajouter/Remplacer” : en fonction du nom de la mesure

Paramètres permanents

Partagés par toutes les mesures :

  • Nom de la mesure : champ texte
    • Est unique
    • Si le nom est déjà utilisé, alors la mesure sera remplacée par la nouvelle (Avec un message d'alerte)
  • Type : Liste déroulante à choix unique
    • Valeurs :
      • étendue : ampleur, (profondeur),
      • paradigmatique : proportions, diversité,
      • syntagmatique : ratio, dépendance, cadence, taux de présence linéaire.
    • De la forme : Catégorie - Type
    • l'ordre n'est pas alphabétique et est défini en dur.
    • Le choix met à jour l'échelle et les paramètres variables.
  • Domaine : Requête CQL (construit un sous-corpus avant le calcul)
  • Multiple : bouton check
    • si on le coche cela active le champ “Synthèses”
  • Synthèses : Liste à choix multiple non ordonné
    • Valeurs : moyenne, min, max, écart-type, quartile1, médiane, quartile3, diffusion, intensité, (distribution)
    • La valeur par défaut est la moyenne
  • Echelle : Liste déroulante éditable et numéraire (fr?)
    • Valeurs : 1, 100, 1000.
    • La valeur par défaut dépend de la mesure sélectionnée

Paramètres variables

En fonction du type de la mesure sélectionné :

  • CQLs associés à la mesure
  • Propriété
  • Unité (structure)
Proposition

Chaque mesure déclare ses besoins en CQL en donnant une liste de noms+type :

  • tout + simple
  • cas + simple
  • cas + multiple
  • ref + simple
  • lié + simple

Pour la mesure Proportion, si propriété est sélectionnée alors le calcul se fera sur les valeurs de la propriété

besoins par mesure

Mesures domaine unité prop synt requetes Diversité o n o o cas Magnitude o o n o n Presence o o n o cas Proportion o n (o) o all,(Xcas)

  • ampleur
    • unité
  • profondeur
    • structures
  • proportions
    • cql_tout
    • liste_cql_cas ou +propriété
  • diversité
    • cql
    • propriété
  • ratio
    • cql_ref
    • cql_lie
  • dépendance
    • cql_tout
    • liste_cql_elements
  • cadence
    • unité
    • cql
  • taux de présence linéaire
    • unité
    • cql

Zone Résultats

  • Tri hiérarchique si utile
  • Pouvoir choisir les colonnes à afficher car le nom de colonne peut être assez grand en fonction du nombre d'objets analysés.
    • une première étape peut être : afficher tout VS étiquette + résultats

Selection

  • Lorsqu'on sélectionne une ligne → sélection de toutes les lignes de la même mesure
    • Comme ça on sait quelle mesure on va manipuler
  • Menu contextuel :
    • lire les paramètres : rafraîchit le formulaire avec les valeurs utilisées par la mesure
    • renommer : permet de renommer la mesure rapidement
    • supprimer : supprime la mesure

Les colonnes du tableau résultat

  • Etiquette : l'étiquette de la ligne.
    • Par défaut, se compose à partir de : nom de la mesure + synthèse + cas (n°).
    • éditable
  • Nom : nom de la mesure donné par l'utilisateur. Avec donc éventuellement plusieurs lignes associées. [Nom = étiquette
  • Type : type de la mesure (ex: Proportion, Diversité, Ampleur…)
  • Synthèse : la ou l'une des synthèses de la mesure
  • Cas : le ou l'un des cas de la mesure
  • Résultats
    • Une colonne par objet (Partie, corpus ou sous-corpus) étudié

Il faudrait voir qd même si on peut indiquer une chaîne de caractères pour étiqueter chaque cas, sinon c'est pénible, dès qu'on recalcule on doit rééditer toutes les étiquettes à la main, car les numéros ce n'est pas lisible.

Liens

question

comment tester en concordance ou index une requête cql sur partition + domaine

  • réponse : en concaténant les concordances des objets étudiés
  • Prévoir un éditeur capable de contaténer les résultats de concordances

Vers concordances

Vers index

Préférences

  • Nom court des synthèses
public/specs_interface_mesures.txt · Dernière modification: 2016/10/07 17:34 par slh@ens-lyon.fr