Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
public:specs_cooc_motmot [2013/10/29 17:42] matthieu.decorde@ens-lyon.fr |
public:specs_cooc_motmot [2017/03/02 10:50] (Version actuelle) matthieu.decorde@ens-lyon.fr |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Fonctionnalité Cooccurrences ====== | + | ====== Fonctionnalité Cooccurrences "Liste" ====== |
===== Objectif ===== | ===== Objectif ===== | ||
- | Nous identifions plusieurs types de cooccurrences : | + | Cette page va spécifier la cooccurrence dite liste : |
- | * motif : l'actuelle calcul de cooccurrence dans TXM | + | * Comment définir la liste de mot ? Par plusieurs CQL ? |
- | * généralisée : recherche la rencontre de tous les mots entre eux | + | * Comment définir le contexte de rencontre ? Dans quelle mesure on peut réutiliser les contextes de l'actuel calcul de cooccurrence de TXM ? |
- | * liste de motif | + | * Quelle visualisation sont souhaitées ? |
- | * ... | + | * Quelles optimisations sont possibles ? |
- | Cette page va spécifier la cooccurence dite liste (similaire à celle réalisée dans hyperbase) | ||
- | |||
- | Il faut aussi spécifier quelle visualisation est souhaitée. | ||
===== Méthode ===== | ===== Méthode ===== | ||
Ligne 76: | Ligne 73: | ||
* Liste de requêtes CQL | * Liste de requêtes CQL | ||
* Attention cependant, pour le calcul des cooccurrences la sélection ne se fait plus par la requête CQL d'origine mais par la valeur de la propriété d'analyse. | * Attention cependant, pour le calcul des cooccurrences la sélection ne se fait plus par la requête CQL d'origine mais par la valeur de la propriété d'analyse. | ||
+ | === macro Matrice MotsMots : ce qu'il faudrait faire avant diffusion === | ||
+ | (retour sur la base de l'expérience de Bénédicte, 18 novembre 2013) | ||
+ | |||
+ | * rendre possible une fenêtre en mots (ou a minima s'assurer que le choix d'une fenêtre en structure fonctionne) | ||
+ | * la valeur par défaut de la distance doit être 1 si c'est une distance en structures par défaut, 20 convient si on est par défaut sur une distance en mots | ||
+ | * prendre en charge les index sur plusieurs propriétés croisées (en utilisant l'opérateur & dans les requêtes de la matrice) | ||
+ | * indiquer explicitement des conditions favorables de test : | ||
+ | * limiter la taille de l'index à 100 (Vmax = 100) (ou moins) (pour la lisibilité de l'AFC) | ||
+ | * reprendre la condition de filtrage dans l'affichage de l'index pour éviter les (grosses) dérives sur les graphies ambiguës (ex. sur Discours avec Vmax=100, "fait" et "tout" doivent rester des pos="Nc.*" dans le calcul de la cooccurrence ; sur Témoignages, on avait le cas de "un" ; etc.) | ||
+ | |||
+ | === Corrections effectuées === | ||
+ | * Rétablissement de la fenêtre en mot : L'interface actuelle permet de : | ||
+ | * Définir une distance en mot | ||
+ | * Limiter la rencontre par une structure. Si aucune structure n'est choisie, la structure 'text' est la limite. | ||
+ | * La distance actuelle n'affecte que la distance en mot. Peut-être on pourra rajouter une distance en structure. | ||
+ | * Pour les conditions favorables, indiquer ça ou ? Dans un tuto, doc, l'interface utilisateur de TXM ? | ||
==== Relation entre Cooccurrences et Cooccurrences Mots-Mots ==== | ==== Relation entre Cooccurrences et Cooccurrences Mots-Mots ==== | ||
Ligne 81: | Ligne 94: | ||
* Cooccurrences : pourrait remplir une ligne (ou une colonne) de la matrice | * Cooccurrences : pourrait remplir une ligne (ou une colonne) de la matrice | ||
* Rq. Cela produit une matrice de nature différente (non sysmétrique), donc pas exploitable de la même manière, et peut-être pas non plus ce qu'on chercherait à obtenir. | * Rq. Cela produit une matrice de nature différente (non sysmétrique), donc pas exploitable de la même manière, et peut-être pas non plus ce qu'on chercherait à obtenir. | ||
+ | |||
+ | |||
+ | ==== Extension QueryCooccurence ==== | ||
+ | |||
+ | Le prototype de macro de matrice de cooccurrence a été transformé et augmenté en une extension : [[public:specs_dev_rcp:specs_ext_querycooccurences|QueryCooccurrences]] | ||
===== Protocole de test ===== | ===== Protocole de test ===== |