Outils pour utilisateurs

Outils du site


public:specs_cooc_motmot

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:specs_cooc_motmot [2013/11/20 17:21]
benedicte.pincemin@ens-lyon.fr
public:specs_cooc_motmot [2017/03/02 10:50] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 1: Ligne 1:
-====== Fonctionnalité Cooccurrences ======+====== Fonctionnalité Cooccurrences ​"​Liste" ​======
  
 ===== Objectif ===== ===== Objectif =====
  
-Nous identifions plusieurs types de cooccurrences ​:  +Cette page va spécifier la cooccurrence dite liste 
-  * motif : l'actuelle ​calcul de cooccurrence ​dans TXM +  * Comment définir la liste de mot ? Par plusieurs CQL ? 
-  * généralisée : recherche la rencontre de tous les mots entre eux +  * Comment définir le contexte de rencontre ? Dans quelle mesure on peut réutiliser les contextes de l'actuel ​calcul de cooccurrence ​de TXM ? 
-  * liste de motif +  * Quelle visualisation sont souhaitées ? 
-  * ...+  * Quelles optimisations sont possibles ?
  
-Cette page va spécifier la cooccurence dite liste (similaire à celle réalisée dans hyperbase) 
- 
-Il faut aussi spécifier quelle visualisation est souhaitée. 
  
 ===== Méthode ===== ===== Méthode =====
Ligne 79: Ligne 76:
 (retour sur la base de l'​expérience de Bénédicte,​ 18 novembre 2013) (retour sur la base de l'​expérience de Bénédicte,​ 18 novembre 2013)
  
-  * rendre possible une fenêtre en mots +  * rendre possible une fenêtre en mots (ou a minima s'​assurer que le choix d'une fenêtre en structure fonctionne)
-  * (ou a minima s'​assurer que le choix d'une fenêtre en structure fonctionne)+
   * la valeur par défaut de la distance doit être 1 si c'est une distance en structures par défaut, 20 convient si on est par défaut sur une distance en mots   * la valeur par défaut de la distance doit être 1 si c'est une distance en structures par défaut, 20 convient si on est par défaut sur une distance en mots
 +  * prendre en charge les index sur plusieurs propriétés croisées (en utilisant l'​opérateur & dans les requêtes de la matrice)
   * indiquer explicitement des conditions favorables de test :   * indiquer explicitement des conditions favorables de test :
     * limiter la taille de l'​index à 100 (Vmax = 100) (ou moins) (pour la lisibilité de l'AFC)     * limiter la taille de l'​index à 100 (Vmax = 100) (ou moins) (pour la lisibilité de l'AFC)
-    * éliminer toutes ​les graphies ambiguës (ex. sur Discours avec Vmax=100 ​: [pos="​Nc.*" ​& word!="fait|tout"])+    * reprendre la condition de filtrage dans l'​affichage de l'​index pour éviter les (grosses) dérives sur les graphies ambiguës (ex. sur Discours avec Vmax=100, "​fait"​ et "​tout"​ doivent rester des pos="​Nc.*" ​dans le calcul de la cooccurrence ; sur Témoignages,​ on avait le cas de "un" ​; etc.)
  
 +=== Corrections effectuées ===
 +  * Rétablissement de la fenêtre en mot : L'​interface actuelle permet de :
 +    * Définir une distance en mot
 +    * Limiter la rencontre par une structure. Si aucune structure n'est choisie, la structure '​text'​ est la limite.
 +  * La distance actuelle n'​affecte que la distance en mot. Peut-être on pourra rajouter une distance en structure.
 +  * Pour les conditions favorables, indiquer ça ou ? Dans un tuto, doc, l'​interface utilisateur de TXM ?
  
 ==== Relation entre Cooccurrences et Cooccurrences Mots-Mots ==== ==== Relation entre Cooccurrences et Cooccurrences Mots-Mots ====
Ligne 91: Ligne 94:
   * Cooccurrences : pourrait remplir une ligne (ou une colonne) de la matrice   * Cooccurrences : pourrait remplir une ligne (ou une colonne) de la matrice
     * Rq. Cela produit une matrice de nature différente (non sysmétrique),​ donc pas exploitable de la même manière, et peut-être pas non plus ce qu'on chercherait à obtenir.     * Rq. Cela produit une matrice de nature différente (non sysmétrique),​ donc pas exploitable de la même manière, et peut-être pas non plus ce qu'on chercherait à obtenir.
 +
 +
 +==== Extension QueryCooccurence ====
 +
 +Le prototype de macro de matrice de cooccurrence a été transformé et augmenté en une extension : [[public:​specs_dev_rcp:​specs_ext_querycooccurences|QueryCooccurrences]]
  
 ===== Protocole de test ===== ===== Protocole de test =====
public/specs_cooc_motmot.1384964498.txt.gz · Dernière modification: 2013/11/20 17:21 par benedicte.pincemin@ens-lyon.fr