Outils pour utilisateurs

Outils du site


public:specs_cooc_motmot

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:specs_cooc_motmot [2013/11/21 14:23]
matthieu.decorde@ens-lyon.fr
public:specs_cooc_motmot [2017/03/02 10:50]
matthieu.decorde@ens-lyon.fr
Ligne 1: Ligne 1:
-====== Fonctionnalité Cooccurrences ======+====== Fonctionnalité Cooccurrences ​"​Liste" ​======
  
 ===== Objectif ===== ===== Objectif =====
  
-Nous identifions plusieurs types de cooccurrences ​:  +Cette page va spécifier la cooccurrence dite liste 
-  * motif : l'actuelle ​calcul de cooccurrence ​dans TXM +  * Comment définir la liste de mot ? Par plusieurs CQL ? 
-  * généralisée : recherche la rencontre de tous les mots entre eux +  * Comment définir le contexte de rencontre ? Dans quelle mesure on peut réutiliser les contextes de l'actuel ​calcul de cooccurrence ​de TXM ? 
-  * liste de motif +  * Quelle visualisation sont souhaitées ? 
-  * ...+  * Quelles optimisations sont possibles ?
  
-Cette page va spécifier la cooccurence dite liste (similaire à celle réalisée dans hyperbase) 
- 
-Il faut aussi spécifier quelle visualisation est souhaitée. 
  
 ===== Méthode ===== ===== Méthode =====
Ligne 81: Ligne 78:
   * rendre possible une fenêtre en mots (ou a minima s'​assurer que le choix d'une fenêtre en structure fonctionne)   * rendre possible une fenêtre en mots (ou a minima s'​assurer que le choix d'une fenêtre en structure fonctionne)
   * la valeur par défaut de la distance doit être 1 si c'est une distance en structures par défaut, 20 convient si on est par défaut sur une distance en mots   * la valeur par défaut de la distance doit être 1 si c'est une distance en structures par défaut, 20 convient si on est par défaut sur une distance en mots
 +  * prendre en charge les index sur plusieurs propriétés croisées (en utilisant l'​opérateur & dans les requêtes de la matrice)
   * indiquer explicitement des conditions favorables de test :   * indiquer explicitement des conditions favorables de test :
     * limiter la taille de l'​index à 100 (Vmax = 100) (ou moins) (pour la lisibilité de l'AFC)     * limiter la taille de l'​index à 100 (Vmax = 100) (ou moins) (pour la lisibilité de l'AFC)
-    * éliminer toutes ​les graphies ambiguës (ex. sur Discours avec Vmax=100 ​: [pos="​Nc.*" ​& word!="fait|tout"])+    * reprendre la condition de filtrage dans l'​affichage de l'​index pour éviter les (grosses) dérives sur les graphies ambiguës (ex. sur Discours avec Vmax=100, "​fait"​ et "​tout"​ doivent rester des pos="​Nc.*" ​dans le calcul de la cooccurrence ; sur Témoignages,​ on avait le cas de "un" ​; etc.)
  
 === Corrections effectuées === === Corrections effectuées ===
Ligne 96: Ligne 94:
   * Cooccurrences : pourrait remplir une ligne (ou une colonne) de la matrice   * Cooccurrences : pourrait remplir une ligne (ou une colonne) de la matrice
     * Rq. Cela produit une matrice de nature différente (non sysmétrique),​ donc pas exploitable de la même manière, et peut-être pas non plus ce qu'on chercherait à obtenir.     * Rq. Cela produit une matrice de nature différente (non sysmétrique),​ donc pas exploitable de la même manière, et peut-être pas non plus ce qu'on chercherait à obtenir.
 +
 +
 +==== Extension QueryCooccurence ====
 +
 +Le prototype de macro de matrice de cooccurrence a été transformé et augmenté en une extension : [[public:​specs_dev_rcp:​specs_ext_querycooccurences|QueryCooccurrences]]
  
 ===== Protocole de test ===== ===== Protocole de test =====
public/specs_cooc_motmot.txt · Dernière modification: 2017/03/02 10:50 par matthieu.decorde@ens-lyon.fr