Pour l'instant le calcul prend en entrée : - une liste de requêtes (voir si dessous pour l'origine de cette liste) - un corpus - une distance de 0 à N - un poids minimum pour former un arc de graphique de 1 à M - une ou plusieurs structures de contexte - optionnel - et enfin un fichier pour écrire le graphique au format “graphml”

La liste de requête peut être générée de 2 façons : - à partir des réalisations d'une requête d'un index. Un peu comme ce que fait le lien “Index vers Concordances” (@Bénédicte : les requêtes générées soufrent du même défaut que le lien Index-Concordance, cad la non reprise de la requête initiale de l'Index) - à partir d'une nouvelle fonctionnalité qui pour l'instant s'appelle “QueryIndex”. Cet fonctionnalité ressemble à la fonctionnalité Index, mais au lieu de créé un nombre de ligne égale au nombre de réalisation de la requête , elle créé une ligne par requête (et regroupe tous les décomptes des réalisations de la requête) - c'est l'équivalent de la fonctionnalité Liste d'hyperbase, si je ne me trompe pas de nom.

Voici quelques propositions d'amélioration : - ajouté comme attribut de noeud : la fréquence brute, l'indice de spécificité - retirer les noeuds qui ont un degré trop élevé (comme les verbes “etre” et “avoir” du graph des verbes)

Quoi que vous en pensez ? pour vous lâcher sur les commentaire, je viens de créer cette page de wiki :

public/specifications_cooccurrences_mots_mots.txt · Dernière modification: 2013/03/27 16:35 par matthieu.decorde@ens-lyon.fr