Outils pour utilisateurs

Outils du site


public:specs_index

Index

Objectif

Pouvoir lister et dénombrer des informations d'un corpus notamment :

  • les propriétés de mots
  • les propriétés de structures

Pouvoir sélectionner les mots.

Pouvoir varier sur ce qui est dénombré, par défaut la forme. Mais on peut vouloir “croiser” des propriétés.

La fonctionnalité s’intéresse d'abord aux mots. Si on souhaite juste lister les valeurs possibles pour une propriété, il faudrait une autre commande ?

Méthode

Commencer par les propriétés de mots et leur formes

Puis pouvoir trier sur les colonnes du tableau résultat

Puis pouvoir sélectionner les mots (dans un premier temps, on s'intéresse à tous les mots = commande Lexique)

Puis pouvoir choisir la propriété à dénombrer

Puis pouvoir exporter le résultat dans un fichier

Puis pouvoir filtrer les lignes (fréquences, nombre de lignes …)

Puis pouvoir croiser les propriétés

Puis pouvoir aller vers d'autres calculs depuis l'Index

Puis pouvoir choisir des propriétés de structures au lieu de propriété de mot

Puis pouvoir utiliser plusieurs requêtes de sélection

Puis pouvoir choisir de projeter ou pas une requête (cf commande QueryIndex)

Index syntaxique

Exploiter les propriétés d'objets syntaxiques extraits à partir d'une requête TIGER (noeuds terminaux=mots ou non-terminaux).

Solution Profiterole 1.0

Extraction de propriétés de terminaux à partir d'une requête TIGER (ticket).

Nécessite l'import TIGER idoine (ticket).

Solution

TXM 0.7.8

L'index actuel permet de :

  • sélectionner des mots avec une CQL
  • sélectionner une ou plusieurs propriétés de mots
  • trier sur la forme et la fréquence
  • aller vers les concordances ou progression avec une requête CQL construite sur la ligne sélectionnée (et pas sur la requête d'origine)
  • filtrer les résultats par : Fmin, Fmax, Vmax
  • exporter dans un fichier TSV
  • paginer les résultats
public/specs_index.txt · Dernière modification: 2019/01/25 15:47 par matthieu.decorde@ens-lyon.fr