Outils pour utilisateurs

Outils du site


public:specs_index

Index

Pouvoir lister et dénombrer des informations d'un corpus notamment :

  • les propriétés de mots
  • les propriétés de structures

Pouvoir sélectionner les mots.

Pouvoir varier sur ce qui est dénombré, par défaut la forme. Mais on peut vouloir “croiser” des propriétés.

La fonctionnalité s’intéresse d'abord aux mots. Si on souhaite juste lister les valeurs possibles pour une propriété, il faudrait une autre commande ?

Spécifications

Commencer par les propriétés de mots et leur formes

  1. Puis pouvoir trier sur les colonnes du tableau résultat
  2. Puis pouvoir sélectionner les mots (dans un premier temps, on s'intéresse à tous les mots = commande Lexique)
  3. Puis pouvoir choisir la propriété à dénombrer
  4. Puis pouvoir exporter le résultat dans un fichier
  5. Puis pouvoir filtrer les lignes (fréquences, nombre de lignes …)
  6. Puis pouvoir croiser les propriétés
  7. Puis pouvoir aller vers d'autres calculs depuis l'Index
  8. Puis pouvoir choisir des propriétés de structures au lieu de propriété de mot
  9. Puis pouvoir utiliser plusieurs requêtes de sélection
  10. Puis pouvoir choisir de projeter ou pas une requête (cf commande QueryIndex)

Liens de lignes d'index

Vers une concordance

V1 (TXM 0.8.1 et avant)

Construire une requête à partir des lignes d'index sélectionnées.

Limites : la requête construite ne prend pas en compte la requête de l'index.

V2 (TXM 0.8.2)

Pour tenir compte de la requête de l'index, on peut :

  1. construire une requête combinée entre les lignes sélectionnée et la requête de l'index → compliqué
  2. appliquer la requête des lignes sur la sélection de l'index

La solution 1 est trop compliquée la 2 est + simple à implémenter car on peut s'appuyer sur un sous-corpus de la requête de l'index.

Il faut faire évoluer les résultats TXM pour pouvoir afficher une concordance enfant de l'index. Le focus des concordances ouvertes depuis l'index sont construites sur un sous-corpus caché et persisté.

A FAIRE : discuter de la possibilité de ne pas persister le sous-corpus et des répercutions sur l'internal persistance des TXMResults

Vers une cooccurrences

V1

Construire une requête à partir des lignes d'index sélectionnées.

Limites : le focus construit ne prend pas en compte la requête de l'index.

Vers une progression

V1

Construire une requête à partir des lignes d'index sélectionnées.

Limites : le focus construit ne prend pas en compte la requête de l'index.

Index syntaxique

Exploiter les propriétés d'objets syntaxiques extraits à partir d'une requête TIGER (noeuds terminaux=mots ou non-terminaux).

Solution Profiterole 1.0

Extraction de propriétés de terminaux à partir d'une requête TIGER (ticket).

Nécessite l'import TIGER idoine (ticket).

Solution

TXM 0.7.8

L'index actuel permet de :

  • sélectionner des mots avec une CQL
  • sélectionner une ou plusieurs propriétés de mots
  • trier sur la forme et la fréquence
  • aller vers les concordances ou progression avec une requête CQL construite sur la ligne sélectionnée (et pas sur la requête d'origine)
  • filtrer les résultats par : Fmin, Fmax, Vmax
  • exporter dans un fichier TSV
  • paginer les résultats
public/specs_index.txt · Dernière modification : 15/03/2022 15:06 de matthieu.decorde@ens-lyon.fr