Outils pour utilisateurs

Outils du site


public:specs_dimensions

Table des matières

Dimensions

La commande dimensions permet d'afficher la taille d'un objet en mots.

Pour un corpus ou un sous-corpus la taille est le nombre de mots. Pour une partition, on affiche une taille par partie.

Calcul du nombre de mots:

  1. Dans une première version, le nombre de mot est le nombre de tokens CQP
  2. Dans une deuxième version, le nombre de mot est le nombre de token CQP sélectionné par une requête représentant les mots du corpus. On peut vouloir par exemple exclure les ponctuations, limiter la taille au corps du texte, etc. → paramètre requête

Affichage de la taille :

  1. Dans une première version, la taille est affichée dans la console
  2. Dans une deuxième version, la taille est affichée dans un tableau avec une colonne par corpus, sous-corpus ou partie sélectionnée
  3. Dans une troisième version, la taille est affichée dans un graphique :
    • histogramme
    • etc.

Récursivité : pour un corpus structuré, on peut affiché les dimensions inférieures à l'aide d'un Treemap (voir Macro TreeMapDimensions)

Existant :

  • commande dimansions du portail (affiche le nombre de token du corpus)
  • commande PartitionDimensions de la RCP (affiche un bar chart des tailles des parties) : [[
  • macro TreeMapDimensions (affiche un Treemap des tailles des structures d'un corpus)

Solution

TXM 0.8.0

Seuls les dimensions de partition sont disponibles, sans filtrage par CQL, sous la forme d'un histogramme.

public/specs_dimensions.txt · Dernière modification : 08/02/2020 19:00 de matthieu.decorde@ens-lyon.fr