Les listes CQP (en cours d'écriture)

Le moteur de recherche CQP utilisé par TXM permet d'équiper les requêtes CQL de listes de valeurs : http://cwb.sourceforge.net/files/CQP_Tutorial/node31.html

Il est possible de faire appel à ces listes dans TXM.

Préparations

  1. copier le fichier “cqpserver.init” du répertoire cwb de votre répertoire d'installation de TXM
    • Windows : C:/program files/TXM/cwb
    • Linux : /usr/lib/TXM/cwb
    • Mac OS X : /Applications/TXM/cwb
  2. coller ce fichier dans le répertoire utilisateur de TXM
    • Windows : C:/Utilisateurs/<login>/TXM
    • Linux : /home/<login>/TXM
    • Mac OS X : /Users/<moi>
  3. nous allons utiliser ce nouveau fichier pour la suite.

Le fichier cqpserver.ini

Le fichier “cqpserver.ini” est un fichier qui est exécuté au lancement du moteur de recherche, c'est à dire au lancement de TXM. C'est dans ce fichier que l'on va déclarer et initialiser nos listes.

Attention : si il y a une erreur de syntaxe dans le fichier cqpserver.ini, alors le moteur ne pourra se lancer

La suite de cette section reprend la documentation officielle de CWB.

Création d'une liste

La création de liste se fait assez simplement en une ligne.

Simple

Si dans le fichier cqpserver.ini on rajoute la ligne suivante.

define $week = "Monday Tuesday Wednesday Thursday Friday";
Alors la variable $week pourra être utilisée dans les requêtes CQL.

== A partir d'un fichier ==
En cas de liste longue, ou pour simplifier la gestion de listes, on peut définir une liste à partir d'un fichier :
<code> define $week < ”/home/<moi>/weekdays.txt”;</code>

Utilisation d'une liste

Simple

Si on reprend la liste $week crée précedement, alors la requête
<code>[lemma = $week];</code> attrapera les mots “Monday”, “Tuesday”, “Wednesday”, “Thursday” et “Friday”.

Il faut faire attention, car une liste CQL n'est pas une suite d'expression régulière et donc ne profite pas des caractères spéciaux ni les options %c et %d.

Avec expression régulière

Pour que CQP interprète la liste comme une liste d'expression régulière, alors il faut écrire la requête comme suit :

[word = RE($pref)];
Et en utilisant les options cela donne :
[word = RE($pref) %cd];

public/tutoriel_listes_cqp.txt · Dernière modification: 2013/04/23 08:41 par matthieu.decorde@ens-lyon.fr