Outils pour utilisateurs

Outils du site


public:tutoriel_correction_mots

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:tutoriel_correction_mots [2018/04/25 10:22]
alexei.lavrentev@ens-lyon.fr
public:tutoriel_correction_mots [2018/06/19 17:35] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 41: Ligne 41:
         * il est inutile d'​exporter la propriété "​word"​ (forme du mot), car vous ne pourrez pas "​réinjecter"​ les corrections des formes de mots         * il est inutile d'​exporter la propriété "​word"​ (forme du mot), car vous ne pourrez pas "​réinjecter"​ les corrections des formes de mots
       * **query** : une requête CQL pour produire la concordance       * **query** : une requête CQL pour produire la concordance
-        * exemple 1 : [] pour produire la concordance de tous les mots du corpus ; +        * exemple 1 : %%[]%% pour produire la concordance de tous les mots du corpus ; 
-        * exemple 2 : [frpos="​N.*"​] pour produire la concordance de ce qui a été étiqueté comme nom.+        * exemple 2 : %%[frpos="​N.*"​]%% pour produire la concordance de ce qui a été étiqueté comme nom.
         * remarque : la requête peut s'​étendre sur plusieurs mots. Seul le premier mot de la séquence sera considéré dans les mises à jour.         * remarque : la requête peut s'​étendre sur plusieurs mots. Seul le premier mot de la séquence sera considéré dans les mises à jour.
       * **contextsize** : le nombre de mots avant et après le pivot       * **contextsize** : le nombre de mots avant et après le pivot
Ligne 107: Ligne 107:
  
 Nous allons corriger la propriété morphosyntaxique et le lemme des mots débutants la séquence "NOM suivi de NAM". Cette succession de catégories est en effet souvent mal étiquetée par TreeTagger comme on peut le voir dans la concordance suivante dans ce corpus : Nous allons corriger la propriété morphosyntaxique et le lemme des mots débutants la séquence "NOM suivi de NAM". Cette succession de catégories est en effet souvent mal étiquetée par TreeTagger comme on peut le voir dans la concordance suivante dans ce corpus :
-  * requête : [frpos="​NOM"​][frpos="​NAM"​] ;+  * requête : %%[frpos="​NOM"​][frpos="​NAM"​] ;%%
   * propriétés affichées du pivot : word, frpos et frlemma.   * propriétés affichées du pivot : word, frpos et frlemma.
  
Ligne 127: Ligne 127:
   * Lancer la macro BuildWordPropTable avec les paramètres suivants :   * Lancer la macro BuildWordPropTable avec les paramètres suivants :
     * properties : frpos,​frlemma ​        (nous allons corriger des lemmes et des catégories morpho-syntaxiques)     * properties : frpos,​frlemma ​        (nous allons corriger des lemmes et des catégories morpho-syntaxiques)
-    * query : <​nowiki>​[frpos="​NOM"​][frpos="​NAM"​]</​nowiki>​+    * query : %%[frpos="​NOM"​][frpos="​NAM"​]%%
     * contextsize : 10     * contextsize : 10
     * references : text_id, p_n     * references : text_id, p_n
Ligne 201: Ligne 201:
   * le nouveau corpus '​VOEUXTXMCORRIGE'​ est créé   * le nouveau corpus '​VOEUXTXMCORRIGE'​ est créé
  
-Pour vérifier les corrections,​ vous pouvez faire la concordance de [word="​c.*"​%c][frpos="​NAM"​] dans ce corpus en affichant+Pour vérifier les corrections,​ vous pouvez faire la concordance de %%[word="​c.*"​%c][frpos="​NAM"​]%% dans ce corpus en affichant
 les propriétés word_frpos_frlemma dans la colonne de pivot. Vous devriez obtenir : les propriétés word_frpos_frlemma dans la colonne de pivot. Vous devriez obtenir :
 <​code>​ <​code>​
public/tutoriel_correction_mots.txt · Dernière modification: 2018/06/19 17:35 par matthieu.decorde@ens-lyon.fr