Outils pour utilisateurs

Outils du site


public:extensions_alpha

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision Les deux révisions suivantes
public:extensions_alpha [2019/05/23 12:30]
matthieu.decorde@ens-lyon.fr
public:extensions_alpha [2019/07/16 16:31]
matthieu.decorde@ens-lyon.fr [TIGERSearch]
Ligne 93: Ligne 93:
 === Utilisation === === Utilisation ===
  
-== Import ​d'​un ​fichier ​au format TIGER-XML ​==+== Préparation du corpus == 
 + 
 +** Avec le module ​d'import XML-TS ** 
 + 
 +Le module importe ​un corpus XML-TS (TIGER XML) au format ​main/master + subcorpus. Il est disponible à coté des autres modules dans le menu "​Fichier > Import > XML-TS"​. 
 + 
 +Le module créé un corpus CQP à partir des noeuds terminaux des fichiers XML-TS et un corpus ​TIGER (qui sera utiliser pour résoudre les requêtes TIGER).  
 + 
 +Le corpus CQP créé contient : 
 +  * un "​text"​ par fichier subcorpus du XML-TS dont l'​identifiant est extrait du fichier master. 
 +  * une structure "​s"​ par sentence TIGER 
 +  * un mot par noeuds terminal dont les propriétés sont extraites directement des features des noeuds 
 + 
 +** A partir d'un corpus TIGER ** 
 + 
 +On peut importer des annotations TIGER à partir d'un corpus binaire TIGER portant le même nom que le corpus CQP. 
 + 
 +La couverture du corpus CQP se fait à l'aide des identifiants de mots partagés entre les corpus CQP et les identifiants "​editionId"​ des noeuds T des fichiers ​XML-TS. L'​ajout des annotations peut gérer le cas ou la couverture du corpus CQP est partielle. (Par exemple, si les ponctuations sont absentes dans la version TIGER). 
 + 
 +** Manuelle - obsolète **
  
 Pour pouvoir faire des requêtes TIGERSearch depuis TXM, que ce soit dans la version portail ou la version pour poste, il faut importer le corpus au format TIGER-XML dans TXM de la façon suivante : Pour pouvoir faire des requêtes TIGERSearch depuis TXM, que ce soit dans la version portail ou la version pour poste, il faut importer le corpus au format TIGER-XML dans TXM de la façon suivante :
Ligne 124: Ligne 143:
 </​note>​ </​note>​
  
-== Utilisation du moteur de requêtes ​TIGERSearch ==+== Requêtes ​TIGERSearch ==
  
 Pour ouvrir l'​éditeur TIGERSearch dans TXM, il faut sélectionner le corpus et appeler la commande "​TIGERSearch"​ depuis le menu contextuel de la vue Corpus, le menu principal "​Outils"​ ou la barre d'​outil (icone {{http://​portal.textometrie.org/​demo/​images/​icons/​functions/​TS.png|}}). Pour ouvrir l'​éditeur TIGERSearch dans TXM, il faut sélectionner le corpus et appeler la commande "​TIGERSearch"​ depuis le menu contextuel de la vue Corpus, le menu principal "​Outils"​ ou la barre d'​outil (icone {{http://​portal.textometrie.org/​demo/​images/​icons/​functions/​TS.png|}}).
Ligne 132: Ligne 151:
 == Index et Concordance == == Index et Concordance ==
  
-L'​extension ajoute un moteur de résolution de requête "​TIGER"​ aux outils Index et Concordance.+L'​extension ajoute un moteur de résolution de requête "​TIGER"​ aux outils Index et Concordance. La requête TIGER permet d'​exprimer des sélections de token selon des critères syntaxiques. 
 + 
 +Si la requête ne contient pas de label alors, l'​index et la concordance afficheront les mots recouvert par l'​essemble des noeuds TIGER sélectionnés. Si la requête contient le label "#​pivot"​ alors seul les mots recouverts par le noeud "#​pivot"​ seront affichés.
  
 +== Macros ==
  
 +Voir : [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​spec_exploitation_annotation/​calculs_syntax_sov#​v1]]
 ==== Dictionary ==== ==== Dictionary ====
  
public/extensions_alpha.txt · Dernière modification: 2019/10/01 11:06 par matthieu.decorde@ens-lyon.fr