Outils pour utilisateurs

Outils du site


public:specs_ajout_moteur_resolution_annotation

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:specs_ajout_moteur_resolution_annotation [2019/05/23 11:20]
matthieu.decorde@ens-lyon.fr
public:specs_ajout_moteur_resolution_annotation [2021/06/25 10:02] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 11: Ligne 11:
   * XQuery : finesse d'​expression de contraintes sur les balises XML source ou pivot (gestion min/maj, accents, etc.), langage XPath de navigation dans l'​arbre DOM   * XQuery : finesse d'​expression de contraintes sur les balises XML source ou pivot (gestion min/maj, accents, etc.), langage XPath de navigation dans l'​arbre DOM
   * TIGERSearch : langage de requête adapté à la syntaxe, assistant graphique de construction de requête   * TIGERSearch : langage de requête adapté à la syntaxe, assistant graphique de construction de requête
 +  * URS
  
 Moteurs intégrables : TIGERSearch,​ XSLT, XQuery, SPARQL, SQL... Moteurs intégrables : TIGERSearch,​ XSLT, XQuery, SPARQL, SQL...
Ligne 27: Ligne 28:
 ====== Solution ====== ====== Solution ======
  
 +
 +===== Architecture des moteurs =====
 +
 +==== Architecture du code ====
 +
 +Une extension qui propose des services de recherche implémente les classes :
 +  * "​SearchEngine"​ : résout sous la forme d'une liste de "​Match",​ une "​Selection",​ une requête "​Query"​ pour un corpus "​CorpuBuild"​
 +  * "​Query"​ : type la requête pour identifier le moteur à utiliser
 +  * "​Selection"​ : décrit une liste de "​Match"​
 +  * "​Match"​ : décrit un start, end et éventuellement un target
 +
 +Le SearchEngine doit être déclaré dans le fichier plugin.xml de l'​extension.
  
 ==== UI ==== ==== UI ====
Ligne 197: Ligne 210:
 ===== URS (Unité Relation Schema) ===== ===== URS (Unité Relation Schema) =====
  
-Les débuts et fins des Unités correspondent exactement aux positions de mots ce qui rend l'​alignement avec le corpus CQP facile. Le début d'​implémentation URSQL (dans la classe AnalecUtils des macros) permet de sélectionner certaines unités et de faire des intersections avec les match du corpus.+Les débuts et fins des Unités correspondent exactement aux positions de mots ce qui rend l'​alignement avec le corpus CQP direct. Le début d'​implémentation URSQL (dans la classe AnalecUtils des macros) permet ​déjà ​de sélectionner certaines unités et de faire des intersections avec les match du corpus.
  
-L'​implémentation URSQL V0 ne permet pas de choisir sur quel type d'​annotation (Unité/Relation/Schema) la sélection se fera -> une première version ne travaillera que sur les unités.+L'​implémentation URSQL V0 ne permet pas de choisir sur quel type d'​annotation (Unité ​ou Relation ​ou Schéma) la sélection se fera -> une première version ne travaillera que sur les unités
 + 
 +Le moteur "​URS"​ est disponible depuis TXM 0.8.2 pour les commandes Concordances et Index.
  
 ===== XQuery ===== ===== XQuery =====
Ligne 316: Ligne 331:
     - SRCMFMADRID1 : 1 ou 0. avec 1=présence et 0=absence     - SRCMFMADRID1 : 1 ou 0. avec 1=présence et 0=absence
     - SRCMFMADRID2 : 1 ou 0. avec 1=présence et 0=absence     - SRCMFMADRID2 : 1 ou 0. avec 1=présence et 0=absence
 +
 +===== URS=====
 +
 +==== V0 - TXM 0.8.2 ====
 +
 +Préparation : 
 +  * Activer la possibilité de choisir le moteur de résolution dans la page de préférence : TXM > Avancé > SearchEngine
 +  * annoter quelques Entity avec le corpus VOEUX dans les textes 0001 et 0002
 +
 +Faire des recherches "​Entity"​ en Concordance ou Index sur VOEUX et VOEUX/0001 (les résultats ne devraient contenir que les annotations sur le texte 0001)
 +
  
 ===== XSLT ===== ===== XSLT =====
public/specs_ajout_moteur_resolution_annotation.1558603207.txt.gz · Dernière modification: 2019/05/23 11:20 par matthieu.decorde@ens-lyon.fr