Outils pour utilisateurs

Outils du site


public:spec_exploitation_annotation:calculs_syntax_sov

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:spec_exploitation_annotation:calculs_syntax_sov [2019/07/05 17:54]
slh@ens-lyon.fr [Reformulation dans le contexte de TXM (Sous-corpus, Partition, TS, Index...)]
public:spec_exploitation_annotation:calculs_syntax_sov [2019/10/10 18:08] (Version actuelle)
alexei.lavrentev@ens-lyon.fr [V1]
Ligne 1: Ligne 1:
-===== Requêtes et statistiques Syntaxiques =====+====== Requêtes et statistiques Syntaxiques ​======
  
-==== Formulation des calculs par SP ====+===== Formulation des calculs par SP =====
  
-1) Pouvoir faire des calculs ​statistiques sur les différentes combinaisons de S (ujet), V(erbe) et O(bjet) (les 6 sont possibles en ancien français), en tenant ​compte +**Calculs ​1)** calculer ​des statistiques sur les différentes combinaisons de S (ujet), V(erbe) et O(bjet) (les 6 sont possibles en ancien français), en tenant ​compte ​ 
 +  * de la nature de S et de O (nom, pronom personnel, …), mais aussi (ce peut être des requêtes successives) :  
 +  * de la détermination ou non du nom (si S et/ou O = nom) : présence ou non d'un article (et si oui, de quel type : défini, indéfini, possessif…) 
 +  * de la complexité de S et de O (longueur en nombre de mots, mais aussi complexité « linguistique »: présence d'une subordonnée relative, d'un complément du nom…) 
 +  * de la complexité du verbe : forme simple ou composée (temps composé, modal + infinitif…)
  
-  ​de la nature de S et de O (nom, pronom personnel, …), mais aussi (ce peut être des requêtes successives) :​  +**Calculs 2)** comparer la fréquence ​de OV / VO selon que est exprimé ​ou non  comparer ​la fréquence ​de SV / VS selon que est exprimé ​ou non.
-  ​* de la détermination ou non du nom (si et/ou O = nom) : présence ​ou non d'un article (et si oui, de quel type : défini, indéfini, possessif…) +
-  * de la complexité de S et de O (longueur en nombre de mots, mais aussi complexité « linguistique »:​ présence d'une subordonnée relative, d'un complément du nom…) +
-  * de la complexité du verbe : forme simple ​ou composée (temps composé, modal + infinitif…)+
  
-2) comparer la fréquence ​de OV/ VO selon que S  est exprimé ou non ;  comparer la fréquence ​de SV/ VS selon que O est exprimé ou non ;+===== Reformulation dans le contexte ​de TXM (Sous-corpus,​ Partition, TS, Index...) avec le moteur ​de recherche TIGER Search =====
  
 +Deux représentations d'​annotations syntaxiques sont disponibles :
 +  * TIGER-UD issu de CoNLL-U issu de TIGER-RDF
 +  * TIGER-RDF issu de SRCMF-RDF
  
-==== Reformulation dans le contexte ​de TXM (Sous-corpus, Partition, TS, Index...) avec le moteur de recherche TIGER Search ====+Une sous-page décrit l'​[[public:​spec_exploitation_annotation:​calculs_syntax_sov:​tiger_rdf|exploitation ​de l'​annotation TIGER-RDF]].
  
-=== Sélections ===+==== Annotations syntaxiques TIGER-UD ==== 
 + 
 +  * SRCMF/UD -> TIGER = TIGER-UD 
 +    * Voir la spec [[public:​spec_exploitation_annotation:​spec_tiger_ud|Spécification de conversion et d'​exploitation des annotations UD avec TIGERSearch]] 
 + 
 +==== Sélections ​====
  
 On s'​intéresse à différents **ordres de S, V et O** : SVO, SOV, OSV, OVS, VSO, VOS  On s'​intéresse à différents **ordres de S, V et O** : SVO, SOV, OSV, OVS, VSO, VOS 
  
-que l'on peut sélectionner avec une requête TIGER générique :+Reformulation en étiquettes (AL) 
 <code oobas> <code oobas>
-#​pivot:​[pos="​VERcjg"] +#​pivot:​[pos="​VERB"] 
-& #​clause:​[cat="​Snt"&​type="​VFin"​] +& #​clause:​[cat="​root" & type="​VFin"​] 
-//& #​clause:​[cat!="​Snt|Insrt"&​type="​VFin"​]+//& #​clause:​[cat!=("root"|"Insrt"& type="​VFin"​]
 & #clause >L #pivot & #clause >L #pivot
-& #clause >D #​obj:​[cat="​Obj"]  +& #clause >D #obj:[cat=("obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod")]  
-& #clause >D #suj:[cat=/Sj.*/]  +& #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)]  
-& #obj >L #objhead:[pos =/.*/]  +& #obj    >L #objhead:[]  
-& #suj >L #sujhead:[pos =/.*/]  +& #suj    >L #sujhead:[]  
- +  
-//SVO// &#​sujhead.* #pivot & #pivot.* #objhead +// & #sujhead .* #​pivot ​  ​& #​pivot ​  ​.* #objhead //SVO// 
-//SOV// &#​sujhead.* #objhead & #objhead.* #​pivot ​ +// & #sujhead .* #objhead & #objhead .* #pivot //SOV// 
-//OSV// &#​objhead.* #sujhead & #​sujhead.*#​pivot +// & #objhead .* #sujhead & #sujhead .* #pivot //OSV// 
-//OVS// &#​objhead.* #pivot & #pivot.* #​sujhead ​ +// & #objhead .* #​pivot ​  ​& #​pivot ​  ​.* #sujhead //OVS// 
-//VSO// &#​pivot.* #sujhead & #sujhead.* #​objhead ​ +// & #​pivot ​  ​.* #sujhead & #sujhead .* #objhead //VSO// 
-//VOS// &#​pivot.* #objhead & #objhead.* #sujhead+// & #​pivot ​  ​.* #objhead & #objhead .* #​sujhead ​//VOS//
 </​code>​ </​code>​
  
-=== Fréquences de matchs ===+Usage : supprimer le commentaire %%//%% en début de ligne pour activer la clause définissant l'​ordre SVO souhaité. 
 + 
 +==== Fréquences de matchs ​====
  
   * nb_matchs() ​ SVO, SOV, OSV, OVS, VSO, VOS   * nb_matchs() ​ SVO, SOV, OSV, OVS, VSO, VOS
  
-=== Rapports de fréquences de matchs ===+==== Rapports de fréquences de matchs ​====
  
-2S  est exprimé ou non  +**Calculs 1)**
-  ​comparer la fréquence de OV / VO  +
-  ​comparer la fréquence de SV / VS selon que O est exprimé ou non ;+
  
-+ filtre par interrogatifexclamatifetc.+  * détermination ou non du nom (si S et/ou O = nom) : 
 +    * présence ou non d'un article devant (ou derrière) 
 +    * [projection] pos → définiindéfinipossessif…
  
-+ filtre principale, subordonnée+==== Index hiérarchiques de propriétés de noeuds non terminaux ====
  
-+ filtre type principale, type subordonnée +  ​étant ​donné les 6 combinaisons SVO, SOV, OSV, OVS, VSO, VOS : 
- +    * noeuds : indexh(index hiérarchique)) ​#​sujhead.pos 
-=== Index hiérarchiques de propriétés de noeuds non terminaux === +    * noeuds : indexh ​ #​objhead.pos 
- +    * noeuds : indexh ​ #​sujhead.pos / #​objhead.pos
-  ​entant ​donné les 6 combinaisons ​ SVO, SOV, OSV, OVS, VSO, VOS : +
-    * noeuds :indexh #​sujhead.pos +
-    * noeuds :​indexh ​ #​objhead.pos +
-    * noeuds :​indexh ​ #​sujhead.pos / #​objhead.pos+
     * mots : indexh #​sujhead->​T.word     * mots : indexh #​sujhead->​T.word
-  * entant ​donné les 6 combinaisons ​ SVO, SOV, OSV, OVS, VSO, VOS : +  * étant ​donné les 6 combinaisons SVO, SOV, OSV, OVS, VSO, VOS : 
-    * étant donné la pos du S (nom, pronom personnel…)+    * étant donné la pos du S (nom, pronom personnel…)
       * indexh des pos(O)       * indexh des pos(O)
-      * étant donné la pos du O (nom, pronom personnel…)+      * étant donné la pos du O (nom, pronom personnel…)
         * concordance         * concordance
           * retour à l'​arbre syntaxique           * retour à l'​arbre syntaxique
-  * étant donné la pos du S (nom, pronom personnel…) +  * étant donné la pos du S (nom, pronom personnel…) 
-      * étant donné la pos du O (nom, pronom personnel…)+      * étant donné la pos du O (nom, pronom personnel…)
         * indexh des  SVO, SOV, OSV, OVS, VSO, VOS :         * indexh des  SVO, SOV, OSV, OVS, VSO, VOS :
  
-- cas 1) de la détermination ou non du nom (si S et/ou O nom) :+==== Longueurs en mots ====
  
- présence ou non d'un article devant (ou derrière) +  * de la complexité de S et de O : 
- [projection] pos → défini, indéfinipossessif+    ​* ​[projection] ​longueur en nombre de mots 
 +      * mots : histogramme longueurs #​sujhead->​T 
 +      *+ ventiler longueurs x headpos (valeurs de) 
 +  * cat = « ModA » & hors pos = « det » 
 +    * %%//%% complexité « linguistique »: une subordonnée relative, complément du nom… = oui / non 
 +    * → nombre 
 +    * → indexh #​sujhead.headpos 
 +    * → indexh #​objhead.headpos 
 +  * de la complexité de V :forme simple ou composée (temps composémodal + infinitif) = oui / non 
 +    * quand V complexe :<​code>​ < aux a :[] ? participe > → cat(a)</​code>​
  
-=== Longueurs en mots ===+**Calculs 2**)
  
-- de la complexité ​de S et de O :+  * S  est exprimé ou non  
 +  * comparer ​la fréquence ​de OV / VO  
 +  * comparer la fréquence ​de SV / VS selon que est exprimé ou non ; 
 +  * + filtre par interrogatif,​ exclamatif, etc. 
 +  * + filtre principale, subordonnée 
 +  * + filtre type principale, type subordonnée
  
-  - [projection] longueur en nombre ​de mots+Requête ​de base : calcul de fréquence OV/VO par rapport à l'​expression du sujet
  
-    *mots histogramme longueurs ​#sujhead->T +<code oobas> 
-    *+ ventiler longueurs x headpos ​(valeurs de)+#pivot:[pos="​VERB"​] 
 +#clause:​[cat="​root"​ & type="​VFin"​] 
 +//& #​clause:​[cat!=("​root"​|"​Insrt"​) & type="​VFin"​] 
 +& #​clause ​>L #pivot 
 +& #clause >D #obj:[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)]  
 +& #obj    >L #objhead:[]  
 +  
 +// & #​pivot ​  .* #objhead //VO// 
 +// & #objhead .* #pivot //OV//
  
-  - cat= « ModA » hors pos« det »+// & #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)] //Sujet exprimé 
 +// #​clause:​[dom!=/.*subj.*/] // Sujet non exprimé 
 +</​code>​
  
- %%//%% complexité « linguistique »: une subordonnée relative, complément du nom… ​oui / non+====== Solutions ======
  
-→ nombre+===== Étape 1 =====
  
-→ indexh #sujhead.headpos+La solution V1 est une solution sans intégration forte dans les outils et l'​interface de TXM. Elle s'​appuie sur des macros Groovy. Elle permet la validation de l'​architecture par rapport aux questions initiales
  
-→ indexh #​objhead.headpos+==== Réinterprétation des calculs 1) ====
  
-- de la complexité de V :forme simple ou composée (temps composé, modal + infinitif…) ​= oui / non+  * en tenant compte d'une requête TIGER 
 +    * "les différentes combinaisons de S (ujet), V(erbe) et O(bjet)" ​-> requête générique + une des lignes SOV décommentée. 
 +    * "de la nature de S et de O (nom, pronom personnel, …)" -> critère de valeur de propriété de #obj, #suj ou #pivot sur le "​pos"​ 
 +    * "de la détermination ou non du nom (si S et/ou O = nom)" -> critère de valeur de propriété de #objhead ou #sujhead sur le pos ("​contienent/​est un '​article'"​) 
 +    * par la complexité de S et O -> critère longueur de #objhead ou #sujhead -> possible en TIGER ? -> Est-ce-que cela revient à regarder les #objhead et #sujhead des sous graphes ? 
 +    * "de la complexité de S et de O" -> #objhead ou #sujhead contienent/​sont une subordonnée "​relative,​ d'un complément du nom…"​ 
 +    * "de la complexité du verbe" -> critère de valeur de propriété de #pivot de la propriété XYZ à la valeur "forme simple ou composée (temps composé, modal + infinitif…)"
  
-- quand V complexe ​:<​code> ​< aux a :[] ? participe ​→ cat(a)</​code>​+Requête générique ​: 
 +<​code ​oobas> 
 +#pivot:[pos="​VERB"​] 
 +& #​clause:​[cat="​root"​ & type="​VFin"​] 
 +//& #​clause:​[cat!=("​root"​|"​Insrt"​) & type="​VFin"​] 
 +& #​clause ​>L #pivot 
 +& #clause >D #obj:[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)]  
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)]  
 +& #obj    >L #objhead:[]  
 +& #suj    >L #sujhead:[]  
 +  
 +// & #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //SVO// 
 +// & #sujhead .* #objhead & #objhead .* #pivot //SOV// 
 +// & #objhead .* #sujhead & #sujhead .* #pivot //OSV// 
 +// & #objhead .* #​pivot ​  & #​pivot ​  .* #sujhead //OVS// 
 +// & #​pivot ​  .* #sujhead & #sujhead .* #objhead //VSO// 
 +// & #​pivot ​  .* #objhead & #objhead .* #sujhead //VOS// 
 +</​code>​
  
 +==== Faire des calculs statistiques pour 1) et 2) ====
  
 +  * voir et vérifier les SOV sélectionnés -> Concordance avec mise en évidence ou centrage sur un élément à vérifier
 +  * compter le nombre de match d'une requête -> macro TIGER Summary
 +  * voir et dénombrer les valeurs que peut prendre tout ou partie du match -> macro TIGER Index
 +  * "(ce peut être des requêtes successives)"​ -> comparer des fréquences de plusieurs requêtes
 +  * "​comparer la fréquence de OV / VO selon que S est exprimé ou non" -> comparer les fréquences de 2 requêtes
  
 +==== Macro TIGER Summary ====
  
 +Pour une requête TIGER affiche le nombre de matchs obtenus, sous-graphes inclus ou pas.
  
 +Si la sélection est multiple (ex: plusieurs sous-corpus sélectionnés ; une partition sur des textes sélectionnée) alors le résultat est tabulé avec un sous-corpus/​partie par colonne. ​
  
 +Le dénombrement ne prend en compte que les matchs TIGER limités aux positions des corpus de la sélection (liste de matchs des sous-corpus/​parties) -> combinaison requêtes TIGER x requêtes CQL.
  
- +Paramètre : 
-====== Solutions ====== +  * R : requête TIGER
- +
-===== V1 ===== +
- +
-La solution V1 est une solution sans intégration forte dans les outils et l'​interface de TXM. Elle s'​appuie sur des macros Groovy. Elle permet la validation de l'​architecture par rapport aux questions initiales.  +
- +
-==== Macro TIGER Matches [SLHSummary ?] ==== +
- +
-Pour une requête TIGER afficher le nombre de match obtenus en incluant ou pas les sous-graphes. +
- +
-Si la sélection est multiple (ex: plusieurs sous-corpus sélectionné ; une partition sur des textes) alors le résultat est tabulé avec un corpus/​sous-corpus/​partie par colonne.  +
- +
-Les dénombrements des matchs sont limités aux positions des corpus de la sélection.+
  
 <​code>​ <​code>​
- C1 C2 C3+ Sous-corpus 1 Sous-corpus 2 Sous-corpus 3
 F F1 F2 F3 F F1 F2 F3
 </​code>​ </​code>​
Ligne 127: Ligne 180:
 ==== Macro TIGER Ratio ==== ==== Macro TIGER Ratio ====
  
-Affiche le rapport entre le nombre de matchs ​(sous-graph inclus ou pas) de 2 requêtes TIGER.+Affiche le rapport entre le nombre de matchs ​de 2 requêtes TIGER, ​sous-graphes ​inclus ou pas.
  
-(l'​implémentation ​peut se faire par l'​appel successif de la macro TIGER Matches ​avec les 2 requêtes)+(l'​implémentation se fait par l'​appel successif de la macro TIGER Summary ​avec les 2 requêtes)
  
 Paramètres : Paramètres :
Ligne 135: Ligne 188:
   * R2 : requête TIGER 2   * R2 : requête TIGER 2
  
-La macro peut travailler ​sur une sélection multiple de corpus ou à partir d'une partition. Elle produira une colonne par élément de la sélection.+La macro travaille ​sur une sélection multiple de corpus ou à partir d'une partition. Elle produira une colonne par sous-corpus/​partie.
  
 <​code>​ <​code>​
Ligne 146: Ligne 199:
 ==== Macro TIGER Index ==== ==== Macro TIGER Index ====
  
-Affiche un index hiérarchique ​de valeurs de propriétés de matchs TIGER.+Affiche un index hiérarchique ​des valeurs de propriétés ​de noeuds ​de matchs TIGER.
  
-Les matchs ​sont calculés avec une requête TIGER comportant ​un ou plusieurs labels ​de noeuds. Les labels peuvent être positionnés sur des noeuds terminaux ou non-terminaux.+Les noeuds ​sont repérés par un ou plusieurs labels ​dans la requête TIGER. Les labels peuvent être positionnés sur des noeuds terminaux ou non-terminaux.
  
-L'​utilisateur doit alors indiquer les noeud labelisés a utiliser et les propriétés à projeter pour chaque label.+L'​utilisateur doit alors indiquer les labels de noeuds à utiliser et les propriétés à projeterpour chaque label.
  
 Paramètres : Paramètres :
   * requête TIGER   * requête TIGER
-  * liste des labels ​des noeuds à utiliser+  * liste des labels ​de noeuds à utiliser
   * liste des propriétés à projeter   * liste des propriétés à projeter
  
-La macro peut prendre une sélection de sous-corpus ou une partition ​qui génère ​une liste de corpus/​sous-corpus : C1, C2, ... CN. La macro produira alors une colonne par corpus/sous-corpus/​partie.+La macro peut prendre une sélection de sous-corpus ou une partition. Qui génèrera ​une liste de corpus/​sous-corpus : C1, C2, ... CN. La macro produira alors une colonne par sous-corpus/​partie.
  
 Affichage : Affichage :
 <​code>​ <​code>​
-Index hiérarchique ​de la requete ​[SOV] dans le corpus ​"​SRCMF"​+Index h. de [SOV] dans "​SRCMF"​
 P1_P2_P3 F dans C1 F dans C2 P1_P2_P3 F dans C1 F dans C2
-V1_V2_V3 N1 N2 +V1_V1_V1 N1111 N2111 
-V1'​_V2'​_V3'​ N1'​ N2'+V1_V1_V2 N1112 N2112 
 +V1_V1_V3 N1113 N2113
 ... ...
 </​code>​ </​code>​
  
 +===== Étape 2 =====
 +
 +Complète l'​étape 1 avec des macros de synthèse des statistiques dans un tableau unique.
 +
 +Une étape ultérieure essayera d'​aider à naviguer au sein de corpus pour contextualiser certaines fréquences.
 +
 +==== Macro TIGER S-V-O Summary ====
 +
 +Autre nom possible TIGER Main Syntactic Categories Order Summary : TIGER MSCOS
 +
 +La macro se lance sur un corpus ou un sous-corpus.
 +(en cours de rédaction)
 +
 +Paramètres :
 +  * Sujet : étiquette sujet (.*subj.* par défaut)
 +  * Objet : étiquette objet (.*obj.* par défaut)
 +  * Requêtes : chemin vers un tableau ODS contenant les requêtes pour chaque mesure
 +  * Proposition : type de proposition (subordonnée / principale, .* par défaut)
 +  * propositions subordonnées : Sans / Seulement / Avec
 +  * coordinations : Sans / Seulement / Avec
 +
 +Un warning est affiché si un match contient plusieurs sous-graphes.
 +
 +Exemple de tableau de requêtes : [[https://​docs.google.com/​spreadsheets/​d/​1dnY1IVHPe0L8Cx6S4zNAShfMHRWG8IKbOScgkXbX0H4/​edit?​usp=sharing|tableau google]]
 +
 +La macro génère un tableau ODS (ou CSV) avec les colonnes suivantes :
 +
 +  * mesure, valeur, SVO, SOV, OSV, OVS, VSO, VOS
 +
 +Pour chaque mesure, il contient autant de lignes que de valeurs possibles, et dans chaque des données, le nombre de matchs.
 +
 +Optimisation possible :
 +  * présélectionner avec la partie fixe de la requête les graphes SVO, SOV, OSV, OVS, VSO, VOS (sorte de  sous-corpus TIGER) puis itérer sur les requêtes
 ===== Recettes ===== ===== Recettes =====
  
Ligne 174: Ligne 261:
 === Installer l'​extension TIGERSearch === === Installer l'​extension TIGERSearch ===
  
-  * Régler le niveau de mise à jour à BETA +  * Régler le niveau de mise à jour à ALPHA 
-    - sélectionner le menu "Edition ​> Préférences"​+    - sélectionner le menu "Édition ​> Préférences"​
     - aller dans "TXM > Avancé"​     - aller dans "TXM > Avancé"​
-    - sélectionner le niveau de mise à jour "BETA" ​+    - sélectionner le niveau de mise à jour "ALPHA" ​
   * Installer l'​extension   * Installer l'​extension
-    - sélectionner le menu "​Fichier > Installer ​une extension"​+    - sélectionner le menu "​Fichier > Ajouter ​une extension"​
     - sélectionner "​TIGERSearch"​     - sélectionner "​TIGERSearch"​
     - valider     - valider
     - valider les étapes d'​installation et redémarrer TXM     - valider les étapes d'​installation et redémarrer TXM
-  * Installer les macros d'​exploitation (en attendant leur livraison automatique dans l'​extension) 
-    - télécharger l'​archive tiger.zip : [[https://​sharedocs.huma-num.fr/​wl/?​id=qOA7foBPe9UtQ5e7Aazvq97PlSczlPeu]] 
-    - désarchiver le répertoire "​tiger"​ de l'​archive 
-    - copier (CTRL+C) le répertoire "​tiger"​ et le copier (CTRL+V) dans la vue "​Macro"​ de TXM 
-    - le répertoire "​tiger"​ est visible dans la vue Macro 
  
-=== Charger le corpus SRCMF au format TIGER ===+=== Charger le corpus SRCMF TXM au format TIGER ===
  
-  * télécharger le corpus de test XMLTS (srcmf) : [[https://​sharedocs.huma-num.fr/​wl/?​id=1Nr0uSxeaJjO0vlNwC5AbstC72harFjb]]+  * télécharger le corpus ​binaire ​de test XMLTS (srcmf) : [[https://​sharedocs.huma-num.fr/​wl/?​id=li6GQAftrrb8g0fdL3b4Jb6gxyw6Rz7L]] 
 +    * le corpus XMLTS est la version du corpus SRCMF créée pour la communication de Madrid de Céline et Tom 
 +    * il contient plusieurs textes (TS et CQP) 
 +    * il contient de nouvelles métadonnées (notamment siècle et genre) 
 +    * il ne contient pas de ponctuation (les textes CQP ont été produits à partir du TS)
   * dans TXM, charger le corpus depuis le menu Fichier > Charger > un corpus binaire (.txm)   * dans TXM, charger le corpus depuis le menu Fichier > Charger > un corpus binaire (.txm)
  
Ligne 198: Ligne 284:
   * dans TXM, sélectionner le corpus   * dans TXM, sélectionner le corpus
   * ouvrir l'​interface d'​interrogation par requête TIGER (icone tête de tigre)   * ouvrir l'​interface d'​interrogation par requête TIGER (icone tête de tigre)
-  * copier la requête <​code>#​pivot:​[pos="​VERcjg"] +  * cliquer sur la roue dentée pour ouvrir la zone de paramètres et copier-coller ​la requête ​suivante dans le champ requête : <​code ​oobas> 
-& #​clause:​[cat="​Snt"&​type="​VFin"​] +#​pivot:​[pos="​VERB"] 
-//& #​clause:​[cat!="​Snt|Insrt"&​type="​VFin"​]+& #​clause:​[cat="​root" & type="​VFin"​] 
 +//& #​clause:​[cat!=("root"|"Insrt"& type="​VFin"​]
 & #clause >L #pivot & #clause >L #pivot
-& #clause >D #​obj:​[cat="​Obj"]  +& #clause >D #obj:[cat=("obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod")]  
-& #clause >D #suj:[cat=/Sj.*/]  +& #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)]  
-& #obj >L #objhead:[pos =/.*/]  +& #obj    >L #objhead:[]  
-& #suj >L #sujhead:[pos =/.*/ +& #suj    >L #sujhead:[]  
-&#​sujhead.* #pivot & #pivot.* #​objhead</​code>​+  
 +// & #​sujhead ​.* #​pivot ​  & #​pivot ​  .* #objhead //SVO/
 +// & #​sujhead ​.* #objhead & #​objhead ​.* #​pivot ​//SOV// 
 +// #objhead .* #sujhead & #sujhead .* #​pivot ​//OSV// 
 +& #objhead .* #​pivot ​  & #​pivot ​  .* #sujhead //OVS// 
 +// & #​pivot ​  .* #sujhead & #​sujhead ​.* #​objhead ​//VSO// 
 +// & #​pivot ​  .* #objhead & #objhead .* #sujhead //VOS// 
 +</​code>​
   * lancer le calcul   * lancer le calcul
-  * on trouve 1849 phrases+  * on doit trouver 494 phrases ​(ordre OVS)
  
-=== Recette ​de la question "​nb_matchs() SVO" ​===+=== Tester le bon fonctionnement ​de la macro TIGER Summary ​=== 
 + 
 +<​note>​Remarque : les répertoires "​tiger-2019-xx-xx"​ correspondent aux versions précédentes des macros.</​note>​
  
-Utilisation de la macro TIGER Matches : 
-   * créer puis sélectionner le sous-corpus du texte "​alexis"​ (pour que les calculs soient plus rapides que pour le corpus entier) 
    * ouvrir la vue "​Macro"​    * ouvrir la vue "​Macro"​
-   * lancer la macro "​tiger/​exploit/​TIGERMatches" avec les paramètres suivants : +   * lancer la macro "​tiger/​exploit/​TIGERSummary" avec les paramètres suivants : 
-     ​* ​requete ​: <​code>#​pivot:​[pos="​VERcjg"] +     ​* ​tiger_query ​: <​code ​oobas>#​pivot:​[pos="​VERB"] 
-& #​clause:​[cat="​Snt"&​type="​VFin"​] +& #​clause:​[cat="​root" & type="​VFin"​]
-//& #​clause:​[cat!="​Snt|Insrt"&​type="​VFin"​]+
 & #clause >L #pivot & #clause >L #pivot
-& #clause >D #​obj:​[cat="​Obj"]  +& #clause >D #obj:[cat=("obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod")]  
-& #clause >D #suj:[cat=/Sj.*/]  +& #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)]  
-& #obj >L #objhead:[pos =/.*/]  +& #obj    >L #objhead:[]  
-& #suj >L #sujhead:[pos =/.*/]  +& #suj    >L #sujhead:[]  
-&#sujhead.* #pivot & #pivot.* #objhead</​code>​ +& #objhead ​.* #​pivot ​  ​& #​pivot ​  ​.* #sujhead //OVS// 
-     ​* ​count_submatch ​: coché+</​code>​ 
 +     ​* ​count_subgraph ​: coché 
 +     * debug : OFF
  
-La console affiche : <​code>​ alexis +La console affiche : <​code>​ FROSRCMFUD 
-F 32</​code>​+F 494</​code>​
  
-=== Recette ​de la question "​nb_matchs() SVO" ​===+=== Tester le bon fonctionnement ​de la macro TIGER Ratio ===
  
-Utilisation de la macro TIGER Ratio : 
-   * sélectionner le sous-corpus du texte "​alexis"​ 
    * lancer la macro "​tiger/​exploit/​TIGERRatio"​ avec les paramètres :    * lancer la macro "​tiger/​exploit/​TIGERRatio"​ avec les paramètres :
-     ​* ​requete ​SVO : <​code>#​pivot:​[pos="​VERcjg"] +     ​* ​tiger_query_A (requête ​SVO: <​code ​oobas>#​pivot:​[pos="​VERB"] 
-& #​clause:​[cat="​Snt"&​type="​VFin"​] +& #​clause:​[cat="​root" & type="​VFin"​]
-//& #​clause:​[cat!="​Snt|Insrt"&​type="​VFin"​]+
 & #clause >L #pivot & #clause >L #pivot
-& #clause >D #​obj:​[cat="​Obj"]  +& #clause >D #obj:[cat=("obj"|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)]  
-& #clause >D #suj:[cat=/Sj.*/]  +& #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)]  
-& #obj >L #objhead:[pos =/.*/]  +& #obj    >L #objhead:[]  
-& #suj >L #sujhead:[pos =/.*/]  +& #suj    >L #sujhead:[]  
-&#​sujhead.* #pivot & #pivot.* #​objhead</​code>​ +& #sujhead .* #​pivot ​  ​& #​pivot ​  ​.* #​objhead ​//SVO//</​code>​ 
-     ​* ​requete ​SOV : <​code>#​pivot:​[pos="​VERcjg"] +     ​* ​tiger_query_B (requête ​SOV: <​code ​oobas>#​pivot:​[pos="​VERB"] 
-& #​clause:​[cat="​Snt"&​type="​VFin"​] +& #​clause:​[cat="​root" & type="​VFin"​]
-//& #​clause:​[cat!="​Snt|Insrt"&​type="​VFin"​]+
 & #clause >L #pivot & #clause >L #pivot
-& #clause >D #​obj:​[cat="​Obj"]  +& #clause >D #obj:[cat=("obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod")]  
-& #clause >D #suj:[cat=/Sj.*/]  +& #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)]  
-& #obj >L #objhead:[pos =/.*/]  +& #obj    >L #objhead:[]  
-& #suj >L #sujhead:[pos =/.*/]  +& #suj    >L #sujhead:[]  
-&#​sujhead.* #objhead & #objhead.* #​pivot</​code>​ +// & #sujhead .* #objhead & #objhead .* #​pivot ​//SOV//</​code>​ 
-     ​* ​count_submatch ​: coché+     ​* ​count_subgraph ​: coché 
 +     * debug : OFF
  
-La console affiche : <​code>​ alexis +La console affiche : <​code>​[FROSRCMFUD:​1335] 
-R 0.91</​code>​+[FROSRCMFUD:​3510] 
 += 1335 / 3510 = 0,38 
 +Done.</​code>​
  
-=== Recette ​de la question "​noeuds :indexh #​objhead.pos" ​===+=== Tester le bon fonctionnement ​de la macro TIGER Index ===
  
-Utilisation de la macro TIGER Index : 
    * sélectionner le sous-corpus du texte "​alexis"​    * sélectionner le sous-corpus du texte "​alexis"​
    * lancer la macro "​tiger/​exploit/​TIGERIndex"​ avec les paramètres :    * lancer la macro "​tiger/​exploit/​TIGERIndex"​ avec les paramètres :
-     ​* ​requete ​: <​code>#​pivot:​[pos="​VERcjg"] +     ​* ​tiger_query ​: <​code ​oobas>#​pivot:​[pos="​VERB"] 
-& #​clause:​[cat="​Snt"&​type="​VFin"​] +& #​clause:​[cat="​root" & type="​VFin"​]
-//& #​clause:​[cat!="​Snt|Insrt"&​type="​VFin"​]+
 & #clause >L #pivot & #clause >L #pivot
-& #clause >D #​obj:​[cat="​Obj"]  +& #clause >D #obj:[cat=("obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod")]  
-& #clause >D #suj:[cat=/Sj.*/]  +& #clause >D #suj:[cat=("​nsubj"​|"​csubj"​)]  
-& #obj >L #objhead:[pos =/.*/]  +& #obj    >L #objhead:[]  
-& #suj >L #sujhead:[pos =/.*/]  +& #suj    >L #sujhead:[]  
-&#​sujhead.* #pivot & #pivot.* #​objhead</​code>​+& #sujhead .* #​pivot ​  ​& #​pivot ​  ​.* #​objhead ​//SVO//</​code>​
      * labels : objhead      * labels : objhead
      * properties : pos      * properties : pos
-     ​* ​count_submatch ​: coché +     ​* ​count_subgraph ​: coché 
-     * sort_column = F+     * sort_column = freq
      * max_lines=10      * max_lines=10
 +     * debug OFF
  
-La console affiche : <​code>​pos F alexis +La console affiche : <​code>​pos F FROSRCMFUD 
-NOMcom 18 +NOUN 839 
-VERcjg 7 +VERB 310 
-NOMpro 6 +PRON 74 
-PROind 1</​code>​+PROPN 68 
 +ADV 24 
 +ADJ 18 
 +DET 2</​code>​
public/spec_exploitation_annotation/calculs_syntax_sov.1562342087.txt.gz · Dernière modification: 2019/07/05 17:54 par slh@ens-lyon.fr