Outils pour utilisateurs

Outils du site


public:spec_exploitation_annotation:calculs_syntax_sov

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:spec_exploitation_annotation:calculs_syntax_sov [2019/10/10 14:47]
slh@ens-lyon.fr [Macro TIGER S-V-O Summary]
public:spec_exploitation_annotation:calculs_syntax_sov [2019/10/10 18:08] (Version actuelle)
alexei.lavrentev@ens-lyon.fr [V1]
Ligne 273: Ligne 273:
 === Charger le corpus SRCMF TXM au format TIGER === === Charger le corpus SRCMF TXM au format TIGER ===
  
 +  * télécharger le corpus binaire de test XMLTS (srcmf) : [[https://​sharedocs.huma-num.fr/​wl/?​id=li6GQAftrrb8g0fdL3b4Jb6gxyw6Rz7L]]
 +    * le corpus XMLTS est la version du corpus SRCMF créée pour la communication de Madrid de Céline et Tom
 +    * il contient plusieurs textes (TS et CQP)
 +    * il contient de nouvelles métadonnées (notamment siècle et genre)
 +    * il ne contient pas de ponctuation (les textes CQP ont été produits à partir du TS)
 +  * dans TXM, charger le corpus depuis le menu Fichier > Charger > un corpus binaire (.txm)
  
 +=== Tester le bon fonctionnement du corpus ===
  
 +  * dans TXM, sélectionner le corpus
 +  * ouvrir l'​interface d'​interrogation par requête TIGER (icone tête de tigre)
 +  * cliquer sur la roue dentée pour ouvrir la zone de paramètres et copier-coller la requête suivante dans le champ requête : <code oobas>
 +#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +//& #​clause:​[cat!=("​root"​|"​Insrt"​) & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 + 
 +// & #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //SVO//
 +// & #sujhead .* #objhead & #objhead .* #pivot //SOV//
 +// & #objhead .* #sujhead & #sujhead .* #pivot //OSV//
 +& #objhead .* #​pivot ​  & #​pivot ​  .* #sujhead //OVS//
 +// & #​pivot ​  .* #sujhead & #sujhead .* #objhead //VSO//
 +// & #​pivot ​  .* #objhead & #objhead .* #sujhead //VOS//
 +</​code>​
 +  * lancer le calcul
 +  * on doit trouver 494 phrases (ordre OVS)
 +
 +=== Tester le bon fonctionnement de la macro TIGER Summary ===
 +
 +<​note>​Remarque : les répertoires "​tiger-2019-xx-xx"​ correspondent aux versions précédentes des macros.</​note>​
 +
 +   * ouvrir la vue "​Macro"​
 +   * lancer la macro "​tiger/​exploit/​TIGERSummary"​ avec les paramètres suivants :
 +     * tiger_query : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #objhead .* #​pivot ​  & #​pivot ​  .* #sujhead //OVS//
 +</​code>​
 +     * count_subgraph : coché
 +     * debug : OFF
 +
 +La console affiche : <​code>​ FROSRCMFUD
 +F 494</​code>​
 +
 +=== Tester le bon fonctionnement de la macro TIGER Ratio ===
 +
 +   * lancer la macro "​tiger/​exploit/​TIGERRatio"​ avec les paramètres :
 +     * tiger_query_A (requête SVO) : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //​SVO//</​code>​
 +     * tiger_query_B (requête SOV) : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +// & #sujhead .* #objhead & #objhead .* #pivot //​SOV//</​code>​
 +     * count_subgraph : coché
 +     * debug : OFF
 +
 +La console affiche : <​code>​[FROSRCMFUD:​1335]
 +[FROSRCMFUD:​3510]
 +R = 1335 / 3510 = 0,38
 +Done.</​code>​
 +
 +=== Tester le bon fonctionnement de la macro TIGER Index ===
 +
 +   * sélectionner le sous-corpus du texte "​alexis"​
 +   * lancer la macro "​tiger/​exploit/​TIGERIndex"​ avec les paramètres :
 +     * tiger_query : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //​SVO//</​code>​
 +     * labels : objhead
 +     * properties : pos
 +     * count_subgraph : coché
 +     * sort_column = freq
 +     * max_lines=10
 +     * debug OFF
 +
 +La console affiche : <​code>​pos F FROSRCMFUD
 +NOUN 839
 +VERB 310
 +PRON 74
 +PROPN 68
 +ADV 24
 +ADJ 18
 +DET 2</​code>​
public/spec_exploitation_annotation/calculs_syntax_sov.txt · Dernière modification: 2019/10/10 18:08 par alexei.lavrentev@ens-lyon.fr