Outils pour utilisateurs

Outils du site


public:spec_exploitation_annotation:calculs_syntax_sov:archives_recettes_sov

Table des matières

Recettes TXM 0.8.0

V1

Installer l'extension TIGERSearch

  • Régler le niveau de mise à jour à ALPHA
    1. sélectionner le menu “Édition > Préférences”
    2. aller dans “TXM > Avancé”
    3. sélectionner le niveau de mise à jour “ALPHA”
  • Installer l'extension
    1. sélectionner le menu “Fichier > Ajouter une extension”
    2. sélectionner “TIGERSearch”
    3. valider
    4. valider les étapes d'installation et redémarrer TXM

Charger le corpus SRCMF TXM au format TIGER-UD

  • télécharger le corpus binaire de test FROSRCMFUD (srcmf-ud) : https://sharedocs.huma-num.fr/wl/?id=SIQTFMlK7XOjZlM7CK3aaRJJJeiUZ3kj
    • le corpus XMLTS est la version du corpus SRCMF publiée sur le site Universal Dependencies
    • il contient des phrases de plusieurs textes (mais pas d'unités textuelles au sens TXM)
    • il contient de nouvelles métadonnées (notamment siècle et genre) (ces métadonnées sont à rétablir dans une version ultérieure)
    • il ne contient pas de ponctuation (les textes CQP ont été produits à partir du TS)
  • dans TXM, charger le corpus depuis le menu Fichier > Charger > un corpus binaire (.txm)

Tester le bon fonctionnement du corpus

  • dans TXM, sélectionner le corpus
  • ouvrir l'interface d'interrogation par requête TIGER (icone tête de tigre)
  • cliquer sur la roue dentée pour ouvrir la zone de paramètres et copier-coller la requête suivante dans le champ requête :
    #pivot:[pos="VERB"]
    & #clause:[cat="root" & type="VFin"]
    //& #clause:[cat!=("root"|"Insrt") & type="VFin"]
    & #clause >L #pivot
    & #clause >D #obj:[cat=("obj"|"ccomp"|"obj\:advneg"|"obj\:advmod")] 
    & #clause >D #suj:[cat=("nsubj"|"csubj")] 
    & #obj    >L #objhead:[] 
    & #suj    >L #sujhead:[] 
     
    // & #sujhead .* #pivot   & #pivot   .* #objhead //SVO//
    // & #sujhead .* #objhead & #objhead .* #pivot //SOV//
    // & #objhead .* #sujhead & #sujhead .* #pivot //OSV//
    & #objhead .* #pivot   & #pivot   .* #sujhead //OVS//
    // & #pivot   .* #sujhead & #sujhead .* #objhead //VSO//
    // & #pivot   .* #objhead & #objhead .* #sujhead //VOS//
  • lancer le calcul
  • on doit trouver 494 phrases (ordre OVS)

Tester le bon fonctionnement de la macro TIGER Summary

Remarque : les répertoires “tiger-2019-xx-xx” correspondent aux versions précédentes des macros.
  • ouvrir la vue “Macro”
  • lancer la macro “tiger/exploit/TIGERSummary” avec les paramètres suivants :
    • tiger_query :
      #pivot:[pos="VERB"]
      & #clause:[cat="root" & type="VFin"]
      & #clause >L #pivot
      & #clause >D #obj:[cat=("obj"|"ccomp"|"obj\:advneg"|"obj\:advmod")] 
      & #clause >D #suj:[cat=("nsubj"|"csubj")] 
      & #obj    >L #objhead:[] 
      & #suj    >L #sujhead:[] 
      & #objhead .* #pivot   & #pivot   .* #sujhead //OVS//
    • count_subgraph : coché
    • debug : OFF

La console affiche :

	FROSRCMFUD
F	494

Tester le bon fonctionnement de la macro TIGER Ratio

  • lancer la macro “tiger/exploit/TIGERRatio” avec les paramètres :
    • tiger_query_A (requête SVO) :
      #pivot:[pos="VERB"]
      & #clause:[cat="root" & type="VFin"]
      & #clause >L #pivot
      & #clause >D #obj:[cat=("obj"|"ccomp"|"obj\:advneg"|"obj\:advmod")] 
      & #clause >D #suj:[cat=("nsubj"|"csubj")] 
      & #obj    >L #objhead:[] 
      & #suj    >L #sujhead:[] 
      & #sujhead .* #pivot   & #pivot   .* #objhead //SVO//
    • tiger_query_B (requête SOV) :
      #pivot:[pos="VERB"]
      & #clause:[cat="root" & type="VFin"]
      & #clause >L #pivot
      & #clause >D #obj:[cat=("obj"|"ccomp"|"obj\:advneg"|"obj\:advmod")] 
      & #clause >D #suj:[cat=("nsubj"|"csubj")] 
      & #obj    >L #objhead:[] 
      & #suj    >L #sujhead:[] 
      & #sujhead .* #objhead & #objhead .* #pivot //SOV//
    • count_subgraph : coché
    • debug : OFF

La console affiche :

[FROSRCMFUD:1335]
[FROSRCMFUD:1152]
R = 1335 / 1152 = 1.16
Done.

Tester le bon fonctionnement de la macro TIGER Index

  • lancer la macro “tiger/exploit/TIGERIndex” avec les paramètres :
    • tiger_query :
      #pivot:[pos="VERB"]
      & #clause:[cat="root" & type="VFin"]
      & #clause >L #pivot
      & #clause >D #obj:[cat=("obj"|"ccomp"|"obj\:advneg"|"obj\:advmod")] 
      & #clause >D #suj:[cat=("nsubj"|"csubj")] 
      & #obj    >L #objhead:[] 
      & #suj    >L #sujhead:[] 
      & #sujhead .* #pivot   & #pivot   .* #objhead //SVO//
    • labels : objhead
    • properties : pos
    • count_sub_matches : coché
    • sort_column = freq
    • max_lines=10
    • debug OFF

La console affiche :

pos	F	FROSRCMFUD
NOUN	839
VERB	310
PRON	74
PROPN	68
ADV	24
ADJ	18
DET	2

V2

Refaire les installations de la recette V1, puis,

Tester le bon fonctionnement de la macro TIGERSVOSummary

  • lancer le calcul
  • ouvrir le résultat
  • copier la requête TS d'une cellule
  • lancer l'outil TIGERSearch
  • coller la requête dans le champ de recherche
  • lancer le calcul et visualiser les résultats
  • vérifier
    • que les résultats correspondent bien à l'objectif de la cellule
    • que le décompte des résultats correspond bien à ce qu'indique la cellule
Ne fonctionne pas avec TXM 0.8.0.201908301442, TIGERSearch 1.0.0.201910311387. Avec TXM TXM 0.8.1.202004080952 un autre problème

Message d'erreur :

Démarrage de TXM 0.8.1.202004080952 (2020-04-07 09h16)…
TXM est prêt.

Exécution du script Groovy TIGERSVOSummaryMacro.groovy…
/home/alavrent/queries.ods
based_query=#pivot:[pos="VERB"] 
& #clause:[cat="root" & type="VFin"]
& #clause >L #pivot 
& #clause >D #obj:[cat=("obj"|"ccomp"|"obj\:advneg"|"obj\:advmod")]
& #clause >D #suj:[cat=("nsubj"|"csubj")]
& #obj    >L #objhead:[]  & #suj    >L #sujhead:[]
** Erreur lors de l'exécution du script : java.lang.NullPointerException: Cannot invoke method contains() on null object
Stacktrace: 
[1]  org.txm.rcp.handlers.scripts.ExecuteGroovyScript$1.run  ExecuteGroovyScript.java, 279
java.lang.NullPointerException: Cannot invoke method contains() on null object
	at org.codehaus.groovy.runtime.NullObject.invokeMethod(NullObject.java:91)
	at org.codehaus.groovy.runtime.callsite.PogoMetaClassSite.call(PogoMetaClassSite.java:47)
	at org.codehaus.groovy.runtime.callsite.CallSiteArray.defaultCall(CallSiteArray.java:47)
	at org.codehaus.groovy.runtime.callsite.NullCallSite.call(NullCallSite.java:34)
	at org.codehaus.groovy.runtime.callsite.CallSiteArray.defaultCall(CallSiteArray.java:47)
	at org.codehaus.groovy.runtime.callsite.AbstractCallSite.call(AbstractCallSite.java:116)
	at org.codehaus.groovy.runtime.callsite.AbstractCallSite.call(AbstractCallSite.java:128)
	at org.txm.macro.tiger.exploit.TIGERSVOSummaryMacro.run(TIGERSVOSummaryMacro.groovy:95)
	at org.txm.rcp.handlers.scripts.ExecuteGroovyScript$1.run(ExecuteGroovyScript.java:268)
	at org.eclipse.core.internal.jobs.Worker.run(Worker.java:56)

V3

Importation d'annotations dans un corpus existant.

En particulier contenant de la ponctuation, des structures internes et des éditions, comme des textes de la BFM.

public/spec_exploitation_annotation/calculs_syntax_sov/archives_recettes_sov.txt · Dernière modification: 2020/05/14 16:23 par alexei.lavrentev@ens-lyon.fr