Outils pour utilisateurs

Outils du site


public:spec_exploitation_annotation:calculs_syntax_sov:archives_recettes_sov

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

public:spec_exploitation_annotation:calculs_syntax_sov:archives_recettes_sov [2020/05/14 16:23] (Version actuelle)
alexei.lavrentev@ens-lyon.fr créée
Ligne 1: Ligne 1:
 +===== Recettes TXM 0.8.0 =====
  
 +==== V1 ====
 +
 +=== Installer l'​extension TIGERSearch ===
 +
 +  * Installer TXM 0.8.0 à partir de [[http://​textometrie.ens-lyon.fr/​files/​software/​TXM/​0.8.0/​]]
 +  * Régler le niveau de mise à jour à ALPHA
 +    - sélectionner le menu "​Édition > Préférences"​
 +    - aller dans "TXM > Avancé"​
 +    - sélectionner le niveau de mise à jour "​ALPHA" ​
 +  * Installer l'​extension
 +    - sélectionner le menu "​Fichier > Ajouter une extension"​
 +    - sélectionner "​TIGERSearch"​
 +    - valider
 +    - valider les étapes d'​installation et redémarrer TXM
 +
 +=== Charger le corpus SRCMF TXM au format TIGER-UD ===
 +
 +  * télécharger le corpus binaire de test FROSRCMFUD (srcmf-ud) : [[https://​sharedocs.huma-num.fr/​wl/?​id=SIQTFMlK7XOjZlM7CK3aaRJJJeiUZ3kj]]
 +    * le corpus XMLTS est la version du corpus SRCMF publiée sur le site Universal Dependencies
 +    * il contient des phrases de plusieurs textes (mais pas d'​unités textuelles au sens TXM)
 +    * <​del>​il contient de nouvelles métadonnées (notamment siècle et genre)</​del>​ (ces métadonnées sont à rétablir dans une version ultérieure)
 +    * il ne contient pas de ponctuation (les textes CQP ont été produits à partir du TS)
 +  * dans TXM, charger le corpus depuis le menu Fichier > Charger > un corpus binaire (.txm)
 +
 +=== Tester le bon fonctionnement du corpus ===
 +
 +  * dans TXM, sélectionner le corpus
 +  * ouvrir l'​interface d'​interrogation par requête TIGER (icone tête de tigre)
 +  * cliquer sur la roue dentée pour ouvrir la zone de paramètres et copier-coller la requête suivante dans le champ requête : <code oobas>
 +#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +//& #​clause:​[cat!=("​root"​|"​Insrt"​) & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 + 
 +// & #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //SVO//
 +// & #sujhead .* #objhead & #objhead .* #pivot //SOV//
 +// & #objhead .* #sujhead & #sujhead .* #pivot //OSV//
 +& #objhead .* #​pivot ​  & #​pivot ​  .* #sujhead //OVS//
 +// & #​pivot ​  .* #sujhead & #sujhead .* #objhead //VSO//
 +// & #​pivot ​  .* #objhead & #objhead .* #sujhead //VOS//
 +</​code>​
 +  * lancer le calcul
 +  * on doit trouver 494 phrases (ordre OVS)
 +
 +=== Tester le bon fonctionnement de la macro TIGER Summary ===
 +
 +<​note>​Remarque : les répertoires "​tiger-2019-xx-xx"​ correspondent aux versions précédentes des macros.</​note>​
 +
 +   * ouvrir la vue "​Macro"​
 +   * lancer la macro "​tiger/​exploit/​TIGERSummary"​ avec les paramètres suivants :
 +     * tiger_query : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #objhead .* #​pivot ​  & #​pivot ​  .* #sujhead //OVS//
 +</​code>​
 +     * count_subgraph : coché
 +     * debug : OFF
 +
 +La console affiche : <​code>​ FROSRCMFUD
 +F 494</​code>​
 +
 +=== Tester le bon fonctionnement de la macro TIGER Ratio ===
 +
 +   * lancer la macro "​tiger/​exploit/​TIGERRatio"​ avec les paramètres :
 +     * tiger_query_A (requête SVO) : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //​SVO//</​code>​
 +     * tiger_query_B (requête SOV) : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #sujhead .* #objhead & #objhead .* #pivot //​SOV//</​code>​
 +     * count_subgraph : coché
 +     * debug : OFF
 +
 +La console affiche : <​code>​[FROSRCMFUD:​1335]
 +[FROSRCMFUD:​1152]
 +R = 1335 / 1152 = 1.16
 +Done.</​code>​
 +
 +=== Tester le bon fonctionnement de la macro TIGER Index ===
 +
 +   * lancer la macro "​tiger/​exploit/​TIGERIndex"​ avec les paramètres :
 +     * tiger_query : <code oobas>#​pivot:​[pos="​VERB"​]
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #pivot
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)] ​
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)] ​
 +& #obj    >L #​objhead:​[] ​
 +& #suj    >L #​sujhead:​[] ​
 +& #sujhead .* #​pivot ​  & #​pivot ​  .* #objhead //​SVO//</​code>​
 +     * labels : objhead
 +     * properties : pos
 +     * count_sub_matches : coché
 +     * sort_column = freq
 +     * max_lines=10
 +     * debug OFF
 +
 +La console affiche : <​code>​pos F FROSRCMFUD
 +NOUN 839
 +VERB 310
 +PRON 74
 +PROPN 68
 +ADV 24
 +ADJ 18
 +DET 2</​code>​
 +
 +==== V2 ====
 +
 +Refaire les installations de la recette V1, puis,
 +
 +=== Tester le bon fonctionnement de la macro TIGERSVOSummary ===
 +
 +  * lancer le calcul
 +  * ouvrir le résultat
 +  * copier la requête TS d'une cellule
 +  * lancer l'​outil TIGERSearch
 +  * coller la requête dans le champ de recherche
 +  * lancer le calcul et visualiser les résultats
 +  * vérifier
 +    * que les résultats correspondent bien à l'​objectif de la cellule
 +    * que le décompte des résultats correspond bien à ce qu'​indique la cellule
 +
 +<note warning>​Ne fonctionne pas avec TXM 0.8.0.201908301442,​ TIGERSearch 1.0.0.201910311387. Avec TXM TXM 0.8.1.202004080952 un autre problème</​note>​
 +Message d'​erreur :
 +<​code>​
 +Démarrage de TXM 0.8.1.202004080952 (2020-04-07 09h16)…
 +TXM est prêt.
 +
 +Exécution du script Groovy TIGERSVOSummaryMacro.groovy…
 +/​home/​alavrent/​queries.ods
 +based_query=#​pivot:​[pos="​VERB"​] ​
 +& #​clause:​[cat="​root"​ & type="​VFin"​]
 +& #clause >L #​pivot ​
 +& #clause >D #​obj:​[cat=("​obj"​|"​ccomp"​|"​obj\:​advneg"​|"​obj\:​advmod"​)]
 +& #clause >D #​suj:​[cat=("​nsubj"​|"​csubj"​)]
 +& #obj    >L #​objhead:​[] ​ & #suj    >L #sujhead:[]
 +** Erreur lors de l'​exécution du script : java.lang.NullPointerException:​ Cannot invoke method contains() on null object
 +Stacktrace: ​
 +[1]  org.txm.rcp.handlers.scripts.ExecuteGroovyScript$1.run ​ ExecuteGroovyScript.java,​ 279
 +java.lang.NullPointerException:​ Cannot invoke method contains() on null object
 + at org.codehaus.groovy.runtime.NullObject.invokeMethod(NullObject.java:​91)
 + at org.codehaus.groovy.runtime.callsite.PogoMetaClassSite.call(PogoMetaClassSite.java:​47)
 + at org.codehaus.groovy.runtime.callsite.CallSiteArray.defaultCall(CallSiteArray.java:​47)
 + at org.codehaus.groovy.runtime.callsite.NullCallSite.call(NullCallSite.java:​34)
 + at org.codehaus.groovy.runtime.callsite.CallSiteArray.defaultCall(CallSiteArray.java:​47)
 + at org.codehaus.groovy.runtime.callsite.AbstractCallSite.call(AbstractCallSite.java:​116)
 + at org.codehaus.groovy.runtime.callsite.AbstractCallSite.call(AbstractCallSite.java:​128)
 + at org.txm.macro.tiger.exploit.TIGERSVOSummaryMacro.run(TIGERSVOSummaryMacro.groovy:​95)
 + at org.txm.rcp.handlers.scripts.ExecuteGroovyScript$1.run(ExecuteGroovyScript.java:​268)
 + at org.eclipse.core.internal.jobs.Worker.run(Worker.java:​56)
 +</​code>​
 +
 +==== V3 ====
 +
 +Importation d'​annotations dans un corpus existant.
 +
 +En particulier contenant de la ponctuation,​ des structures internes et des éditions, comme des textes de la BFM.
public/spec_exploitation_annotation/calculs_syntax_sov/archives_recettes_sov.txt · Dernière modification: 2020/05/14 16:23 par alexei.lavrentev@ens-lyon.fr