Outils pour utilisateurs

Outils du site


public:spec_exploitation_annotation

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:spec_exploitation_annotation [2017/11/10 14:32]
slh@ens-lyon.fr
public:spec_exploitation_annotation [2019/10/03 11:37] (Version actuelle)
alexei.lavrentev@ens-lyon.fr [Annotation syntaxique]
Ligne 19: Ligne 19:
 ===== Annotation de textes - métadonnées ===== ===== Annotation de textes - métadonnées =====
  
-  ​* metadata.csv+==== Solution ==== 
 + 
 +  ​on importe un fichier ​metadata.csv 
 +  * on édite les métadonnées en page de garde des éditions 
 +  * on exploite à travers la structure '​text'​ de CQP
  
 ===== Annotation infra textes - structuration,​ etc. -> plans textuels ===== ===== Annotation infra textes - structuration,​ etc. -> plans textuels =====
  
-  ​* XML-TEI+==== Solution ==== 
 + 
 +  ​on importe une représentation ​XML-TEI 
 +  * on édite les métadonnées en page de garde des éditions 
 +  * on exploite à travers les structures '​text'​ de CQP
  
 ===== Annotation lexicale ===== ===== Annotation lexicale =====
  
-  ​* TreeTagger+==== Solution ==== 
 + 
 +  ​on importe une représentation XML-TEI ou on fait appeler ​TreeTagger ​à la volée 
 +  * on édite les propriétés de mots dans des flyover des éditions 
 +  * on exploite à travers CQP
  
 ===== Annotation syntaxique ===== ===== Annotation syntaxique =====
  
-  * TIGERSearch+ 
 + 
 +Exploitations syntaxiques : 
 +   * [[public:​spec_exploitation_annotation:​calculs_syntax_sov|Requêtes et statistiques SVO, SOV, OSV, OVS, VSO, VOS]] 
 +   * [[public:​spec_exploitation_annotation:​spec_tiger_ud|Exploitation des annotations syntaxiques UD avec TIGERSearch]] 
 + 
 +==== Visualisation ==== 
 + 
 +  * [[https://​sourceforge.net/​projects/​grammarscope|Grammarscope]] 
 +  * [[http://​chaoticity.com/​dependensee-a-dependency-parse-visualisation-tool|DependenSee]] 
 +  * [[http://​wikilligramme.loria.fr/​doku.php/​dep2pict:​dep2pict|Dep2pict]] 
 + 
 + 
 +==== Solution 1 ==== 
 + 
 +  * on importe une représentation TIGERSearch 
 +  * on édite les graphes syntaxiques dans des résultats TIGERSearch 
 +  * on exploite à travers TIGERSearch 
 + 
 +==== Solution 2 ==== 
 + 
 +  * on importe une représentation Icarus ? 
 +  * on édite les graphes syntaxiques Icarus 
 +  * on exploite à travers Icarus
  
 ===== Annotation sémantique ===== ===== Annotation sémantique =====
  
-  ​* SyMoGIH+==== Solution ==== 
 + 
 +  ​on annote par concordances des catégories ​SyMoGIH ​ou autre 
 +  * on exploite à travers CQP
  
 ===== Annotation URS-Glozz-Analec ===== ===== Annotation URS-Glozz-Analec =====
Ligne 48: Ligne 86:
 Il s'agit ensuite de combiner l'​exploitation de ces annotations avec les autres annotations comme les structures CQL. Remarque : si CQL s'​avère trop limité pour gérer les structures d'​origine,​ on peut envisager une combinaison plutôt avec le moteur XQuery sur la base de la représentation XML-TXM des textes. Il s'agit ensuite de combiner l'​exploitation de ces annotations avec les autres annotations comme les structures CQL. Remarque : si CQL s'​avère trop limité pour gérer les structures d'​origine,​ on peut envisager une combinaison plutôt avec le moteur XQuery sur la base de la représentation XML-TXM des textes.
  
-==== Spécifications ==== 
  
-On commence par étendre les macros de mesure initiales au corpus structuré et partitionné. 
  
 ==== Solution ==== ==== Solution ====
  
-  * [[https://​groupes.renater.fr/​wiki/​txm-users/public/umr_lattice/democrat/public/manuel_utilisation_extension_analec#macros_d_exploitation_des_annotations_urs|macros d'exploitation des annotations URS]]+  ​* on annote avec l'​extension Analec 
 +  ​* [[https://​groupes.renater.fr/​wiki/​txm-info/public/annotation/specs_annotation_analec/​exploitation|on exploite par macros, CQP, etc.]] 
 +    * [[https://​groupes.renater.fr/​wiki/​txm-info/public/annotation/​specs_annotation_analec/​exploitation#macros_de_mesures_1|mesures 1]] 
 +    * [[public:​spec_exploitation_annotation:​spec_urs_mesures2|mesures 2 sur corpus structuré et partitionné]] 
 +    * [[public:​annotation:​specs_annotation_analec/​exploitation#​exploitation_par_le_biais_de_cqp|exploitation par le biais de CQP]] 
 + 
 +FEATURE 
 +  * remplacer la fenêtre SWING de gestion de la structure 
 +  * macro de vérification du corpus DEMOCRATLYON : annotation Democrat 
 +    * macro de vérification ​des doublons de CHAINE :  
 +    * macro de suppression valeurs non utilisées : CheckAnnotationStructureValues 
 +    * macro de suggestion de fusion de valeurs utilisées proches : 
 +  * annuler sélection dans progression par clic dans blanc 
 +  * hyperlien Progression -> Concordance avec une liste de match 
 +  * développer la gestion des hyperliens depuis une page HTML ouverte dans TXM 
 +  * UnitIndex : affichage dans une page HTML avec des hyperliens vers Progression/​Concordance/​etc. 
 +  * description Partition : afficher les tailles dans la console 
 +  * description Partition : afficher les stats fmin, fmax, v et t total et idem pour chaque partie 
 +  * gestion de datation de sauvegardes de corpus 
 +    * créer une UI lors de l'​export du binaire 
 +      * champ Description suffisamment grand 
 +    * construire le nom du fichier binaire proposé à la sauvegarde avec le pattern suivant : NOMCORPUS-YYYY-MM-DD-hh-mm.txm 
 +    * la description est enregistrée dans la description du corpus 
 +  * calculs d'​Analec [[manuel Analec]] 
 +    * Correlations [[manuel Analec#​23]] 
 +    * AFC [[manuel Analec#​24]] 
 +    * Valeurs typiques [[manuel Analec#​25]] 
 +  * option Progression : afficher points ; afficher lignes 
 +BUG 
 +  * synchro corpus Analec lors d'​import/​chargement/​suppression de corpus 
 +  * progression sur tout DEMOCRATLYON3 : chart qui bug parce que y'a duplication 
  
public/spec_exploitation_annotation.1510320764.txt.gz · Dernière modification: 2017/11/10 14:32 par slh@ens-lyon.fr