Outils pour utilisateurs

Outils du site


public:specs_dictionnaire

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:specs_dictionnaire [2016/01/06 09:05]
matthieu.decorde@ens-lyon.fr
public:specs_dictionnaire [2016/07/19 15:17] (Version actuelle)
alexei.lavrentev@ens-lyon.fr
Ligne 40: Ligne 40:
   * etc.   * etc.
  
-==== Etape A ==== +==== V1 - Palafra ​====
- +
-=== Créer et alimenter un dictionnaire === +
- +
-== Interface utilisateur == +
- +
-L'​Index concatène les propriétés de mots sélectionnés dans une seule colonne. Une évolution qui affiche une colonne par propriété de mot serait + pratique. +
- +
-On aurait ainsi une lecture + facile et des tris + évolués qu'​aujourd'​hui (freq_alpha ou alpha_freq) +
- +
-== Export d'un lexique/​index au format dictionnaire TSV == +
- +
-Il s'agit de développer une nouvelle forme d'​export de l'​actuelle commande Index de TXM avec une colonne par propriété de mot. +
- +
-== Propriétés de structures == +
- +
-Dans un 2e temps, le composant Index devra aussi savoir manipuler les propriétés de structure comme on le fait pour les propriétés de mot. +
- +
-Comme par exemple, projeter un mots par la métadonnée "​text_date"​. +
- +
-La commande Référence,​ apporte un début de solution. +
- +
-=== Composant dictionnaire === +
- +
-Si on ne trouve pas de composant Java qui puisse assurer ce rôle, on peut s'​appuyer en partie sur les développements faits pour l'​étape V1 du projet BHE : +
-  * La persistance JPA : donne un accès simplifié à une base de donnée et gère pas mal de problématiques de sérialisation. +
-  * Les Knowledge repositories. Voir ce qui peut être partagé ou utilisé [[https://​groupes.renater.fr/​wiki/​txm-info/​public/​annotation/​specs_manual_annotation/​specs_referentiel_annotation]] +
-    * Un type pourrait être un vu comme un dictionnaire+
  
 +Implémenter les fonctionnalités nécessaires pour la recette Palafra.
  
  
Ligne 109: Ligne 83:
 (Of course there are even more, including LMF.) (Of course there are even more, including LMF.)
 </​code>​ </​code>​
 +
 +
 +==== Spécifications ====
 +
 +=== Interface d'​accès aux fonctions ===
 +
 +Pour manipuler des dictionaires dans TXM, il faut installer l'​extension "​Dictionary"​ qui rajoute plusieurs commandes dans le menu principal "​Dictionary"​ :
 +  * List : liste tous les dictionnaires
 +    * Pas de paramètre
 +  * Print : affiche dans la console le contenu d'un dictionnaire
 +    * Paramètres : 
 +      * name : le nom du dictionnaire à afficher
 +  * Import : import un dictionnaire depuis un fichier TSV
 +    * Paramètres : 
 +      * tsvFile : le fichier TSV à importer, le nom du dictionnaire à afficher est créé à partir du nom du fichier sans l'​extension
 +  * Import from Index : créé un dictionnaire depuis un Index sélectionné dans la vue Corpus
 +    * Paramètres : 
 +      * name : le nom du dictionnaire à créer/​peupler
 +  * Recode : recode une propriété du dictionnaire à l'aide de règles de conversion
 +      * conversionFile : le fichier TSV de conversion
 +      * type : la propriété à lire
 +      * newType : le propriété à créer ou mettre à jour
 + 
 +=== SQL ===
 +
 +Un gestionnaire de dictionnaire donne accès à la création et la liste des dictionnaires.
 +Un dictionnaire est identifié par un nom unique auquel lui est associé une table SQL (HSQL), les propriétés des entrées du dictionnaire sont codées dans des colonnes de la table.
 +
 +=== JPA ===
 +
 +Un dictionnaire :
 +  * contient ​
 +    * des entrées : 
 +      * ont un identifiant unique
 +      * est exporté sous forme de ligne
 +    * des propriétés : triplets uniques
 +      * ont un identifiant d'​entrée
 +      * ont un identifiant de type
 +      * ont une valeur
 +        * porte son type de donnée : chaine, entier...
 +      * est exporté sous forme de contenu de cellule
 +    * des types :
 +      * ont un identifiant unique
 +      * est exporté sous forme de colonne
 +  * permet de créer, modifier, sélectionner...
 +
 +Implémentation dans une class DictionaryFactory,​ une classe Dictionary et 3 classes JPA (qui étendent la classe Entity) :
 +  * DictionaryFactory : gère les dictionnaires
 +    * création et ouverture
 +    * libération de mémoire
 +    * fermeture
 +    * liste des dictionnaires ouverts
 +  * Dictionary
 +    * a un nom unique
 +    * contient un EntityManager JPA (accès en lecture, écriture aux données persistées)
 +  * Entry
 +    * id de type long
 +  * EntryProperty
 +    * ref de type long
 +    * type de type String
 +    * value de type Serializable (peut contenir String, Integer...)
 +  * EntryPropertyType
 +    * id de type String
 +
  
 ==== Prototypes ==== ==== Prototypes ====
 +
 +voir ticket : [[http://​forge.cbp.ens-lyon.fr/​redmine/​issues/​1635]]
 +
 +
 ==== Version finale ==== ==== Version finale ====
  
Ligne 120: Ligne 162:
 ==== Protocole de test ==== ==== Protocole de test ====
 === Alpha === === Alpha ===
-voir [[https://​groupes.renater.fr/​wiki/​palafra/​public/​lexique_fro]]+voir [[https://​groupes.renater.fr/​wiki/​palafra/​prive/​lexique_fro]]
  
 === Beta === === Beta ===
public/specs_dictionnaire.1452067538.txt.gz · Dernière modification: 2016/01/06 09:05 par matthieu.decorde@ens-lyon.fr