UMR Praxiling : Projet Corpus 14

Cette page sert au suivi du projet associant l'UMR Praxiling et l'UMR IHRIM pour utiliser la plateforme TXM pour l'analyse et la diffusion du « Corpus 14 » (http://praxiling.hypotheses.org/188).

Cette page est accessible publiquement. Pour l'éditer, il suffit d'être abonné à la liste de diffusion 'txm-users'.

Retours concernant l'installation d'un portail TXM

cf. la page wiki sur l'installation d'un portail TXM : https://groupes.renater.fr/wiki/txm-info/public/install_a_txm_portal

Mail de GL (2015-07-24 12:32)

En ce qui concerne notre portail TXM qui est resté en panne quelques jours, il a redémarré grâce à une sauvegarde. Cependant, comme la configuration est restée confuse au moment de cette panne, j'ai les remarques suivantes, qui pourraient être utiles pour la prochaine version:

  • memory leaks:
    • Nous ne savons pas d'où ils viennent. Dans mon cas, je ne pense pas qu'il s'agisse de TigerSearch (désactivé pour presque tous les profils)… peut-être les AFC et Spécificités (on sait qu'ils ne sont pas fiables) ?
    • Dans /etc/init.d/tomcat6, j'ai maintenant:

    if [ -z "$JAVA_OPTS" ]; then
            JAVA_OPTS="-Djava.awt.headless=true -Xms512m -Xmx4096m"
…pas sûr que ça a eu un effet, puisque je vois:
tomcat6   1664     1 11 Jul13 ?        1-06:28:46 
/usr/lib/jvm/default-java/bin/java 
  -Djava.util.logging.config.file=/var/lib/tomcat6/conf/logging.properties 
  -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager 
  -Djava.awt.headless=true 
  -Xmx128m 
  -XX:+UseConcMarkSweepGC 
  -Duser.language=en 
  -Djava.endorsed.dirs=/usr/share/tomcat6/endorsed 
  -classpath /usr/share/tomcat6/bin/bootstrap.jar 
  -Dcatalina

  • Voici un message d'erreur relevé dans le log de Tomcat:

INFO: Pausing Coyote HTTP/1.1 on http-8080
Finalize
Sep 21, 2015 1:00:34 PM org.apache.catalina.core.StandardService stop
INFO: Stopping service Catalina
Sep 21, 2015 1:00:37 PM org.apache.catalina.loader.WebappClassLoader checkThreadLocalMapForLeaks
SEVERE: The web application [/txm] created a ThreadLocal with key of type [org.eclipse.osgi.container.Module$1] (value [org.eclipse.osgi.container.Module$1@4e9a4405]) and a value of type [java.lang.Bool
ean] (value [false]) but failed to remove it when the web application was stopped. This is very likely to create a memory leak.
Sep 21, 2015 1:00:37 PM org.apache.catalina.loader.WebappClassLoader checkThreadLocalMapForLeaks

cqi_server_path_to_registry=/usr/share/tomcat6/.TXMWEB/txm/registry/
workspace_location=/usr/share/tomcat6/.TXMWEB/txm/workspaces/default.xml

…qui sont à vérifier… je les avais changés par tentatives, mais je n'ai jamais testé une installation refaite à 0 avec ces fichiers. Je crois aussi qu'il faudrait éliminer de l'installation initiale du portail les deux corpus exemples (qui peuvent influencer les deux paramètres précédents). D'une façon générale, il y a sans doute un travail à faire sur la documentation d'installation.

PS : Il y aurait aussi ces noms de fichiers à corriger:

/usr/share/tomcat6/.TXMWEB/txm/logs/TXM-2015-24-06.log

Mail de GL (2015-07-24 17:40)

PS: juste pour être complet, j'ajoute d'autres points concernant le portail, déjà discutés, mais que nous aimerions résoudre… (si je peux contribuer à trouver une solution, n'hésitez pas à me faire savoir)

  • accès “direct” à un certain texte dans un corpus avec édition synoptique (sans avoir à sélectionner les éditions)
    • Discuté avec Alexei (sur ce point le scénario dans Corpus 14 devrait être différent par rapport à la BFM, puisque dans Corpus 14 l'ensemble des textes est lié et donc la sélection ramène actuellement au premier texte).
    • AL (2015-07-28): Je ne me souviens plus de cette discussion, et je n'en trouve pas de trace dans mes archives mail. Peux-tu nous rappeler ce que tu cherches à afficher exactement ?
    • GL (2015-08-17): J'ai dû le mentionner dans un mail ancien, mais on n'en a peut-être pas discuté en détail. En fait, c'est simple: dans Corpus 14, on a un ensemble de textes qui par défaut sont ouverts dans le portail avec l'édition “default” (cad sans images); si dans le menu en bas à droite, je sélectionne également l'édition synoptique (chez nous, édition “source”), alors on passe bien en mode synoptique, mais on revient toujours au premier texte! …et il faudrait parcourir séquentiellement tous les textes pour rester dans ce mode (en retournant à la liste de textes, le texte sélectionné s'ouvre en mode “default”). J'ai oublié quelque chose dans la configuration?
    • Dans la BFM, je ne connais que le GRAAL qui ait le choix des éditions, mais dans ce corpus il n'y a qu'un seul texte.
    • AL (2015-08-18): D'accord, il faudrait effectivement ajouter la possibilité d'afficher une édition synoptique en cliquant sur l'icone “édition”. En attendant que le développement se fasse, il est possible de créer des liens vers un affichage synoptique d'un texte donné sur la “page d'accueil” d'un corpus. C'est ce qui se passe dans le Graal lorsqu'on clique sur le “bouton Edition” dans la page http://txm.bfm-corpus.org/?command=documentation&path=/GRAAL (on peut générer une liste de tous les textes d'un corpus et mettre les liens nécessaires, voir le Manuel admin pour connaitre la syntaxe).
  • association balises TEI - métadonnées TXM (par exemple pour les balises incluses dans le <teiHeader>)

Actuellement il faudrait passer par metadata.csv.

  • création de sous-corpus avec éditions synoptiques
    • Remarques de Bénédicte:
      • GL : Avec structure, j'arrive à créer un sous-corpus, mais ensuite on ne peut pas accéder aux textes.
      • BP : Je viens d'essayer de faire la même chose sur un corpus de notre portail démo, et je n'ai pas de problèmes par exemple pour construire une partition par texte (1 partie = 1 texte) à l'intérieur d'un sous-corpus construit par une structure.
      • BP : Tu veux dire plutôt que la commande Textes, pour accéder aux éditions, n'est plus disponible ? Je crains que ce ne soit de fait le comportement choisi actuellement, parce qu'on ne savait pas contrôler le fait que la navigation dans l'édition (d'un texte à l'autre, etc.) ne “sorte” pas des limites du sous-corpus, et on aurait donc eu un comportement trompeur. Dans la version bureau de TXM, la commande est (encore) disponible (mais donc potentiellement trompeuse) (testé pour 0.7.6 et 0.7.7 beta).



Retour à la liste des projets.

public/umr_praxiling_corpus_14.txt · Dernière modification: 2016/10/25 15:50 par slh@ens-lyon.fr