Outils pour utilisateurs

Outils du site


public:ateliers_txm

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:ateliers_txm [2019/03/27 11:15]
slh@ens-lyon.fr
public:ateliers_txm [2019/03/28 19:52] (Version actuelle)
slh@ens-lyon.fr
Ligne 42: Ligne 42:
   * **TXM avancé** (animé par Bénédicte Pincemin ou Serge Heiden) : ce module s'​adresse à des utilisateurs __qui ont déjà une pratique personnelle de TXM__ et souhaitent en acquérir une connaissance plus approfondie et plus complète (signification précise et usage de tel paramètre, CQL avancé, évolutions en préparation...). Par delà les aspects techniques, sont introduits des éléments de méthodologie : trucs et astuces, combinaisons de fonctionnalités,​ etc. C'est un atelier où les participants sont particulièrement invités à interagir et peuvent échanger sur leur expérience effective de TXM, partager leurs savoir-faire,​ discuter des limites du logiciel qu'ils rencontrent dans leur pratique et trouver des solutions à telle ou telle difficulté.\\ Durée : une journée.\\ //​__Prérequis__ : avoir une réelle expérience d'​utilisation de TXM sur ses données.//   * **TXM avancé** (animé par Bénédicte Pincemin ou Serge Heiden) : ce module s'​adresse à des utilisateurs __qui ont déjà une pratique personnelle de TXM__ et souhaitent en acquérir une connaissance plus approfondie et plus complète (signification précise et usage de tel paramètre, CQL avancé, évolutions en préparation...). Par delà les aspects techniques, sont introduits des éléments de méthodologie : trucs et astuces, combinaisons de fonctionnalités,​ etc. C'est un atelier où les participants sont particulièrement invités à interagir et peuvent échanger sur leur expérience effective de TXM, partager leurs savoir-faire,​ discuter des limites du logiciel qu'ils rencontrent dans leur pratique et trouver des solutions à telle ou telle difficulté.\\ Durée : une journée.\\ //​__Prérequis__ : avoir une réelle expérience d'​utilisation de TXM sur ses données.//
  
-  * **Préparation de corpus et import dans TXM** (animé par Serge Heiden) : la formation s'​adresse à des utilisateurs qui ont déjà une connaissance de TXM, par exemple en ayant suivi l'​initiation à TXM, et qui souhaitent gagner en autonomie pour introduire leurs propres données de façon efficace dans le logiciel. L'​objectif est de comprendre la stratégie d'​import de sources dans TXM en fonction des différents formats gérés par la plateforme. Sont abordés en particulier : le paramétrage et le fonctionnement des deux modules d'​import fondamentaux '​TXT+CSV'​ (le texte brut en Unicode) et '​XML/​w+CSV'​ (le format XML), et la façon de préparer ses sources de façon progressive (avec l'aide notamment de l'​éditeur de texte intégré de TXM) en fonction de ce qui est interprété par ces modules dans les sources et des services que l'on souhaite obtenir depuis TXM une fois les corpus importés (quels contrastes on souhaite pouvoir faire entre les textes, entre des structures internes des textes, quels sous-corpus construire, quels mots pré-encoder avec telle ou telle propriété lexicale ou comment paramétrer la segmentation lexicale et l'​étiquetage automatique avec TreeTagger, quelles locutions pré-construire,​ comment paramétrer la pagination des éditions de textes, quelles informations afficher dans les références de concordances,​ etc.). Dans le cadre de la préparation des sources, sont abordées les notions suivantes : format TXT - texte brut (systèmes d'​encodage des caractères et Unicode, polices de caractères,​ systèmes d'​encodage des sauts de ligne entre systèmes d'​exploitation,​ conversion de formats usuels (Word/ODT, PDF, HTML) en TXT), introduction au format XML, transformation TXT vers XML, manipulation de sources par chercher/​remplacer d'​expressions régulières avec reprise de parties de motifs, application de scripts Groovy pour le traitement de fichiers par lot, etc.\\ Durée : une journée. \\ //​__Prérequis__ : avoir suivi l'​atelier Initiation à TXM, ou a minima avoir déjà une connaissance pratique de la textométrie et de ses concepts. Avoir TXM installé sur sa machine, avec TreeTagger intégré. Il est également conseillé d'​avoir LibreOffice installé (pour la gestion des tableaux CSV).//\\ En savoir plus : [[http://textometrie.ens-lyon.fr/​files/​course%20materials/​PreparationEtImportDansTXM.zip|supports de cours de l’atelier préparation & import dans TXM]]+  * **Préparation de corpus et import dans TXM** (animé par Serge Heiden) : la formation s'​adresse à des utilisateurs qui ont déjà une connaissance de TXM, par exemple en ayant suivi l'​initiation à TXM, et qui souhaitent gagner en autonomie pour introduire leurs propres données de façon efficace dans le logiciel. L'​objectif est de comprendre la stratégie d'​import de sources dans TXM en fonction des différents formats gérés par la plateforme. Sont abordés en particulier : le paramétrage et le fonctionnement des deux modules d'​import fondamentaux '​TXT+CSV'​ (le texte brut en Unicode) et '​XML/​w+CSV'​ (le format XML), et la façon de préparer ses sources de façon progressive (avec l'aide notamment de l'​éditeur de texte intégré de TXM) en fonction de ce qui est interprété par ces modules dans les sources et des services que l'on souhaite obtenir depuis TXM une fois les corpus importés (quels contrastes on souhaite pouvoir faire entre les textes, entre des structures internes des textes, quels sous-corpus construire, quels mots pré-encoder avec telle ou telle propriété lexicale ou comment paramétrer la segmentation lexicale et l'​étiquetage automatique avec TreeTagger, quelles locutions pré-construire,​ comment paramétrer la pagination des éditions de textes, quelles informations afficher dans les références de concordances,​ etc.). Dans le cadre de la préparation des sources, sont abordées les notions suivantes : format TXT - texte brut (systèmes d'​encodage des caractères et Unicode, polices de caractères,​ systèmes d'​encodage des sauts de ligne entre systèmes d'​exploitation,​ conversion de formats usuels (Word/ODT, PDF, HTML) en TXT), introduction au format XML, transformation TXT vers XML, manipulation de sources par chercher/​remplacer d'​expressions régulières avec reprise de parties de motifs, application de scripts Groovy pour le traitement de fichiers par lot, etc.\\ Durée : une journée. \\ //​__Prérequis__ : avoir suivi l'​atelier Initiation à TXM, ou a minima avoir déjà une connaissance pratique de la textométrie et de ses concepts. Avoir TXM installé sur sa machine, avec TreeTagger intégré. Il est également conseillé d'​avoir LibreOffice installé (pour la gestion des tableaux CSV).//\\ En savoir plus : [[https://sourceforge.net/​projects/​txm/​files/​course%20materials/​Preparation%20et%20Import%20dans%20TXM%202019.zip/download|supports de cours de l’atelier préparation & import dans TXM]]
  
 ====== Déroulement des ateliers ====== ====== Déroulement des ateliers ======
public/ateliers_txm.txt · Dernière modification: 2019/03/28 19:52 par slh@ens-lyon.fr