Les objectifs de l'atelier Initiation à TXM sont non seulement de vous apprendre à utiliser TXM, mais aussi de vous permettre de le faire dans votre propre environnement de travail, et de repartir de la formation avec un TXM bien installé et bien configuré (la configuration de certaines fonctionnalités, comme l'export de résultats, est finalisée pendant l'atelier).
C'est pourquoi nous recommandons à chacun :
L'installation n'est a priori pas compliquée, mais comme TXM s'installe dans une très grande diversité d'environnements on peut toujours avoir des surprises, d'où notre prudence.
Voici les informations utiles pour les installations.
Les instructions de téléchargement et d'installation de la version courante sont indiquées à la page suivante https://txm.gitpages.huma-num.fr/textometrie/Telecharger/ 1)
Une fois la procédure d'installation terminée, vous pouvez faire une première vérification de la bonne installation de TXM :
Par ailleurs, le manuel de TXM est disponible en ligne :
Nous vous remettrons une version imprimée du manuel au début de l'Atelier (pour les ateliers qui ont lieu à Lyon).
Installation de l'extension TreeTagger (pour l'étiquetage morphosyntaxique et la lemmatisation des textes) :
https://pages.textometrie.org/txm-manual/installation.html#sec:extension-install-treetagger
Vous pouvez ensuite tester que TreeTagger est opérationnel dans votre TXM pour le modèle du français, que nous utiliserons dans l'atelier :
Les tableaux de résultats exportés par TXM -vus dans l'atelier initiation-, comme l'import de tableaux de métadonnées pour vos corpus -vu au moment de l'atelier Préparation de corpus et import-, utilisent le format de fichier .csv. Pour la manipulation de fichiers CSV, il est recommandé d'avoir LibreOffice ou OpenOffice installé sur son ordinateur :
Il est possible d'utiliser un autre tableur comme Excel, mais cela est beaucoup plus compliqué (Excel “cache” beaucoup de paramètres pour simplifier l'usage courant), et nous n'avons généralement pas le temps en séance pendant l'atelier de résoudre toutes les complications qui peuvent se présenter pour les différents environnements. On trouvera néanmoins de l'aide sur la FAQ pour certaines questions, par exemple :
L'Atelier d'initiation utilise le corpus VOEUX. Ce corpus est pré-installé dans TXM, comme corpus exemple.
Pendant l'atelier Initiation, nous expérimenterons l'import le plus simple, dit “presse-papier”, reposant sur un simple copier/coller.
Autant que vous en profitiez pour voir ce que cela donne sur l'un de vos fichiers. Vous pouvez donc juste réfléchir avant de venir à apporter dans votre ordinateur un fichier représentant un texte (au sens large : ce peut être une transcription par exemple) d'une dizaine de pages (disons entre trois et cent !), ou un petit corpus (ou un échantillon d'un grand corpus) mis sous la forme d'un seul fichier, dans la langue de votre choix (il peut être intéressant que ce soit une langue pour laquelle vous avez installé un modèle TreeTagger). Prenez un format où la commande “copier” fonctionne : un fichier que vous ouvrez dans votre traitement de texte (.doc, .docx, .rtf, .odt, .txt…), une page web (plutôt longue) ; évitez les .pdf ou vérifiez avant que le texte peut être sélectionné et copié (pas de pdf “image”).
Pour l'atelier préparation et import de corpus télécharger et dézipper l'archive de supports de cours et de corpus exemples depuis l'adresse suivante : https://sourceforge.net/projects/txm/files/course%20materials/Preparation%20et%20Import%20dans%20TXM%202019.zip/download (il faut attendre 5 secondes avant que le téléchargement se déclenche)
Si vous avez des difficultés à installer TXM, que vous avez bien consulté la FAQ (pour toutes les questions concernant l'installation et le lancement), et que votre entourage professionnel ou personnel ne peut pas vous aider, contactez-nous (textometrie AT groupes.renater.fr).