Liste de liens :
Liste de liens :
Aider PG à calculer des topic maps malgré les limitations de la bibliothèque MATLAB qu'il utilise pour des “petits” corpus.
Proposer une première implémentation d'un calcul populaire en SHS, qu'il faudrait comparer aux usages de l'algorithme Reinert.
Démontrer la facilité avec laquelle on peut intégrer un outil Java natif dans TXM, en particulier un outil populaire.
Peut-être interfacer d'autres services de la librairie MALLET et surtout associer les capacités d'import versatiles de TXM avec les possibilités de MALLET.
Amorcer une pompe d'intégration d'outils natifs Java utiles et populaires, en particulier les outils de TAL/NLP :
L'idée est de s'appuyer sur l'application de base topic-modeling-tool (A graphical user interface tool for Latent Dirichlet Allocation topic modeling) écrite en Java Swing et s'appuyant sur la librairie Java MAchine Learning for LanguagE Toolkit (MALLET) pour implémenter une première version d'interface utilisateur de calcul de topic maps. Il s'agit de remplacer les procédures d'import de MALLET par celles de TXM et l'UI de topic-modeling-tool par celle d'une nouvelle commande TXM appelée 'Topics' appliquée à une partition (ou à un corpus si on suit la stratégie optimisée pour les grands corpus).
La série de tutoriels Text Analysis with Topic Models for the Humanities and Social Sciences (TAToM) construite à partir de Python, NumPy, Matplotlib et MALLET peut servir avantageusement pour la recette de l'extension dans la mesure où l'environnement TXM fournit déjà des services équivalents à Python, NumPy et Matplotlib.
Éléments de solution