Analyse Factorielle des Correspondances (AFC)

Objectif

Améliorer l'implémentation courante de l'AFC.

Calculs

calcul de DIST²

L&S propose “DISTO (Distance à l'Origine) contient les carrés des distances à l'origine des axes” (d'après mail BP 2015-05-06).

Volle propose “le calcul de l'inertie est une fonction du carré de la distance (DIST² x poids)” (d'après mail BP 2015-05-06).

Interface

  • présentation du calcul de DIST²

Actuellement les résultats DIST² gagneraient à être présentés de façon plus explicite.

  • Sélection / Filtrage des points affichés

Actuellement il n'y a pas de sélection ni filtrage après calcul de l'AFC

Méthode

La fonctionnalité est définie à partir des références de l'analyse de données et de la lexicométrie, si possible associées à une description explicite et précise des algorithmes voire du pseudo-code voire du code source et d'exemples d'usage concrets pour pouvoir construire une recette.

État de la plateforme

Actuellement l'essentiel de la fonctionnalité est délégué aux méthodes du package FactomineR qui est une implémentation open-source de référence dans la lignée des travaux d'une doctorante de J-P Benzécri.

Certains résultats sont calculés en référence à Volle et L&S.

  • c'est le cas du calcul de DIST²

État de l'art

Il y a beaucoup de littérature, il y a beaucoup d'implémentations : Fortran, C/C++, Java, R, Javascript…

Aspects généraux de l'interaction graphique dont on peut s'inspirer

Interaction visualisation graphique FactoMineR

Sélection, filtrage des points

L'équipe de FactoMineR propose plusieurs voies :

  • Une interface WEB (local) à FactoMineR : “FactoShiny” (basé sur le package R shiny)qui brasse ce qu'on peut faire en options d'affichage et calcul : https://www.youtube.com/watch?v=4T9tDX4aVS4
  • Depuis FactoMineR, une sélection au lieu d'un filtrage avec le paramètre “select” de leur fonction d'affichage “plot.ca”. Par exemple :

select=“cos2 0.6” pour sélectionner les cos2 > 0.6 pour les lignes et colonnes pour différencier le comportements ont peut utiliser les paramètres “selectCol” et “selectRow”. Petite vidéo qui en parle au temps “12:13” : https://www.youtube.com/watch?v=8Iv77jnprGg

Solution

Calcul de DIST²

Le calcul actuel est celui de L&S. [SJ: pour être plus précis, le calcul ne se fait que sur les 5 premiers facteurs. ex. c1^2 + c2^2 + … + c5^2]

Affichage de DIST²

Du coup son affichage doit être 'DIST²'.

Prototype

Sélection, filtrage des points

Dans TXM 0.7.5

En activant la perspective “Laboratoire”, 2 nouveaux paramètres d'AFC sont affichées dans la toolbar de l'éditeur donnant accès directement au contenu des paramètres “selectRow” et “selectCol” de FactoMineR.

Depuis un script Groovy

Donner accès à tous les paramètres d'affichage de FactoMineR :

  • selectRow
  • selectCol
  • Ellipses

Documentation

Utilisateur

La méthode n'est pas encore décrite dans le manuel, seule la mise en oeuvre concrète est documentée.

Développeur

Recette

Les jeux de données utilisées par le Volle sont en cours de numérisation pour pouvoir effectuer une recette.

Calcul de DIST²

Réaliser une AFC à partir du jeu de données X.

Constater que le contenu de la colonne A est similaire à celui de la référence sur le même jeu de données.

Protocole de test

Alpha

Beta

État courant

Qui Quand Quoi

public/specs_afc.txt · Dernière modification: 2018/02/27 11:31 par slh@ens-lyon.fr