Outils pour utilisateurs

Outils du site


public:import:spec_estimations_import

Ceci est une ancienne révision du document !


Estimations des ressources nécessaires pour importer un corpus

Objectif

Pouvoir prévenir un utilisateur qui souhaite importer un corpus de la quantité de ressources nécessaires :

  • en temps
  • en volume de mémoire vive
  • en volume de stockage
  • etc.

Méthode

Plusieurs façons de calculer l'estimation :

  • à priori, avec des règles (ex: le corpus contient X mo de texte brut, le corpus binaire fera X*N mo une fois importé)
  • à posteriori, en compilant des statistiques d'import des corpus précédemment importés
  • proposer un benchmark, pour les cas extrêmes, sur l'un des corpus demo ou bien sur un sample du corpus réel (quand l'utilisateur a défini le répertoire des sources et que le fichier import.xml est créé, le temps pourrait être estimé et affiché ici)
public/import/spec_estimations_import.1486068448.txt.gz · Dernière modification: 2017/02/02 21:47 par sebastien.jacquot@univ-fcomte.fr