Aspiration web pour la construction de corpus

Objectif

Aider à récupérer des données textuelles à partir d'Internet.

Méthode

Description de la méthode de travail pour atteindre l'objectif.

État de la plateforme

Avancement dans l'élaboration de la solution.

Solution

Description de la solution choisie ou des solutions à choisir.

État de l'art

  • En ligne
  • Python
    • Apache Nutch ([[https:florianhartl.com/nutch-installation.html|tutoriel d'installation)) ==== Prototypes ==== Premières réalisations concrètes de la solution. === Alpha ou Étape 1 === === Beta ou Étape 2 === ==== Version finale ==== ===== Documentation ===== Si possible, développer la documentation en même temps que la solution. ==== Utilisateur ==== ==== Développeur ==== ===== Recette ===== Tutoriel décrivant explicitement étape par étape l'usage concret de la solution pour valider sa conformité par rapport aux objectifs. === Alpha ou Étape 1 === === Beta ou Étape 2 === etc.
public/web_scraping.txt · Dernière modification: 2017/01/20 14:30 par slh@ens-lyon.fr