Ceci est une ancienne révision du document !


Projets de corpus exemples

Construction d'un corpus des oeuvres de Jules Verne

Wikisource propose plusieurs oeuvres intéressantes : http://fr.wikisource.org/wiki/Auteur:Jules_Verne

Par exemple “Vingt mille lieues sous les mers” se trouve ici : http://fr.wikisource.org/wiki/Vingt_mille_lieues_sous_les_mers

Plusieurs formats sont disponibles :

Format EPUB

Outils EPUB

Outils HTML

  • Tidy sait convertir du HTML en XHTML:

tidy -asxhtml -numeric -utf8 -o vingt_mille.xhtml index.html

Outils XHTML

  • OxGarage sait convertir XHTML en XML TEI P5

Outils DOCX

Outils TEI

public/projets_corpus.1456082797.txt.gz · Dernière modification: 2016/02/21 20:26 par slh@ens-lyon.fr