Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:faq [2018/06/21 11:00]
slh@ens-lyon.fr
public:faq [2018/06/21 11:22] (version actuelle)
benedicte.pincemin@ens-lyon.fr
Ligne 1349: Ligne 1349:
Pour régler le problème : dans le formulaire de paramètres d'import à la section "Encodage des caractères", il faut sélectionner le bon système d'encodage des caractères((L'option "Deviner" [le système d'encodage des caractères utilisé] ne fonctionne pas à tous les coups. Il vaut mieux travailler avec un système d'encodage connu et unique, et indiqué au moment de l'import.)). Pour régler le problème : dans le formulaire de paramètres d'import à la section "Encodage des caractères", il faut sélectionner le bon système d'encodage des caractères((L'option "Deviner" [le système d'encodage des caractères utilisé] ne fonctionne pas à tous les coups. Il vaut mieux travailler avec un système d'encodage connu et unique, et indiqué au moment de l'import.)).
-Le système d'encodage des caractères UTF-8 est en train de se généraliser sur tous les systèmes d'exploitation, mais certains systèmes continuent à être utilisé par certains systèmes :+Le système d'encodage des caractères UTF-8 est en train de se généraliser sur tous les systèmes d'exploitation, mais certains encodages continuent à être utilisés par certains systèmes d'exploitation :
  * si vous êtes sous Windows : essayer le système "windows-1252"   * si vous êtes sous Windows : essayer le système "windows-1252"
  * si vous êtes sous Mac OS X : essayer le système "MacRoman"   * si vous êtes sous Mac OS X : essayer le système "MacRoman"
Ligne 1364: Ligne 1364:
Remarque pénultième : il arrive que tous les fichiers d'un répertoire de sources n'utilisent pas tous un système unique d'encodage des caractères. Cela peut venir de l'historique des traitements subis par ces fichiers. Dans ce cas il faut redresser certains fichiers vers le système d'encodage unique qui sera utilisé par tous les fichiers. Remarque pénultième : il arrive que tous les fichiers d'un répertoire de sources n'utilisent pas tous un système unique d'encodage des caractères. Cela peut venir de l'historique des traitements subis par ces fichiers. Dans ce cas il faut redresser certains fichiers vers le système d'encodage unique qui sera utilisé par tous les fichiers.
-Remarque finale : il arrive que le système d'encodage varie au sein d'un même fichier source (l'encodage peut varier au caractère près). Suivant l'ampleur de l'hétérogénité il peut être difficile de récupérer le contenu du texte.+Remarque finale : il arrive que le système d'encodage varie au sein d'un même fichier source (l'encodage peut varier au caractère près). Suivant l'ampleur de l'hétérogénéité il peut être difficile de récupérer le contenu du texte.
====== Est il possible d'importer n'importe quel corpus de textes encodés en TEI même s'ils ne sont pas conformes à l'usage TEI du projet BFM ? ====== ====== Est il possible d'importer n'importe quel corpus de textes encodés en TEI même s'ils ne sont pas conformes à l'usage TEI du projet BFM ? ======
public/faq.txt · Dernière modification: 2018/06/21 11:22 par benedicte.pincemin@ens-lyon.fr