Outils pour utilisateurs

Outils du site


public:retours_de_bugs_logiciel:import_transcriber

Edition

- bugs sur les paroles superposées * identifiant du locuteur * le locuteur “du dessus” est en gras. Il me semble qu'on envisageait de mettre plutôt tous les propos d'enquêteur en gras. * retours à la ligne qd plusieurs segments, ex. int15/[2385.589], int15/[3092.969]

- pour ce qui est des annotations (comme “(rire)”), il me semble que ce serait plus lisible si (i) on mettait un espace avant, et (ii) on les mettait en italiques (pour que cela ressemble moins aux (parties de) mots non prononcé(e)s).

- il faudrait peut-être revoir la reprise des données d'entête du fichier transcriber, par exemple en ayant une version du script adaptée au cas de notre corpus, quitte à garder par ailleurs une version plus générale : * pb d'afficher en gros le nom du fichier audio, qui révèle l'identité de l'interviewée * faut-il afficher également en gros la date, peu significative ici ? * y aurait-il moyen de ne pas afficher toute la liste des locuteurs potentiels, avec les attributs inutilisés ? La seule info éventuellement utile pour nous est d'avoir les id des deux enquêteurs et de l'interviewée -ce qui serait plutôt à récupérer en tant que métadonnée, avec d'autres métadonnées d'ailleurs.

- le gros “end” à la fin : bof

- guillemets à introduire pour les paroles rapportées (une option dans import.properties pourrait définir sur quel événement il faut rajouté des guillemets)

-<Comment desc=“sonnerie de téléphone”/> → [sonnerie de téléphone]

Encodage

- traiter les ^^ : je vais reprendre le guide transcriber et essayer de faire une proposition claire pour tous les codages spécifiques.

public/retours_de_bugs_logiciel/import_transcriber.txt · Dernière modification: 2011/01/26 10:27 par matthieu.decorde@ens-lyon.fr