Après le 28 juin

Suite à la réunion du 28 juin, nous avons décidé de faire un rapide bilan sur certains points de façon à échanger des informations entre nous et préparer des thématiques pour l'activité 2013 du groupe nouvelles communications.

  • Le diaporama de Benoit sur l'annotation de corpus non standard est disponible ici.
  • questions de recherche abordés en début de réunion : merci de mettre à jour ces informations dans la description de vos corpus / projet (voir partie "se-présenter")

Vers les pages thématiques

Calendrier et travaux pour 2013

N'hésitez pas à modifier / ajouter suivant vos besoins / ressentis.

  • Septembre 2012 : Rapport du groupe à rendre à l'IR-corpus
  • Décembre : réunion générale de tous les participants à l'IR corpus-écrits (comme l'an passé). Les activités des groupes y seront présentés.

Perspectives pour 2013

Ces différents points seront l'objet de discussions spécifiques sur notre liste interne du groupe nouv-com

  • projets de recherche : plusieurs personnes appartenant à des unités de recherche ont manifesté l'envie de travailler ensemble sur des projets de recherche labellisés scientifiquement. Ce type de projet nécessite non seulement des frais de missions, mais également des ressources pour organiser les données, les traiter, donc un financement spécifique. Des projets inter-mSH étaient orientés cette année ver la préparation de tels projets., notamment le dépôt de projets ANR-Corpus. Or, du fait du changement de gouvernement, le milieu est dans l'expectative pour savoir si l'ANR Corpus, pourtant promise existera ou non. Des réunions au niveau du ministère auront lieu en novembre 2012.
  • données disponibles déjà diffusables . Les textes d'orientation de tous les IR corpus indiquaient dans les critères d'évaluation de ces programmes la nécessité pour les chercheurs français de déclarer des milliers de ressources (données de recherche) dans CLARIN de façon à faire ressortir au niveau européen la contribution française. Même si nous ne sommes pas là pour “faire du chiffre”, notre groupe dispose déjà de nombreuses données qui pourraient faire l'objet de déclaration dans CLARIN. Linda, ingénieur de l'IR corpus-écrits va nous recontacter à ce sujet. On pourrait avoir comme objectif en 2013 de déclarer ainsi une partie de nos données. Voir par exemple pour Mulce déclaré dans CLARIN .
  • corpus de référence du français : une réunion de l'IR corpus s'est tenu en juin 2012 en vue de constituer un corpus de référence du français ( voir sur le site de l'ILF ). Il serait intéressant d'introduire dans ce corpus les données provenant des nouvelles formes de communication. La très grande majorité des données disponibles dans notre groupe sont en français. Certains membres du groupe devraient donc participer aux prochaines réunions de ce projet de façon à signaler notre contribution potentielle au projet national. Ces données, comme les précédentes devront être en accès libre et libres de droit.
  • En 2013, une activité du groupe pourrait se concentrer sur l'intégration des structures des différentes formes de communication (Twitt, blogues, textos, clavardage / chats, forums, etc.) dans la TEI.

Demandes de formations en 2013

En 2012 l'IR corpus et TGE Adonis (qui fusionnent) ont peu investi dans les formations. Il compte faire un effort particulier en ce sens en 2013. Notre groupe pourrait donc demander des formations spécifiques (ouvertes à tus les membres de l'IR corpus de tous les groupes). Pour une partie de ces formations, il serait plus intéressant de les prévoir sur une journée. Le temps passé est limité, la formation peut-être reproduite de façon à permettre à un plus grand nombre d'y participer (au contraire des écoles d'été ou formation sur une semaines pour les projets SHS de numérisation, certes intéressantes mais par nature limitées).

Discutons / listons ici les formations dont on aurait besoin. Merci pour ceux intéressés d'indiquer vos noms ici

  • journée sur processus d'annotation : à partir de corpus disponibles à l'avance et d'outils (logiciels libres d'annotation), mettre en oeuvre une chaîne de traitement, avec segmentation, annotation morpho-syntaxique, voire plus.
    • personnes intéressées :
  • formation TEI : le TGE Adonis accepte de se déplacer aimablement pour organiser localement une telle formation.
  • autre formation ?
public/apres-28-juin/index.txt · Dernière modification: 2012/07/12 10:25 par 83.115.33.143