Les fichiers de conversion à jour se trouvent dans le disque partagé : conversions
La première étape consiste à établir les correspondances entre les jeux Cattex2009, AFRLEX (NCA) et PALM. Tous les tableaux de correspondances sont rassemblés dans une base de données TAGSETS.odb stockée dans le dossier :
smb://ensldfs/services/Laboratoires/labo_ana_corpus/Projets/BFM/Etiquetage
Dans un premier temps, on utilise le jeu CATTEX2009 “dégradé” comme pivot des conversions. Une conversion en multext des différents états du jeu Cattex peut être envisagée dans un deuxième temps.
Les relations entre les différents tableaux de données sont représentées dans le graphe suivant :
Problèmes :
Tableau de conversion
PALM ctx9-palm A ADJxxx ADV ADVxxx CONJC CONcoo CONJS CONsub DET DETxxx INTJ INJ Nc NOMcom Np NOMpro NUMcard ADJcar|DETcar|PROcar NUMord ADJord|PROord Ponctuation PONxxx PREP PRE PRO PROxxx V VERxxx
Tableau de conversion
\(\?\) OUT \(null\) OUT adj\., adv.* subst.* APD+ADV+NOMcom adj\., subst.* adv.* APD+ADV+NOMcom adj\..* subst.* APD+NOMcom adj\..*adv\. APD+ADV adj\..* pron\..* APD+PRO adj.* APD adv\..*prép\..*subst.* ADV+PRE+NOMcom adv\..*conj.* ADV+CON adv\..*prép.* ADV+PRE adv\..*adj.* ADV+APD adv\..*subst. ADV+NOMcom adv\..* ADV art\..*adj. DET+APD art.* DET conj\..*rel.* CON+APD conj\..*adv.* CON+ADV conj.* CON dém. APD indéf\..*adv.* APD+ADV indéf.* APD indéterminé OUT interj\..*subst.* INJ+NOMcom interj.* INJ interr.* APD loc\..*lat. ETR loc\..*adv.* ADV loc\..*conj.* CON loc.* OUT mot étranger ETR mot exclu OUT mot lat.* ETR nombre APD nom de lieu NOMpro nom propre.* subst.* NOMpro+NOMcom nom propre.* NOMpro num.* APD part.* VER ponctuation PON poss.* APD préf.* OUT prép. + pron. pers. PRE.PRO prép\..*adv.* PRE+ADV prép\. et art. contractés PRE.DETdef prép\..*conj.* PRE+CON prép.* PRE pron\. adv. et pers\. APD+PRO pron\..*adv.* APD+ADV pron\. pers.* PRO pron.* APD rel.* APD subst\..*adj\..*adv.* NOMcom+APD+ADV subst\..*adv\..*pron.* NOMcom+ADV+APD subst\..*adj.* NOMcom+APD subst\..*adv.* NOMcom+ADV subst\..*pron.* NOMcom+APD subst\..*interj.* NOMcom+INJ subst.* NOMcom suff.* OUT -.* OUT verbe.* VER
Tableau de conversion (utilisant des expressions régulières, l'ordre de traitement est significatif)
ABR OUT ADJ.* APD ADV.* APD AdV.* APD CON.* CON DETdef DET DETndf DET DET.* APD ETR.* ETR INJ.* INJ INT INJ NOMcom NOMcom NOMpro NOMpro OUT OUT PONfrt PONfrt PON.* PON PRE.* PRE PROper PRO PRO.* APD RED OUT RES OUT VER.* VER
Voir la page correspondante sur le wiki BFM.