Liste de liens :
Liste de liens :
revenir à l'accueil
CQP est maintenu par le projet IMS Open Corpus Workbench (CWB).
Des adaptations ont été réalisées dans le moteur CQP par le projet Textométrie pour son intégration dans la plateforme TXM, notamment :
sudo apt-get install pcre glib gcc flex bison default-jdk
La syntaxe des attributs de structures ou de mots semble être définie par celle du symbole 'id' du fichier de définition du scanner lexical 'parse.l' (automate LEX) utilisé par le parseur 'parse.y' (automate YACC) :
digits [0-9]+ exponent [eE][+-]?{digits} floatconst [+-]?{digits}[\.]{digits}{exponent}? letter [a-zA-Z_\x80-\xff] xletter [a-zA-Z0-9_\-\.\x80-\xff] idletter [a-zA-Z_] xidletter [a-zA-Z0-9_\-\.] var \${letter}{xletter}* id {idletter}{xidletter}*(:{xidletter}+)?(^{xidletter}+)? flags %[a-z]+ string \"(\\[^\n]|\"\"|[^"\n])*\"|\'(\\[^\n]|\'\'|[^'\n])*\'