Outils pour utilisateurs

Outils du site


public:requetes

Exemples de requêtes sur les corpus PALAFRA

Voir la liste des textes du corpus bilingue PALAFRA

Organisation du corpus PALAFRA

  • PALAFRALAT-V1-4 : Corpus latin 
  • PALAFRAFRO-V2 : Corpus français 

Les corpus sont séparés. Le jeu de métadonnées (caractéristiques des textes) est commun.

Les jeux d’étiquettes morphosyntaxiques et les lemmes sont propres à chaque langue. Un jeu d’étiquettes commun est créé.

Afficher la liste des textes du corpus latin

  • Sélectionner le corpus PALAFRALAT-V1-4
  • Faire un clic-droit et sélectionner la fonction « Texte »

Créer un sous-corpus

Pour isoler certains textes de l’ensemble disponible.

Créer un sous-corpus latin

  • Sélectionner le corpus PALAFRALAT-V1-4
  • Faire un clic-droit et sélectionner la fonction « Créer un sous corpus », puis « Textes »
  • Cocher la « Visio Baronti »
  • Cliquer sur « Valider », nommer le sous-corpus Visio Baronti et terminer par Valider à nouveau

Créer un sous-corpus français

  • Sélectionner le corpus PALAFRAFRO-V2
  • Faire un clic-droit et sélectionner la fonction « Créer un sous corpus », puis « Textes »
  • Dans la colonne du milieu, déplier l’onglet « Genre »
  • Cocher « hagiographie  »
  • Dans la colonne du milieu, déplier l’onglet « Date oeuvre »
  • Sélectionner « 1200 » comme limite maximale et cliquer sur « OK »
  • Cliquer sur « Valider », nommer le sous-corpus « Hagiographie » et valider à nouveau

Faire la concordance d’une ou plusieurs formes graphiques d’un même mot

  • Sélectionner le sous-corpus Visio Baronti sous le corpus PALAFRALAT-V1-4
  • Faire un clic-droit et sélectionner la fonction « Concordance »
  • Saisir dans le champ Requête l’expression de recherche (ou requête) suivante : [word=“ipse”] et cliquer sur « Chercher » pour lancer la recherche
  • Saisir la requête : [word=“ipse”%c] (inclut les majuscules)
  • Double-cliquer sur une ligne de la concordance pour retourner au texte
  • Possibilités de tri des concordances et d’affichage des annotations (voir le Tutoriel BFM)

Faire un index (une liste) de formes graphiques d’un même mot

  • Sélectionner le sous-corpus Visio Baronti sous le corpus PALAFRALAT-V1-4
  • Faire un clic-droit et sélectionner la fonction « Index »
  • Saisir la requête : [word=“ips.*”%c]

Glose : cette requête cherche tous les mots commençant par « ips ». La partie « .* » signifie « n’importe quelle séquence de caractères à cet endroit de la requête ».

  • Double-cliquer sur une ligne de l’index pour afficher la concordance correspondante
  • Possibilités de tri des index et d’affichage des annotations (voir le Tutoriel BFM)

Faire un index à partir des propriétés de mots (annotations)

  • Sélectionner le sous-corpus Visio Baronti sous le corpus PALAFRALAT-V1-4
  • Faire un clic-droit et sélectionner la fonction « Index »
  • Taper la requête : [lemma=“ipse”]

Glose : cette requête cherche un mot dont la propriété nommée « lemma » vaut la valeur « ipse » (c’est à dire son lemme)

  • Taper la requête : [pos=“PRO” & casus=“NOMINATIVE” & numerus=“SINGULAR”]

Glose : cette requête cherche tous les mots qui simultanément ont leur propriété « pos » à la valeur « PRO » (sont des pronoms), ont leur propriété « casus » à la valeur « NOMINATIVE » et leur propriété « numerus » à la valeur « SINGULAR »

Faire une concordance de plusieurs mots qui se suivent

Faire une concordance sur des formes graphiques qui se suivent

  • Sélectionner le sous-corpus Hagiographie sous le corpus PALAFRAFRO-V2
  • Faire un clic-droit et sélectionner la fonction « Concordance »
  • Saisir la requête : [word=“en”%c] [word=“.*ant”]

Glose : le premier groupe de « […] » cherche un mot dont la forme est exactement « en », le second groupe cherche un mot immédiatement après le premier dont la forme se termine par « ant »

Faire une concordance de mots qui se suivent à partir de différentes propriétés

  • Sélectionner le sous-corpus Visio Baronti sous le corpus PALAFRALAT-V1-4
  • Faire un clic-droit et sélectionner la fonction « Concordance »
  • Saisir la requête : [lemma=“ipse”] [pos=“NN”]
  • Saisir la requête : [lemma=“ipse”] [pos=“N.*”]
  • Saisir la requête : [lemma=“(ipse|ille)”] [pos=“N.*”]

Faire un index sur des formes graphiques et des propriétés de mots qui se suivent

  • Sélectionner le sous-corpus hagiographie dans le corpus PALAFRAFRO-V2
  • Faire un clic-droit et sélectionner la fonction « Index »
  • Saisir la requête [fropos=“VERppa”]
  • Saisir la requête [fropos=“PRE”] [fropos=“VERppa”]
  • Saisir la requête [fropos=“PRE” & word=“en”%c] [fropos=“VERppa”]

Autres exemples de requêtes sur le corpus latin PALAFRALAT-V1-4

  • parabolare / parabolari : A partir de quelle date et avec quelle fréquence apparaît-il dans notre corpus ? Quelles sont ses attestations ?

Concordance de [lemma=“parabolo”]

  • le lemme mens et le mot-forme mente : Quels sont leurs collocateurs les plus fréquents ?

[] [lemma=“mens”] []

Glose : « [] » signifie « n’importe quel mot à cet endroit dans la requête » [casus=“ABLATIVE”] [word=“mente”]

  • plus + adjectif et magis + adjectif : dresser un graphe comparatif de leurs fréquences ! ajouter la fréquence du comparatif (synthétique) latin 

[word=“(plus|magis)”] [pos=“ADJ”]

  • ad + datif, de + accusatif – des phénomènes fréquents ?

[word=“ad”%c] [casus=“DATIVE”] Pbe sur les fréquences de l’index qui paraissent fausses (1 alors que plusieurs occ. dans la concordance) [word=“de”%c] [casus=“ACCUSATIVE”]

  • Pour souligner l’utilité de notre corpus pour les lexicologues : Quels dérivés de di(ce)re et parabolare/parler dans nos corpus ?

[lemma=“.*dic.*” & pos=“V”]

  • Pour retracer l’histoire des pronoms clitiques : Quelles sont les formes pronominales qui apparaissent immédiatement juxtaposées au verbe ?

([pos=“V”] [pos=“PRO”]) | ([pos=“PRO”] [pos=“V”])

  • Comparer les vies de saints latines quant à leur lexique (en excluant les noms propres, si possible) – quelles sont les vies qui se ressemblent le plus ?

Fonctionnalité « lexique » pour chaque vie

  • Comparer les vies de saints françaises quant à leur lexique – quelles sont les vies qui se ressemblent le plus ? Est-ce qu’elles se ressemblent plus fortement entre elles que les vies latines ?

Idem pour le français

EXPORT des résultats

Cliquer sur le bouton « Exporter » (en bas à droite)

Selon le navigateur que vous utilisez, les résultats de cette opération peuvent varier :

  • si le navigateur ouvre le résultat dans un nouvel onglet ou une nouvelle fenêtre, enregistrez la page affichée (Ctrl + S sous Windows ou Pomme + S sous Mac OS X) dans un fichier ayant une extension « .tsv »
  • si le navigateur vous propose d’ouvrir ou d’enregistrer le fichier, il faut l’enregistrer ; si possible, changez le nom automatique du fichier avant de l’enregistrer, sinon renommez le fichier enregistré
  • vous pouvez rencontrer le problème du « lien cassé » : dans ce cas, il faut supprimer la portion “/txmweb” dans la barre d’adresse de votre navigateur
  • le navigateur peut bloquer l’affichage des fenêtres « pop-up ». Si c’est le cas, il faut les autoriser pour le site bfm-corpus.org

Pour ouvrir la concordance dans un tableur, nous vous recommandons d’utiliser Libre Office Calc, qui permet de choisir les paramètres de conversion plus facilement (vous pouvez ouvrir le fichier en faisant un clic-droit + « ouvrir avec… »). Si vous utilisez Excel, vous devez d’abord ouvrir Excel, puis ouvrir le fichier depuis Excel.

Dans tous les cas, il faut sélectionner les options d'ouverture suivantes :

  • caractère séparateur : tabulation (décocher les autres)
  • délimitateur de texte : aucun
  • encodage de caractères : UTF-8

Une fois la concordance ouverte dans un tableur, nous vous recommandons de l’enregistrer au format « natif » de votre logiciel (.xsl, .xslx pour Excel ou .ods pour Calc).

Voir la « Foire Aux Questions » de la BFM : https://groupes.renater.fr/wiki/bfm-liste/faq/export en cas de difficulté.

public/requetes.txt · Dernière modification: 2017/12/20 16:29 par alexei.lavrentev@ens-lyon.fr