Menu | Rôle | |
---|---|---|
Textes | Affiche les textes disponibles dans la BEFM : vous pouvez déplacer les colonnes, les masquer | |
Dimensions | Affiche des informations chiffrées sur le corpus | |
Créer un sous-corpus | Constituer un corpus avec une partie des textes de la BEFM | |
Lexique | Indique la fréquence d'apparition de chaque mot, lemme ou annotation grammaticale, dans le corpus | |
Index | Indique la fréquence d'apparition de l'élement correspondant à votre reqête CQL | |
Concordance | Affiche l'élement correspondant à votre requête CQL avec une portion du texte se situant avant et après dans le document | |
Contexte | Affiche l'élement correspondant à votre requête CQL dans une portion du texte où il se trouve | |
Référence | Affiche la liste des textes et le nombre d'occurences dans chaque texte pour la requête CQL que vous avez formulée | |
Exporter | Vous permet de récupérer le résultat de votre requête sous forme d'un fichier que vous pourrez traiter avec un tableur |
TXM vous permet d'interroger un corpus en utilisant des requêtes CQL (Corpus Query langage). Il s'agit de rechercher des valeurs pour les attributs associés à chaque mot :
Les valeurs possibles pour pos et msd sont présentées dans la page d'aide "Valeurs pour pos & msd"
Requête | Résultat |
---|---|
[word="je"] | Retourne toutes les occurrences du mot je |
[lemma="penser"] | Retourne toutes occurrences de l'entrée de dictionnaire penser comme pense, pensera, ont pensé,... |
[pos="VER"] | retourne tous les verbes |
[msd="fut"] | Retourne tous les verbes au futur |
[lemma="être" & pos="NOM"] | retourne tous les mots être qui sont des noms |
[lemma="être" & pos="VER"][pos="NOM] | Retourne toutes les occurrences du verbe être suivi d'un nom |
[word="Corneille.*"] | Retourne toutes les occurrences du mot Corneille suivi ou non d'un suffixe |
[word=".*Cyril"] | Retourne toutes les occurrences du mot Cyril précédé ou non d'un préfixe |
Les textes de la BEFM sont encodés au format XML TEI
Chaque mot est encadré par une balise w. Une recherche sur [word="aimeraient"] vous donnera accès à toutes les occurences du mot aimeraient
La balise w peut contenir les attributs suivants :
L'attribut @lemma fournit le lemme du mot c'est à dire son entrée dans le dictionnaire
Par exemple <w lemma="dormir">dormiront</w> ou <w lemma="seul">seules</w>
Tous les mots des textes disposent d'une annotation @lemma
Une recherche sur [lemma="aimer"] vous donnera pour réponse toutes les occurences, dans le corpus, du mot aimer dans toutes les formes : aimera, Aimeront, aimerait,...
L'attribut @pos (pos pour Part Of Speech, partie du discours) correspond à la nature du mot : adverbe, nom, verbe, adjectif.
Tous les mots des textes qui constituent la BEFM disposent d'une balise @pos à l'exclusion des lettres euphoniques comme "t" dans "que cherche-t-on ?" ou "l'" dans "l'on est bien avancé !"
L'attribut @msd (morphosyntactic description ou description morphosyntactique en français) fournit des informations sur la forme grammaticale du mot. Il permet, si on le souhaite, de limiter la recherche à une catégorie plus précise
Par exemple la recherche [pos="VER"] retournera tous les verbes alors que [msd="fut"] retournera tous les verbes au futur.