Description
PsychoGLÀFF est un lexique du français à large couverture construit à partir du
Wiktionnaire, la branche francophone de
Wiktionary.
Il constitue une version de
GLÀFF spécifiquement destinée aux études psycholinguistiques et contient pour chaque entrée :
- la forme graphique
- la description morphosyntaxique au format GRACE
- le lemme
- la transcription phonologique en API
- la transcription phonologique en SAMPA
- la fréquence absolue de la forme catégorisée dans le corpus Frantext 20e
- la fréquence relative (par million de mots) de la forme catégorisée dans le corpus Frantext 20e
- la fréquence absolue du lemme catégorisé dans le corpus Frantext 20e
- la fréquence relative (par million de mots) du lemme catégorisé dans le corpus Frantext 20e
- la fréquence absolue de la forme catégorisée dans le corpus LM10
- la fréquence relative (par million de mots) de la forme catégorisée dans le corpus LM10
- la fréquence absolue du lemme catégorisé dans le corpus LM10
- la fréquence relative (par million de mots) du lemme catégorisé dans le corpus LM10
- la fréquence absolue de la forme catégorisée dans le corpus FrWaC
- la fréquence relative (par million de mots) de la forme catégorisée dans le corpus FrWaC
- la fréquence absolue du lemme catégorisé dans le corpus FrWaC
- la fréquence relative (par million de mots) du lemme catégorisé dans le corpus FrWaC
- la longueur de la forme graphique (nombre de charactères)
- la longueur de la transcription phonologique (nombre de phonèmes)
- le nombre de syllabes
- la syllabification et la structure CV de la forme
- le rapport entre le nombre de syllabes et le nombre de consonnes
- la moyenne géométrique de la probabilité conditionnelle des bigrammes (calculée sur la forme graphique)
- la moyenne géométrique de la probabilité conditionnelle des trigrammes (calculée sur la forme graphique)
- la moyenne géométrique de la probabilité conditionnelle des 4-grammes (calculée sur la forme graphique)
- la moyenne géométrique de la probabilité conditionnelle des bigrammes (calculée sur la transcription phonologique)
- la moyenne géométrique de la probabilité conditionnelle des trigrammes (calculée sur la transcription phonologique)
- la moyenne géométrique de la probabilité conditionnelle des 4-grammes (calculée sur la transcription phonologique)
Les mesures concernant le voisinage orthographique et phonologique de la forme sont en cours de réalisation
et seront disponibles dans la prochaine version de PsychoGLÀFF.
Concepteurs
Basilio Calderone,
Nabil Hathout et
Franck Sajous
Responsable ressource
Basilio Calderone
Contact :
Droits
Certains droits sont réservés. GLÀFF est diffusé sous licence Creative Commons By-SA 3.0.
Téléchargement
Références
Basilio Calderone, Nabil Hathout et Franck Sajous. (2014).
From GLÀFF to PsychoGLÀFF: a large psycholinguistics-oriented French lexical resource.
Proceedings of the 16th EURALEX Conference. Bolzano, Italy.