PsychoGLÀFF un lexique flexionnel à large couverture du français orienté vers la psycholinguistique
Description
PsychoGLÀFF est un lexique du français à large couverture construit à partir du Wiktionnaire, la branche francophone de Wiktionary.
Il constitue une version de GLÀFF spécifiquement destinée aux études psycholinguistiques et contient pour chaque entrée :
la forme graphique
la description morphosyntaxique au format GRACE
le lemme
la transcription phonologique en API
la transcription phonologique en SAMPA
la fréquence absolue de la forme catégorisée dans le corpus Frantext 20e
la fréquence relative (par million de mots) de la forme catégorisée dans le corpus Frantext 20e
la fréquence absolue du lemme catégorisé dans le corpus Frantext 20e
la fréquence relative (par million de mots) du lemme catégorisé dans le corpus Frantext 20e
la fréquence absolue de la forme catégorisée dans le corpus LM10
la fréquence relative (par million de mots) de la forme catégorisée dans le corpus LM10
la fréquence absolue du lemme catégorisé dans le corpus LM10
la fréquence relative (par million de mots) du lemme catégorisé dans le corpus LM10
la fréquence absolue de la forme catégorisée dans le corpus FrWaC
la fréquence relative (par million de mots) de la forme catégorisée dans le corpus FrWaC
la fréquence absolue du lemme catégorisé dans le corpus FrWaC
la fréquence relative (par million de mots) du lemme catégorisé dans le corpus FrWaC
la longueur de la forme graphique (nombre de charactères)
la longueur de la transcription phonologique (nombre de phonèmes)
le nombre de syllabes
la syllabification et la structure CV de la forme
le rapport entre le nombre de syllabes et le nombre de consonnes
la moyenne géométrique de la probabilité conditionnelle des bigrammes (calculée sur la forme graphique)
la moyenne géométrique de la probabilité conditionnelle des trigrammes (calculée sur la forme graphique)
la moyenne géométrique de la probabilité conditionnelle des 4-grammes (calculée sur la forme graphique)
la moyenne géométrique de la probabilité conditionnelle des bigrammes (calculée sur la transcription phonologique)
la moyenne géométrique de la probabilité conditionnelle des trigrammes (calculée sur la transcription phonologique)
la moyenne géométrique de la probabilité conditionnelle des 4-grammes (calculée sur la transcription phonologique)
Les mesures concernant le voisinage orthographique et phonologique de la forme sont en cours de réalisation
et seront disponibles dans la prochaine version de PsychoGLÀFF.