REDAC
REssources Développées À CLLE-ERSS Laboratoire CLLE-ERSS






PsychoGLAFF

PsychoGLÀFFEnglish version
un lexique flexionnel à large couverture du français orienté vers la psycholinguistique
Description
PsychoGLÀFF est un lexique du français à large couverture construit à partir du Wiktionnaire, la branche francophone de Wiktionary. Il constitue une version de GLÀFF spécifiquement destinée aux études psycholinguistiques et contient pour chaque entrée :
  1. la forme graphique
  2. la description morphosyntaxique au format GRACE
  3. le lemme
  4. la transcription phonologique en API
  5. la transcription phonologique en SAMPA
  6. la fréquence absolue de la forme catégorisée dans le corpus Frantext 20e
  7. la fréquence relative (par million de mots) de la forme catégorisée dans le corpus Frantext 20e
  8. la fréquence absolue du lemme catégorisé dans le corpus Frantext 20e
  9. la fréquence relative (par million de mots) du lemme catégorisé dans le corpus Frantext 20e
  10. la fréquence absolue de la forme catégorisée dans le corpus LM10
  11. la fréquence relative (par million de mots) de la forme catégorisée dans le corpus LM10
  12. la fréquence absolue du lemme catégorisé dans le corpus LM10
  13. la fréquence relative (par million de mots) du lemme catégorisé dans le corpus LM10
  14. la fréquence absolue de la forme catégorisée dans le corpus FrWaC
  15. la fréquence relative (par million de mots) de la forme catégorisée dans le corpus FrWaC
  16. la fréquence absolue du lemme catégorisé dans le corpus FrWaC
  17. la fréquence relative (par million de mots) du lemme catégorisé dans le corpus FrWaC
  18. la longueur de la forme graphique (nombre de charactères)
  19. la longueur de la transcription phonologique (nombre de phonèmes)
  20. le nombre de syllabes
  21. la syllabification et la structure CV de la forme
  22. le rapport entre le nombre de syllabes et le nombre de consonnes
  23. la moyenne géométrique de la probabilité conditionnelle des bigrammes (calculée sur la forme graphique)
  24. la moyenne géométrique de la probabilité conditionnelle des trigrammes (calculée sur la forme graphique)
  25. la moyenne géométrique de la probabilité conditionnelle des 4-grammes (calculée sur la forme graphique)
  26. la moyenne géométrique de la probabilité conditionnelle des bigrammes (calculée sur la transcription phonologique)
  27. la moyenne géométrique de la probabilité conditionnelle des trigrammes (calculée sur la transcription phonologique)
  28. la moyenne géométrique de la probabilité conditionnelle des 4-grammes (calculée sur la transcription phonologique)

Les mesures concernant le voisinage orthographique et phonologique de la forme sont en cours de réalisation et seront disponibles dans la prochaine version de PsychoGLÀFF.


Concepteurs
Basilio Calderone, Nabil Hathout et Franck Sajous

Responsable ressource
Basilio Calderone
Contact :

Droits
Certains droits sont réservés. GLÀFF est diffusé sous licence Creative Commons By-SA 3.0.

Téléchargement
Références
Basilio Calderone, Nabil Hathout et Franck Sajous. (2014). From GLÀFF to PsychoGLÀFF: a large psycholinguistics-oriented French lexical resource. Proceedings of the 16th EURALEX Conference. Bolzano, Italy. [ PDF ] [ Bibtex ]