REDAC
REssources Développées À CLLE-ERSS Laboratoire CLLE-ERSS






GLAFF

GLAWIEnglish version
GLÀFF et WiktionaryX
Description
GLAWI est un dictionnaire électronique libre du français encodé au format XML. Il s'agit d'une version structurée et normalisée du Wiktionnaire (l'édition française de Wiktionary).
Cette ressource contient :
  • des mots simples, mots composés et locutions
  • des formes fléchies et leur lemme
  • l'étymologie des mots
  • des prononciations, au format API
  • des définitions (gloses et exemples)
  • des traductions
  • des relations sémantiques
  • des relations morphologiques
  • des variantes orthographiques
Des éléments de description du format de la ressource et du processus de conversion (extraction de l'information, structuration et normalisation) sont décrits dans (Sajous and Hathout, 2015) et (Hathout and Sajous, 2016).

Concepteurs
Franck Sajous, Nabil Hathout et Basilio Calderone

Responsable ressource
Franck Sajous
Contact :

Droits/Crédits
Certains droits sont réservés. GLAWI est diffusé sous licence Creative Commons By-SA 3.0.
Le logo de GLAWI est réalisé par Darwin.

Documentation
Une documentation en ligne présente la structure de GLAWI et en donne des extraits à titre d'illustration.
Pour plus d'informations, se reporter aux articles mentionnés dans la section Références ci-dessous.

Téléchargement
GLAWI est disponible sous plusieurs versions : la version "travail" est celle qui correspond probablement à la majorité des utilisations. La version "développement" comprend des informations supplémentaires relatives au processus d'extraction et de conversion. Les deux versions sont disponibles avec ou sans l'analyse syntaxique des sections étymologiques et des définitions. Les tailles indiquées correspondent à celle de l'archive à télécharger et à celle du fichier une fois décompressé.
Les deux versions, mises à disposition le 18/05/2016, sont issues du Dump du Wiktionnaire du 26/12/2015.


TRAVAILDEV
DTDDTD_GLAWI_work.dtdDTD_GLAWI_dev.dtd
Sans analyse syntaxique GLAWI_FR_work_D2015-12-26_R2016-05-18.xml.bz2
(81Mo/1.7Go)
GLAWI_FR_dev_D2015-12-26_R2016-05-18.xml.bz2
(118Mo/2.2Go)
Avec analyse syntaxique GLAWI_FR_workParsed_D2015-12-26_R2016-05-18.xml.bz2
(214Mo/3.4Go)
GLAWI_FR_devParsed_D2015-12-26_R2016-05-18.xml.bz2
(251Mb/3.9Gb)


Références
  • Nabil Hathout and Franck Sajous. (2016). Wiktionnaire's Wikicode GLAWIfied: a Workable French Machine-Readable Dictionary. Proceedings of the tenth International Conference on Language Resources and Evaluation (LREC 2016), pp. 1369-1376, Portorož, Slovenia. [ PDF ] [ Bibtex ]
  • Franck Sajous and Nabil Hathout. (2015). GLAWI, a free XML-encoded Machine-Readable Dictionary built from the French Wiktionary. Proceedings of the eLex 2015 conference, pp. 405-426, Herstmonceux, England. [ PDF ] [ Bibtex ]
  • Nabil Hathout, Franck Sajous and et Basilio Calderone. (2014). Acquisition and enrichment of morphological and morphosemantic knowledge from the French Wiktionary. Proceedings of the COLING Workshop on Lexical and Grammatical Resources for Language Processing, pp. 65-74, Dublin, Ireland. [ PDF ] [ Bibtex ] [ Dataset ]