Description
GLAWI est un dictionnaire électronique libre du français encodé au format XML.
Il s'agit d'une version structurée et normalisée du Wiktionnaire (l'édition française de Wiktionary).
Cette ressource contient :
- des mots simples, mots composés et locutions
- des formes fléchies et leur lemme
- l'étymologie des mots
- des prononciations, au format API
- des définitions (gloses et exemples)
- des traductions
- des relations sémantiques
- des relations morphologiques
- des variantes orthographiques
Des éléments de description du format de la ressource et du processus de conversion (extraction de l'information, structuration et normalisation) sont décrits dans (Sajous and Hathout, 2015) et (Hathout and Sajous, 2016).
Concepteurs
Franck Sajous,
Nabil Hathout et
Basilio Calderone
Responsable ressource
Franck Sajous
Contact :
|
|
Droits/Crédits
Certains droits sont réservés. GLAWI est diffusé sous licence Creative Commons By-SA 3.0.
Le logo de GLAWI est réalisé par Darwin.
Documentation
Une
documentation en ligne présente la structure de GLAWI et en donne des extraits à titre d'illustration.
Pour plus d'informations, se reporter aux articles mentionnés dans la section
Références ci-dessous.
Outils
G-PeTo (GLAWI Perl Tools) est un ensemble de programmes que nous diffusons pour permettre la manipulation de GLAWI,
en particulier l'extraction de sous-lexiques et de contenus spécifiques.
Les scripts peuvent être utilisés en l'état ou adaptés par vos soins à vos besoins particuliers.
Téléchargement
GLAWI est disponible sous plusieurs versions :
la version "travail" est celle qui correspond probablement à la majorité des utilisations.
La version "développement" comprend des informations supplémentaires relatives au processus d'extraction et de conversion.
Les deux versions sont disponibles avec ou sans l'analyse syntaxique des sections étymologiques et des définitions.
Les tailles indiquées correspondent à celle de l'archive à télécharger et à celle du fichier une fois décompressé.
Les deux versions, mises à disposition le 18/05/2016, sont issues du Dump du Wiktionnaire du 26/12/2015.
Références
- Nabil Hathout and Franck Sajous (2016).
Wiktionnaire's Wikicode GLAWIfied: a Workable French Machine-Readable Dictionary.
Proceedings of the tenth International Conference on Language Resources and Evaluation (LREC 2016),
pp. 1369-1376, Portorož, Slovenia.
- Franck Sajous and Nabil Hathout (2015).
GLAWI, a free XML-encoded Machine-Readable Dictionary built from the French Wiktionary.
Proceedings of the eLex 2015 conference, pp. 405-426, Herstmonceux, England.
- Nabil Hathout, Franck Sajous and et Basilio Calderone (2014).
Acquisition and enrichment of morphological and morphosemantic knowledge from the French Wiktionary.
Proceedings of the COLING Workshop on Lexical and Grammatical Resources for Language Processing, pp. 65-74, Dublin, Ireland.