Le projet WISIGOTH a pour but l'extraction de ressources lexicales sémantiques à partir de
Wiktionary, le dictionnaire en ligne collaboratif,
et d'enrichir ces ressources à des fins d'utilisation pour le TAL.
Wiktionary est un dictionnaire multilingue qui contient pour chaque lexème, en plus des gloses et des exemples,
des relations sémantiques telles que synonymie/antonymie, hyperonymie/hyponymie, holonymie/méronymie.
Cependant, ces relations sont rarement présentes dans les articles.
Le système WISIGOTH comprend un module de calcul automatique de nouveaux synonymes potentiels.
Ce calcul est basé sur des marches aléatoires dans les graphes lexicaux extraits de Wiktionary.
Les synonymes suggérés pouvant être non pertinents, ils sont à valider ou invalider par les contributeurs.
Nous avons développé une extension Firefox que chacun peut installer, qui :
suggère des synonymes candidats lorsqu'une page du wiktionnaire anglais
ou français est consultée ;
prend en charge l'édition des articles de Wiktionary si vous décidez d'ajouter ou supprimer des synonymes ;
comme vous pouvez vouloir ajouter un synonyme non suggéré, l'extension comprend un champ texte libre dans lequel vous pouvez saisir votre propre proposition.
Aperçu : Suggestion de synonymes par Wisigoth pour enseignant (nom)
Manuel utilisateur : accédez à la version en ligne du manuel utilisateur.
Le bouton "Téléchargement" ci-dessus vous permet d'installer l'extension WISIGOTH.
Elle est destinée à être utilisée par tout internaute désireux de contribuer au dictionnaire en ligne.
Ci-dessous est donnée une liste de liens vers des ressources qui peuvent intéresser plus spécifiquement la communauté du TAL :
Dumps XML: fichiers structurés au format XML extraits des
dumps des versions anglaise et française des wiktionnaires ;
E. Navarro, F. Sajous, B. Gaume, L. Prévot, S. Hsieh, I. Kuo, P. Magistry and Chu-Ren Huang (2009).Wiktionary and NLP: Improving synonymy networks.
In Proceedings of the ACL Workshop on The People's Web Meets NLP: Collaboratively Constructed Semantic Resources.
ACL-IJCNLP 2009, Singapore.
Développement
Pour consulter l'historique des versions, les problèmes connus et la feuille de route de l'extension, voir la
page développement.