REDAC
REssources Développées À CLLE CLLE : Cognition, Langues, Langage, Ergonomie






VOISINS DE WIKIPÉDIA
Description

Les Voisins De Wikipédia est une base lexicale distributionnelle du français construite entièrement automatiquement, à partir d'un corpus comprenant l'ensemble des articles de l'encyclopédie française Wikipédia en juin 2008.

Le corpus texte a été étiqueté au niveau morphosyntaxique par Treetagger, de l'Université de Stuttgart. L'extraction des contextes syntaxiques a été réalisée par la chaîne d'analyse syntaxique Syntex, développée par Didier Bourigault dans le cadre d'une collaboration entre le laboratoire CLLE-ERSS et la société Synomia. L'analyse distributionnelle a été réalisée par l'outil Upery développé à CLLE-ERSS par Didier Bourigault. La constitution du corpus et l'application de Syntex et Upery à ce corpus ont été réalisées par Franck Sajous.

Pour plus de détails, voir la rubrique à propos de l'application.


Responsable ressource
Franck Sajous
Contact :

Droits
  • L'ensemble du contenu de cette application ainsi que les travaux dérivés qui pourraient être réalisés sont placés sous licence Creative Commons By-NC-SA (cliquez sur le lien pour plus de détails) ;
  • La consultation doit rester manuelle et toute interrogation par programme est proscrite, qu'il s'agisse d'une interrogation ponctuelle ou d'une aspiration de site ;
  • Toute utilisation commerciale est soumise à autorisation.
Accès