Les Voisins De Le Monde est une base lexicale
distributionnelle du français construite entièrement automatiquement,
à partir d'un corpus comprenant l'ensemble des articles du quotidien
Le Monde
sur une période de 10 ans (1991-2000).
Le corpus Le Monde a été
obtenu auprès de l'agence ELRA.
Il a été étiqueté au niveau morphosyntaxique
par Treetagger, de l'Université
de Stuttgart. L'extraction des contextes syntaxiques a été
réalisée par la chaîne d'analyse syntaxique Syntex,
développée par Didier Bourigault dans le cadre d'une collaboration entre le laboratoire
CLLE-ERSS et
la société Synomia.
L'analyse distributionnelle a été réalisée
par l'outil Upery développé à CLLE-ERSS par Didier Bourigault.
Pour plus de détails, voir la
rubrique à propos de l'application.
L'ensemble du contenu de cette application ainsi que les travaux dérivés
qui pourraient être réalisés sont placés
sous licence
Creative Commons By-NC-SA (cliquez sur le lien pour plus de détails) ;
La consultation doit rester manuelle et toute interrogation par programme
est proscrite, qu'il s'agisse d'une interrogation ponctuelle ou d'une
aspiration de site ;
Toute utilisation commerciale est soumise à autorisation.