REDAC
REssources Développées À CLLE CLLE : Cognition, Langues, Langage, Ergonomie






Corpus DiCo : Dictionnaires ComparésEnglish version

Description
DiCo est un corpus qui contient de nombreuses informations sur les dictionnaires, telles que des listes d'articles nouveaux, d'articles sortis ou des statistiques. Ces informations ont été obtenues en comparant intégralement et manuellement les éditions successives d'un même dictionnaire, par exemple le Petit Larousse 2005 avec le Petit Larousse 2006, puis ce dernier avec le 2007, etc. La méthode de comparaison est décrite plus en détail dans les articles (Martinez, 2009) et (Martinez, 2013) disponibles ci-dessous.

Responsables ressource
  • Conception (comparaison des dictionnaires, base de données) :
    Camille Martinez -
  • Dates d'entrée dans le Wiktionnaire, mise en ligne et interface d'interrogation :
    Franck Sajous -

Licence et conditions d'utilisation
Certains droits sont réservés : le corpus DiCo est diffusé sous licence Creative Commons By-NC-SA 4.0 (Attribution, pas d'utilisation commerciale, partage dans les mêmes conditions).
Cette licence s'applique aux fichiers tableurs téléchargeables ci-dessous, à l'interface d'interrogation en ligne.
Les données contenues dans le corpus Dico ont été relevées manuellement. Elles ont également été modifiées par des traitements automatiques (homogénisation des valeurs, extraction des dates d'inclusion dans le Wiktionnaire). Elles sont fournies en l'état et peuvent contenir des erreurs imputables aux traitements manuels ou automatiques. Ces éventuelles erreurs n'engagent aucunement la responsabilité des auteurs, de leur institution ou des maisons d'édition produisant les dictionnaires consultés.

Téléchargement
Le corpus DiCo est intégralement téléchargeable, sous plusieurs formats, dans sa version 3.5.10. Elle est disponible dans deux variantes, qui diffèrent dans la catgorisation des marques lexicographiques :
Version "compacte" Typologie de Hausmann et al (1989)
Open Office/Libre Office ODS ODS
Excel XLSX XLSX
CSV CSV CSV

Consultation en ligne
Le corpus est également consultable et interrogeable en ligne via une interface :
Liste des mots nouveaux/mots supprimés
La liste des entrées/sorties par année et par dictionnaire est consultable sur le site du club d'orthographe de Grenoble :
Documentation
Présentation des données contenues dans le corpus mis à disposition.
Pour une présentation de la méthode de comparaison des dictionnaires, vous pouvez consulter les deux articles de la section Références ci-dessous.

Références
Pour citer ce corpus :
  • Franck Sajous and Camille Martinez (2022), Metalexicographical Investigations with the DiCo Database, International Journal of Lexicography, 35(1), pp. 75-106. [ PDF ] [ Bibtex ]
  • Camille Martinez (2013), La comparaison de dictionnaires comme méthode d'investigation lexicographique, N. Gasiglia (dir.), Lexique, 21, Villeneuve-d'Ascq, Presses universitaires du Septentrion, pages 193-220 [ PDF ] [ Bibtex ]
  • Camille Martinez (2009), Une base de données des entrées et sorties dans la nomenclature d'un corpus de dictionnaires : présentation et exploitation, In H. Manuélian (coord.) Informatique et description de la langue d'hier et d'aujourd'hui, Études de linguistique appliquée, 156, Paris, Didier Érudition / Klincksieck, p. 499-509 [ PDF ] [ Bibtex ]
Une liste d'articles faisant référence au corpus DiCo est également disponible.