REDAC
REssources Développées À CLLE CLLE : Cognition, Langues, Langage, Ergonomie






TreeLexEnglish version
Lexique syntaxique pour le français
Description
TreeLex est un lexique de sous-catégorisation extrait automatiquement à partir d'un corpus français annoté syntaxiquement (French Treebank). L'extraction de cadres a été faite pour les verbes et les adjectifs présents dans Treebank. Chaque entrée du lexique est constituée d'un lemme, de la réalisation syntaxique (cadre de sous-catégorisation) trouvée dans le corpus et de la fréquence d'occurrence de ce cadre dans Treebank.
  • verbes :
    Le lexique contient 3229 entrées correspondant à 1912 lemmes verbaux présents dans le corpus. Les cadres ont été extraits automatiquement à partir des annotations présentes dans Treebank mais les réalisations optionnelles ont été ajoutées manuellement par Anne Abeillé.
  • adjectifs :
    Le lexique contient 2506 entrées correspondant à 2166 lemmes adjectivaux présents dans le corpus. L'extraction des cadres des adjectifs a été guidée par l'étude de propriétés linguistiques des constructions adjectivales en plus des annotations présentes dans Treebank.
Responsable ressource
Anna Kupść
Contact : akupsc@u-bordeaux-montaigne.fr

Droits
Certains droits sont réservés. Treelex est diffusé sous licence Creative Commons By-NC-SA.

Téléchargement

Références (versions pré-finales)
  • Kupść, A., Abeillé A. Growing TreeLex. In Gelbukh, A. (ed.), 9th International Conference (CICLing), Haifa (Israel), February 2008, p. 28-39 (Lecture Notes in Computational Linguistics, 4919)
  • Kupść, A. Adjectives in TreeLex. In KÅ‚opotek, M., Przepiórkowski, A., WierzchoÅ„, S., Trojanowski, K. (ed.), 16th International Conference Intelligent Information Systems, Zakopane (Poland), 16-18 juin 2008, Academic Publishing House EXIT, p. 287-296