REDAC
REssources Développées À CLLE CLLE : Cognition, Langues, Langage, Ergonomie







English version
Corpus TALN
articles scientifiques issus des actes des conférences TALN et RECITAL entre 2007 et 2013
Note de version
Cette page contient la version (ancienne) réalisée et utilisée dans le cadre de l'atelier SemDis2014. La version la plus récente est disponible ici.

Description
Le corpus des actes de TALN contient un sous-ensemble du texte intégral des articles scientifiques présentés aux conférences TALN (Traitement Automatique des Langues Naturelles) et RECITAL (Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues) de 2007 à 2013.
Cette version contient 586 articles, pour un total d'environ 2 millions de mots.
Une analyse syntaxique du corpus a été réalisée avec l'analyseur TALISMANE.

Le travail de collecte des fichiers sources et des méta-données a été effectué par Florian Boudin (LINA, Université de Nantes) Voir le site... ]
Ludovic Tanguy (CLLE-ERSS, Université de Toulouse) a effectué la sélection et le formatage du texte intégral.

Responsable ressource
Ludovic Tanguy :

Droits
Les articles des conférences TALN et RECITAL sont la propriété de l'Association pour Traitement Automatique des LAngues (ATALA).
Merci de lire la licence d'utilisation du corpus.

Téléchargement