REDAC
REssources Développées À CLLE CLLE : Cognition, Langues, Langage, Ergonomie







English version
PREF-IT
PREFixed ITalian verbs corpus
Description
PREF-IT est une liste de 1680 verbes de l'italien morphologiquement construits à partir de bases nominales et adjectivales par préfixation. Les données ont été constituées et traitées dans le cadre de la thèse de doctorat de Giuseppina Todaro (Todaro, 2017) délivrée par l'Université de Toulouse Jean Jaurès et réalisée en cotutelle avec l'Università Roma Tre.

Les verbes préfixés ont été extraits automatiquement à partir du corpus ItWaC (Baroni et al., 2009) par la méthode du Pattern Matching (voir Todaro 2017, chap.3). Les données récupérées ont été soumises à une supervision manuelle et intégrées par des données extraites de la liste de néologismes du site web Treccani, et d'extractions non systématiques depuis le Web.

Chaque verbe a été étiqueté manuellement par rapport à ses propriétés formelles (préfixe employé et classe flexionnelle dans laquelle le lexème se situe) et sémantiques (les valeurs sémantiques font référence à l'analyse sémantique proposée dans Todaro, 2017, voir README.txt et PDF de la thèse). La fréquence dans le corpus ItWaC est indiquée pour les verbes ainsi que pour la base de chaque dérivé.


Responsable ressource
Giuseppina Todaro

Droits
Certains droits sont réservés. PREF-IT est diffusé sous la licence Creative Commons BY-NC-SA 2.0.

Téléchargement
  • prefit.zip contient la ressource sous forme de fichier tabulé au format XLSX et un fichier LISEZMOI.txt qui décrit chaque champ.
Référence
Todaro, Giuseppina. (2017). Nomi (e aggettivi) che diventano verbi tramite prefissazione: quel che resta della parasintesi. Thèse de doctorat. Università Roma Tre / Université de Toulouse-Jean Jaurès.