REDAC
REssources Développées À CLLE-ERSS Laboratoire CLLE-ERSS







English version
SH-WIKTIONARY
lexique morhposyntaxique pour le serbe
Description

sh-wiktionary est un lexique morphosyntaxique pour le serbe destiné à l'étiquetage morphosyntaxique, à la lemmatisation et au parsing. Il a été principalement extrait de l'édition serbo-croate du Wiktionary (sh.wiktionary.org).

Le lexique compte 1 222 486 formes flĂ©chies qui correspondent Ă  117 445 lemmes, donnant lieu Ă  3 061 616 combinaisons uniques forme flĂ©chie, lemme, description morphosyntaxique. Chaque description morphosyntaxique contient l'indication de la partie du discours, de la sous-catĂ©gorie grammaticale et d'une sĂ©rie de traits morphosyntaxiques pertinents pour la partie du discours en question : le cas, le genre et le nombre pour les noms, les adjectifs et les pronoms ; la forme verbale, la personne, le nombre et le genre pour les verbes ; le degrĂ© de comparaison pour les adjectifs et les adverbes. De plus amples informations peuvent ĂŞtre trouvĂ©es dans la documentation PDF disponible sur cette page.

Cette ressource a été développé dans le cadre du projet ParCoLab par Aleksandra Miletic (UMR 5263 CLLE, CNRS & Université Toulouse - Jean Jaurès).

Responsable ressource
Aleksandra Miletic
Contact :

Droits

Certains droits sont réservés. sh-wiktionary est diffusé sous la licence Creative Commons BY-SA 3.0.

Téléchargement
Références

Miletic, Aleksandra. (2017). Building a morphosyntactic lexicon for Serbian from Wiktionary. Actes de la 6e édition des Journées d'étude toulousaines (JéTou2017). Toulouse, France. article accepté

Remerciements

L'auteure remercie chaleureusement Franck Sajous (UMR 5263 CLLE, CNRS & Unviersité Toulouse- Jean Jaurès) d'avoir partagé avec elle ses expériences dans le travail sur le Wiktionary.