REDAC
REssources Développées À CLLE-ERSS Laboratoire CLLE-ERSS






English version
ParCoLab
Description

ParCoLab est un corpus parallèle de 3 millions de mots comportant des textes originaux et leurs traductions dans trois langues d'Europe : le serbe, le français et l'anglais. Chacune des trois langues est prise comme langue source et comme langue cible.

Les textes recueillis, pour l'essentiel littéraires, sont alignés au niveau des paragraphes et des phrases. Les alignements sont validés manuellement, d'où leur fiabilité. L'intérêt et l'originalité du corpus viennent également des principes de structuration et d'annotation qui respectent les standards actuels en matière de constitution et de diffusion de corpus (format XML, normé TEI).

Le corpus parallèle ParCoLab est consultable gratuitement en ligne. Un moteur de recherche permet d'y effectuer des requêtes et d'extraire des phrases comportant l'expression recherchée et les énoncés correspondants dans une ou dans les deux autres langues.

En permanente évolution, la ressource s'enrichit des points de vue technique, qualitatif et quantitatif.

Responsable ressource
Dejan Stosic
Contact :

Droits
Le corpus ParCoLab est consultable gratuitement en ligne, moyennant la création d'un compte utilisateur. Les textes ne sont pas téléchargeables.

Accès
http://parcolab.univ-tlse2.fr/