Présentation du site
Ce site met à disposition la ressource RésolCo constituée pour l'analyse de la cohérence discursive et de la continuité référentielle dans des productions écrites d'élèves et d'étudiants de différents niveaux de scolarité (du CE2 à l'Université).
Ci-dessous la présentation des pages du site.
- Présentation : cette page.
- Constitution : décrit les différentes étapes du processus de constitution de la
ressource, de la transcription à sa normalisation puis à l'annotation
de la continuité référentielle, et de la cohérence (segmentation en
Unités De discours Elémentaires, annotation en Relations de Discours et en problèmes de cohérence)
- Exploration
- Transcription : permet d'explorer et de visualiser les textes du corpus dans leur version brute (images et transcriptions) et leur version annotée en traces d'écritures (ratures, insertions).
- Continuité référentielle : permet d'explorer et de visualiser les textes du corpus dans leur version normalisée orthographiquement et annotée au niveau des continuités référentielles.
- Téléchargement : permet de récupérer la ressource sous différents formats d'exploitation ainsi que d'obtenir quelques chiffres décrivant le contenu de la ressource.
Description du corpus
Le Corpus RésolCo, constitué dans le cadre du projet É:calm (ANR-17-CE28-004-04), est né de la volonté de mettre à disposition de la communauté scientifique et du grand public des transcriptions de manuscrits d'élèves et d'étudiants.
Précédemment appelé "corpus Charolles", en hommage aux travaux de Michel Charolles sur les procédés anaphoriques utilisés par des élèves de fin d’école primaire et de début de collège dans des textes narratifs rédigés à partir d’images (Charolles, 1988), le corpus était initialement constitué d'une trentaine de textes manuscrits, non numérisés.
Les textes et les fichiers annotés sont diffusés au format Glozz et XML normés selon la TEI-P5 sur la page Téléchargement.
Plusieurs couches d'annotation sont associées à ces textes. Elles relèvent de niveaux d’analyse complémentaires :
- traces du processus d’écriture
- normalisation orthographique
- étiquetage morphosyntaxique
- analyse syntaxique en dépendance
- annotation de structures discursives (voir Garcia-Debanc et al. 2017) :
- Continuités référentielles
- Unités de Discours Elémentaires
- Relations de Discours et problèmes de cohérence
Droits
Partenaires du projet E-calm
- CIRCEFT-ESCOL (EA 4384 - Université Paris 8 et Paris-Est Créteil) : Élisabeth Bautier, Catherine Delarue-Breton, Belinda Lavieu-Gwozdz, Élise Vinel
- CLESTHIA (EA 7345 - Université Paris Sorbonne Nouvelle) : Jacques David, Claire Doquet, Serge Fleury, Dominique Legallois, Olivier Lumbroso, Chiara Mainardi, Sara Maziotti, Arnaud Moysan, Jean-Luc Pilorgé, Enoiu Vanda
- CLLE (UMR 5263 - CNRS & Université de Toulouse 2) :
Myriam Bras, Chantal Dompmartin-Normand, Claudine Garcia-Debanc, Silvia Federzoni, Lydia-Mai Ho-Dac, Véronique Paolacci, Josette Rebeyrolle
- LIDILEM (EA 609 - Université de Grenoble) : Catherine Brissaud, Marie-Paule Jacques, Claude Ponton, Fanny Rinck, Isabelle Rousset, Corinne Totereau, Claire Wolfarth
Avec la participation de Laure Vieu (
IRIT).
Articles présentant la ressource RésolCo
- Ho-Dac, L.-M., Federzoni, S., Bras, M., Rebeyrolle, J. et Garcia-Debanc, C. (2019). RésolCo un corpus de manuscrits d’élèves et d’étudiants pour l’étude de la cohérence. 10èmes Journées Internationales de la Linguistique de Corpus, Nov 2019, Grenoble, France. ⟨hal-02877122⟩
- Doquet, C., Federzoni, S., Fleury, S., Ho-Dac, L.-M., Mazziotti, S., Moysan, A., Ponton, C. (2019) « The É:Calm Resource: Transcription, Encoding and Annotation of Handwritten Manuscripts produced by French Pupils and Students ». Poster au Workshop Annotation of non-standard corpora, Bamberg, Université Otto-Friedrich, 16-18 septembre 2019.
- Ho-Dac L.-M., Fleury S., Ponton C. (2020). “É:Calm Resource: a Resource for Studying Texts Produced by French Pupils and Students”. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). pp 4327–4332. Marseille. 11–16 May 2020. ISBN: 979-10-95546-34-4. PDF
- Garcia-Debanc, C., Ho-Dac, L.-M., Bras, M. & Rebeyrolle, J. (2017). Vers l’annotation discursive de textes d’élèves. Corpus, 16, pp. 157-184.
PDF
- Bras, M., Vieu, L., Joret, M., Pépin-Boutin, A.,
Poujade, C., Roze, C. (2021), «Vers un corpus de textes d’élèves annoté
en relations de discours », Langue Française.
D'autres travaux et publications liés au projet E-calm sont accessibles sur HAL.
Responsable de la ressource
Lydia-Mai Ho-Dac