REDAC
REssources Développées À CLLE-ERSS Laboratoire CLLE-ERSS






DÉMONETTEEnglish version
Résumé
Démonette est une base lexicale morphologique du français organisée en réseau dérivationnel, dont chaque entrée est un couple (Mot1, Mot2) appartenant à la même famille morphologique. Chaque entrée est décrite par 31 champs (dont la catégorie morphosyntaxique et le type sémantique de chaque mot, ainsi que la définition de Mot1 par rapport à Mot2).

La version distribuée Démonette-1.2 comporte 96027 entrées, dont les données initiales ont pour origine le TLFnome et Verbaction.

Description
La base Démonette est un réseau composé de relations morphologiques dérivationnelles. C'est une ressource lexicale dérivationnnelle destinée à :
  1. recevoir toute sorte de bases de données morphologiques munies d'informations diverses (catégorielles, sémantiques, définitoires, dérivationnelles, flexionnelles, phonétiques) provenant de sources variées ;
  2. les représenter dans un format unifié, présenté dans ce qui suit ;
  3. calculer pour certaines d'entre elles des informations morphosémantiques nouvelles, inférables à partir des propriétés fournies.
Une entrée de Démonette décrit ainsi une relation entre deux lexèmes morphologiquement reliés : Mot1 et Mot2, identifiés chacun de manière univoque par :
  1. une graphie ;
  2. une catégorie morphosyntaxique (au format GRACE) ;
  3. son lemme ;
  4. un type sémantique.
Démonette fournit autant de descriptions morphologiques pour un mot qu'il y a de relations dans lesquelles il intervient. Un mot Moti peut en effet intervenir dans plusieurs relations morphologiques avec les membres de sa famille dérivationnelle. Ces relations peuvent être directes ou indirectes, ascendantes ou descendantes, simples ou complexes. Une caractéristique originale de Démonette est qu' elle fournit à chaque Moti une définition morphosémantique pour chacune des relations où il apparaît.

La conception de Démonette est symétrique. A chaque entrée reliant Mot1 à Mot2, correspond une entrée reliant Mot2 à Mot1, dont les propriétés sont définies symétriquement par rapport à celles de l'entrée (Mot1, Mot2). La version 1.2 contient le résultat de la contribution de trois systèmes d'analyse morphologique : Morphonette, DériF et Verbaction. Elle comporte 96027 entrées qui décrivent des relations entre 61822 couples de lexèmes différents. Les couples présents dans plusieurs ressources sont décrit plusieurs fois (7816 sont décrites dans les 3 ressources, 18573 dans 2 ressources et 35433 dans une ressource). Ces relations réalisent les règles de suffixation suivantes à base verbale formant :

  1. des noms d'action en -ade (bousculade), -age (abordage), -aille (retrouvaille), -aire * (commentaire), -aison (combinaison), -ance (accoutumance), -ande * (offrande), -ange * (louange), -ée (percée), -ence (adhérence), -erie (cajolerie), -et (ricochet), -ette (trempette), -eur * (erreur), -ice * (exercice), -ie (garantie), -if * (expectative), -ing (kidnapping), -ion (labialisation), -is (arrachis), -ise (chapardise), -isme (exorcisme), -ité (mendicité), -ment (miaulement), -oire * (interrogatoire), -on (plongeon) et -ure (brisure),
  2. des noms d'agent en -eur, -euse, -rice,
  3. des adjectifs de propriété en -if
Les suffixes suivis d'une étoile n'apparaissent que dans des relations lexicales.

Extrait (champs principaux)

Mot1Mot2Cat1Cat2Suf Typ1 Typ2Definition Mot1Relation
agriculteur agriculture NcmsNcfseur @AGF @ACTagent masculin de agricultureindirect
agriculture agriculteur NcfsNcms@ACT @AGMaction pratiquée par agriculteurindirect
agressionagresserNcfsVmn----ion @RES @résultat de agresserdescendant
agresseragressionVmn----Ncfs@@ACTréaliser le agressionascendant

Extrait (XML)

<morphologicalRelation origin="derif">
    <targetWord>
      <writtenForm origin="tlfnome">enregistreur</writtenForm>
      <morphoSyntacticTag origin="tlfnome">Ncms</morphoSyntacticTag>
      <morphoSemanticType origin="demonette">@AGM</morphoSemanticType>
    </targetWord>
    <sourceWord>
      <writtenForm origin="tlfnome"> enregistrer</writtenForm>
      <morphoSyntacticTag origin="tlfnome">Vmn----</morphoSyntacticTag>
      <morphoSemanticType origin="demonette">@</morphoSemanticType>
    </sourceWord>
    <relationType origin="demonette">
      <direction>descendant</direction>
      <complexity>simple</complexity>
    </relationType>
    <targetFormConstruction>
      <constructionalExponent origin="derif">eur</constructionalExponent>
      <constructionalProcess origin="derif">suf</constructionalProcess>
      <constructionalTheme origin="derif">enregistr</constructionalTheme>
      </targetFormConstruction>
    <sourceFormConstruction>
    </sourceFormConstruction>
    <targetMeaningConstruction>
      <concreteDefinition origin="derif">(agent masculin OR instrument)
      de enregistrer</concreteDefinition>
      <abstractDefinition origin="demonette">(agent masculin OR instrument)
      de @</abstractDefinition>
    </targetMeaningConstruction>
  </morphologicalRelation>
Concepteurs
Nabil Hathout et Fiammetta Namer

Responsables Ressource
Nabil Hathout (REDAC) et Fiammetta Namer (Ortolang)

Droits
Certains droits sont réservés. Démonette est diffusée sous licence Creative Commons BY-SA-NC 3.0.

Téléchargement

Références
  • Hathout, N., Namer, F. (2014) Démonette, a French derivational morpho-semantic network. Linguistic Issues in Language Technology 11(5): 125-168. [PDF] [BiBTeX]