<h2>Préambule</h2> Cet article fait référence à plusieurs fois à un document de travail et son dépôt git associé <a href="#halshs-03956407">1</a>. <h2>Introduction</h2> Le <a href="https://crisco4.unicaen.fr/des" target="_blank">Dictionnaire électronique des synonymes du CRISCO (DÉS)</a> contient aujourd’hui plus de 50 000 entrées, 209 000 relations synonymiques et 32.000 liaisons antonymiques. La base de départ concernant les synonymes a été constituée à partir de sept dictionnaires classiques. Un premier travail, réalisé par l’INALF (Institut National de la Langue Française), a permis d’en extraire les relations synonymiques. Le laboratoire ELSAP, qui est devenu par la suite le CRISCO, a ensuite concaténé, homogénéisé et symétrisé les données. Depuis 1994, un important travail de correction se perpétue par l’ajout ou la suppression de liens synonymiques et antonymiques. Après livraison des données de l’INALF, ce projet a démarré sous la responsabilité de Bernard VICTORRI, directeur de recherche, et Sabine PLOUX, ingénieure de recherche, qui ont défini et mis au point les principes de fonctionnement du dictionnaire : union des différentes ressources, symétrisation (générant plus de 50 % de relations supplémentaires), algorithme de calcul des cliques. La représentation spatiale de l’espace sémantique et sa projection sur un plan par calcul matriciel ont également été conçues et réalisées. De nombreuses personnes sont intervenues, depuis, à la fois pour des corrections, la maintenance et des améliorations (voir la rubrique Historique sur la <a href="https://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes-des/presentation-du-dictionnaire-electronique-des-synonymes/" target="_blank">page de présentation du site web</a>) parmi lesquelles Jean-Luc MANGUIN, Michel MOREL et Laurette CHARDON, ingénieurs successifs en charge du projet. Les deux principes de base du DÉS est la symétrisation et la contextualisation : un mot A peut être remplacé par un mot B dans un contexte donné, sans modification significative du sens. Comme exemples, nous avons : <ul> <li> Les enfants jouent / s’amusent dans la cour. </li> <li> Marie joue/imite/simule Andromaque. </li> <li> Un vin âcre/âpre/vert. </li> <li> Des mots crus/verts </li> </ul> Suite à la mise en ligne publique, gratuite et sans publicité, dans les années 2000 du projet, de nombreux internautes se sont appropriés l'interface d'affichage des synonymes ( beaucoup de rédactrices et rédacteurs d'articles de blogs, de journaux, de livres ... Il suffit de lire les retours dans le <a href="https://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes-des/livre-dor/" target="_blank">livre d'or</a> et les <a href="https://crisco.unicaen.fr/statistique-dacces-au-des-2023/" target="_blank">statistiques d'accès </a>). L’espace sémantique au c&oelig;ur du projet scientifique était beaucoup moins utilisé (certainement du à un manque de communication du CRISCO et à un manque de compréhension de la part des usagers). Ceci dit, la recherche sur la base du DÉS s'est depuis étoffée avec des algorithmes de regroupement bien connus en théorie des graphes <a href="#halshs-03155459">2</a> . Dans les années 2000, un autre projet intitulé "<a href="http://www.atlas-semantiques.eu/" target="_blank">les atlas sémantiques</a>" développé par Sabine Ploux (co-fondatrice du projet) a vu le jour sur la base des données du DÉS et étendu à l'anglais, l'espagnol et le portugais. L'ensemble des publications en relation avec le DÉS est regroupé dans une <a href="https://hal.science/CRISCO-DES" target="_blank">collection HAL</a>  avec 71 entrées dont 56 publications avec le texte intégral. Les textes fondateurs sont ceux de Bernard Victorri, Sabine Ploux et Jean-Luc Manguin <a href="#halshs-00009433">3</a>, <a href="#hal-02430301">4</a>, <a href="#hal-02430342">5</a> et <a href="#hal-04520029">6</a>. Les textes sur l'exploitation du DÉS depuis 2000 sont également dans la collection CRISCO-DES. Quant aux mises à jour mensuelles, elles sont sur la <a href="https://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes-des/presentation-du-dictionnaire-electronique-des-synonymes/" target="_blank">page de présentation du DES</a>. Compléter la base des synonymes du DÉS avec la catégorie grammaticale apporte des avantages très intéressants : <ul> <li> Cela facilite la recherche de mots polysémiques. En effet ces derniers sont très souvent attachés à plusieurs catégories grammaticales. La recherche et l’extraction de tels mots est ainsi simplifiée. Par exemple mousse est un adjectif ( qui n’est pas tranchant : couteau à pointe mousse), un subst. féminin (la mousse du gel-douche dans la baignoire) et substantif masculin (jeune garçon sur un navire) </li> <li> Cela permet également la vérification des liens synonymiques et antonymiques : soit la relation synonymique est une erreur (en-tout-cas adv. était synonyme de parapluie subst. masc. par erreur) soit il manque une catégorie grammaticale à l’un des 2 mots ( fier était enregistré comme verbe uniquement alors qu’il est synonyme de fort, hautain, noble,. . . en tant qu’adjectif). </li> <li> Il est ainsi plus facile de repérer les acceptions. Dans le TLFi, un mot qui a plusieurs acceptions se traduit par plusieurs onglets car les sens sont disjoints (par exemple pour canon, un tir de canon n’a aucun rapport avec le droit canon). Lorsque les différents sens d’un mot découlent les uns des autres, il n’y aura qu’une seule entrée (le verbe gagner a une seule entrée avec différents sens : acquérir quelque chose mais aussi mériter une récompense ou encore gagner le large, partir ...). Il faut noter toutefois que les dictionnaires divergent sur la notion d’acception. Nous avons gardé dans notre base cette information d’acception des entrées telle qu’utilisée dans le TLFi. </li> <li> l'affichage à terme dans l'interface publique de la ou des catégories grammaticales de la vedette facilitera la compréhension et l'apprentissage du français </li> </ul> <h2>Objectifs</h2> La base de données est quasiment restée identique depuis sa création début des années 2000, à l’exception de l’ajout d’une date d’insertion/modification dans les tables en 2018-2019. Les informations enregistrées sont assez simples comme nous pouvons le voir dans les tableaux ci-dessous : la table des graphies avec les entrées et leur identifiants, la table des synonymes avec les identifiants des entrées synonymiques et la table des antonymes avec les identifiants des entrées antonymiques. <img alt="table des graphies" src="https://www.numerev.com/img/ck_3267_32_image-20240402145234-1.png" style="width: 648px; height: 203px;" /> <img alt="table des synonymes" src="https://www.numerev.com/img/ck_3267_32_image-20240402145242-2.png" style="width: 649px; height: 295px;" /> <img alt="table des antonymes" src="https://www.numerev.com/img/ck_3267_32_image-20240402145318-3.png" style="width: 649px; height: 151px;" /> Mémoriser la catégorie grammaticale a souvent été un sujet récurrent au CRISCO sans avoir, jusqu’à présent, trouvé les sources adéquates. Travailler sur un autre projet en relation avec l’ATILF (<a href="https://crisco.unicaen.fr/projet-de-modelisation-graphique-de-la-polysemie-evolutive/">la polysémie évolutive</a>) a été l’occasion d’utiliser leurs sources pour concrétiser ce projet. Nous avons décidé en accord avec l’ATILF d’utiliser leurs fichiers afin de mémoriser dans la table des graphies (en ajoutant un nouveau champ intitulé « nature ») les différentes catégories grammaticales. <h2>Méthode de constitution et/ou sources</h2> Trois sources différentes sous forme de fichiers en provenance de l’ATILF ont été utilisées (source 1a, source2a et source2b). Une source (source 1b) est issue de la librairie Spacy utilisée avec le langage Python. Les sources 1a et 1b ont été utilisées dans la première étape de traitement (de janvier 2022 à novembre 2022), les sources 2a et 2b dans la seconde étape de traitement (de juin 2023 à novembre 2023). <h3>Source 1a</h3> La source1a est un fichier tableur intitulé TLFI complet lemmes.xls de 54.280 lignes dont un extrait est présenté dans la table ci-dessous.<img src="https://www.numerev.com/img/ck_3267_32_image-20240408163801-1.png" style="width: 600px; height: 420px;" /> Nous voyons que la seule colonne commune à toutes les lignes est la première avec le libellé de la graphie avec toutefois deux remarques importantes : <ul> <li> la même graphie est parfois répétée et incrémentée d’un numéro (Ex : MEUBLE1,2 ou 3). </li> <li> des parenthèses sont présentes, signalant des orthographes différentes autorisées </li> </ul> Ensuite, les lignes les plus simples sont celles avec uniquement une seconde colonne contenant la catégorie grammaticale. D’autres lignes ont plusieurs colonnes avec des catégories grammaticales différentes, ou bien des extensions féminines (-AINE, -EUSE,etc.). <h3>Source 1b</h3> La librairie <a href="https://spacy.io/models/fr">fr_dep_news_trf</a> est un pipeline de transformateurs français qui contient un ensemble de composants : morphologiseur, analyseur syntaxique, régleur d’attributs, lemmatiseur,.. L’entraînement a été réalisé sur des données provenant de trois sources : — <a href="https://github.com/UniversalDependencies/UD_French-Sequoia">UD_FrenchSequoia</a> qui est une conversion automatique du corpus français <a href="http://deep-sequoia.inria.fr/">Sequoia (French Sequoia corpus)</a>. — Le <a href="https://huggingface.co/almanach/camembert-base">modèle camembert-base</a> basé sur le <a href="https://huggingface.co/FacebookAI/roberta-base">modèle RoBERTa</a>. Il a été entraîné sur le corpus <a href="https://oscar-project.org/">OSCAR</a> (Open Super-large Crawled Aggregated coRpus) — Des fichiers additionnels : <a href="https://github.com/explosion/spacy-lookups-data">spaCy lookups data</a> La première source provient de l’INRIA. Elle contient 3,099 phrases françaises de Europarl (parlement européen), du magazine Est Republicain, du Wikipedia français et de l’agence européenne de médecine. Le manuel d’annotations est disponible <a href="https://gitlab.inria.fr/sequoia/deep-sequoia/-/blob/master/tags/sequoia-9.2/README-distrib.md">en ligne </a>. Le composant qui nous intéresse est celui qui va associer une catégorie grammaticale aux mots. En linguistique, l’étiquetage morpho-syntaxique, aussi appelé étiquetage grammatical ou <a href="https://fr.wikipedia.org/wiki/%C3%89tiquetage_morpho-syntaxique">POS tagging (part-of-speech tagging)</a> est le processus qui consiste à associer aux mots d’un texte les informations grammaticales correspondantes comme la partie du discours, le genre, le nombre, etc. à l’aide d’un outil informatique. <h3>Source 2a</h3> Dans le cadre du <a href="https://crisco.unicaen.fr/projet-de-modelisation-graphique-de-la-polysemie-evolutive/">projet de modélisation graphique des notices historiques du TLFi</a>, un programme a été créé pour extraire les données de 81 fichiers XML de l’ATILF et les enregistrer au format excel (xlsx). Nous sommes donc partis de ces 81 fichiers tableurs de ce projet pour en créer un unique de 49.854 lignes dont un extrait est donné ci-dessous. <table border="1" cellpadding="1" cellspacing="1" style="width:500px;"> <thead> <tr> <th scope="col">Entrée</th> <th scope="col">Catégorie grammaticale</th> </tr> </thead> <tbody> <tr> <td>absorber</td> <td>verbe trans.</td> </tr> <tr> <td>accenteur, accentueur</td> <td>subst. masc.</td> </tr> <tr> <td>despote</td> <td>subst. masc. et adj.</td> </tr> <tr> <td>déterminé, ée</td> <td>part. passé, adj. et subst. masc.</td> </tr> <tr> <td>dû, due</td> <td>part. passé, adj. et subst. masc. sing.</td> </tr> <tr> <td>narquois, -oise</td> <td>adj. et subst. masc.</td> </tr> <tr> <td>n'est-ce pas</td> <td>loc. inv.</td> </tr> <tr> <td>neuf1</td> <td>adj. et subst. masc. inv.</td> </tr> <tr> <td>neuf2, neuve</td> <td>adj. et subst. masc.</td> </tr> </tbody> </table> <h3>Source 2b</h3> Ce fichier plus récent de l’ATILF contient 103.328 lignes. Il est constitué de six colonnes : articleID, parentID, source, content, category, gender, feminine. La table ci-dessous donne quelques exemples d’entrées. <img src="https://www.numerev.com/img/ck_3267_32_image-20240408170115-4.png" style="width: 600px; height: 140px;" /> On remarque que certaines entrées (colonne content) sont présentes sur plusieurs lignes, probablement liées à la notion d’acception. Cette notion d’acceptions est gérée différemment suivant les dictionnaires. Par exemple, pour accusé, le Grand Robert le présente sur une page en tant que nom et adjectif alors que le TLFi sur <a href="https://www.cnrtl.fr/lexicographie/accusé">deux différentes</a>. <h2>Méthodologie</h2> Les différentes étapes sont synthétisées dans le tableau ci-dessous et résumées dans l'ordre chronologique. Elles sont détaillées dans le document de travail <a href="#halshs-03956407">1</a>. <h3><img height="628" src="https://www.numerev.com/img/ck_3267_32_image-20240905104900-1.png" width="1996" /></h3> <h3>Première étape de janvier à novembre 2022</h3> <h4>Traitement de la source 1a</h4> Comme détaillé dans le document de travail, plusieurs étapes de traitements s’imposaient. Tout d’abord, nous avons traité les entrées selon les catégories grammaticales : les verbes (6981, traités), les adjectifs (4641), les substantifs (28.588), les adverbes (943). Il faut signaler à ce moment une décision importante : Une entrée présente sur plusieurs lignes finissant par des chiffres (comme MEUBLE ) est considérée comme une acception c’est-à-dire ayant plusieurs sens ou plusieurs origines étymologiques. Les codes grammaticaux associés ont donc été séparés par un point virgule, de façon à les différencier des codes grammaticaux sur une seule ligne. Par exemple, le champ nature de l’entrée MEUBLE dans le DÉS est subst. masc.;adj. et subst.;adj. Cela correspondant à <ul> <li> bien immobilier (subst. masc.), </li> <li> Qui se laboure ou se travaille facilement (adj.) et </li> <li> Qui peut être transporté d'un lieu à un autre sans subir de détérioration (adj. et subst.) </li> </ul> Ces étapes ont permis de renseigner 50 % (25.383 sur 50.350) de la base du DES. Ensuite, nous avons procédé à 3 traitements particuliers selon l’extension féminine en seconde colonne : <ol> <li> -acte, -aine, -ainte, -aise, -aite, -ale, -als, -aux, -ande, -ane, -anne, -ante, -apse, -arde, -ate, -aude, -aux, -close, -cuite, -dite, -douce, -dure, -ecte, -ienne, -ée, -éenne, -ées, -elle, -ende, -enne, -ente, -ère, -ète, -ette, -eule, -eure et -euse. </li> <li> -ails, -faite, -fine, -haute, -ie, -ielle, -ienne, -ière, -ile, -ille, -incte, -ine, -ique, -ise, -isse, -ite, -ive, -oise, -onne, -onde, -one, -ote, -otte, -oue, -trice, -ue, -une, -use, aine, ainte, aisceau, aise, aisse, aite, ante, arde, aux, ecte, ée, éenne, elle, ente, ère, erse, erte, ète, ette, euse, ie, ienne, oise, onne, trice. </li> <li> ale, ande, ane, ate, aude, euse, iale, ienne, ière, ieuse, ile, ine, ite, ive, orse, ose, ote, otte, ouse, oute, ue, une, ure, use, ute </li> </ol> Les 2 traitements suivants ont demandé un travail manuel plus important. Nous avons traité 2619 d’entrées avec des orthographes différentes, les mots invariants, les prépositions, les interjections, les onomatopées en écartant les entrées de type « élément formant » (nyct-, oculi-, hodo-,..). Puis enfin 1551 entrées de type locution à reformater pour être insérés automatiquement (par exemple : CATIMINI (EN) → en catimini, CONTREBORD (À) → à contrebord) La procédure pour ces cinq traitements est détaillée dans les paragraphes « Introduire une première catégorie de mots mélangés » jusqu’à « Introduire une cinquième catégorie de mots mélangés » du document de travail <a href="#halshs-03956407">1</a>. <h4>Traitement manuel sans source</h4> Le traitement suivant est issu d’une constatation simple : parmi les 17.463 entrées dont la catégorie grammaticale n'est pas renseignée,  1.411 d’entre elles commencent par s’ ou se s’avèrent être des verbes. <h4>Traitement de la source 1b</h4> A partir des 16.052 entrées dans le DES qui n’ont pas de catégories grammaticales, nous avons gardées celles sans aucun espace soit 10.139 pour lesquelles la librairie Spacy apportait une réponse sur le code grammatical. Ce résultat a été traité selon les catégories  : <ul> <li> Tout d’abord 588 entrées se terminant par -er et -ir avec le code « POS VERB » ont été vérifiées. Quelques corrections ont été réalisées comme décrottoir, débirentier ou parmentier. </li> <li> Ensuite, nous corrigons les entrées finissant par  é  considérées à tort comme verbe et que nous avons noté comme participe passé. Puis les entrées avec le code PROPN ( noms propres), PUNCT (ponctuations) ont été corrigées manuellement. Enfin celles avec le code NOUN et ADJ ont été sommairement vérifiées. Cela concerne un total de 951 lignes. </li> <li> Puis nous avons pris en compte les entrées avec des tirets et des apostrophes, nous récupérons ainsi 328 verbes commençant par  s’ , 404 adverbes et 275 substantifs finissant par -ment. </li> <li> Pour les entrées commençant par  à , nous avons considéré que toute expression commencant ainsi est considérée comme adjectif si elle figure à droite d’un substantif (un projet à bas coût) ou comme adverbe à droite d’un verbe ou d’un participe (poursuivre un projet à marche forcée ; évaluer un coût à la louche). Depuis quelques décennies on emploie les codes adj. et adv. comme des catégories fonctionnelles au-delà de leur définition morphologique classique. Nous avons choisi de tout étiqueter en adverbe et celles présentées sur la <a href="https://fr.wiktionary.org/wiki/Cat%C3%A9gorie:Locutions_adjectivales_en_fran%C3%A7ais">page wiktionary des locutions adjectivales en français</a> ont été corrigées. </li> <li> La vérification de 4608 entrées retournées par Spacy comme étant « NOUN » : <ul> <li> 200 d’entre elles se terminant par er, ir et dre ont été vérifiées : 32 étaient des verbes. </li> <li> la vérification de 534 entrées se terminant par -eur, -ire et -oir n’a décelé qu’une erreur (stupéfaire : verbe) </li> <li> les entrées restantes sont restées des substantifs. </li> </ul> </li> </ul> <h4>Traitement manuel sans source</h4> Les 8488 entrée du DES sans catégorie grammaticale ont été vérifiées par plusieurs personnes selon plusieurs types de filtrage détaillés dans le document de travail sus-cité <a href="#halshs-03956407">1</a>. <h4>Vérifications</h4> Il nous a semblé intéressant de mettre en place des tests pouvant potentiellement faire apparaître des incohérences. Par exemple, si une entrée de type verbe sans être substantif, ni adjectif, ni adverbe, ni locution, est synonyme d’une entrée qui n’est ni un verbe, ni un adverbe ni une locution, alors une vérification s’imposait. L’ensemble des tests est donné dans la table 9 du document de travail. 250 entrées ont été corrigées. <h3>Seconde phase de juin à novembre 2023</h3> Cette seconde phase a permis, non pas de renseigner les catégories grammaticales des entrées du DES puisqu’elles l’étaient toutes, mais plutôt de comparer le DES avec ces deux sources afin de corriger et de compléter les catégories grammaticales. <h4>Traitement de la source 2a</h4> Nous avons cherché tout d’abord à calculer des indicateurs généraux pour comparer les 2 sources : — Nombre entrées dans le DÉS : 50.420 — Nombre entrées dans le TLFi : 49.854 — Nombre d’entrées en commun DÉS- TLFi : 24.210 — Nombre d’entrées en commun avec la même catégorie grammaticale (code 1) : 23.548 — Nombre d’entrées en commun avec les catégories grammaticales du DÉS incluses dans TLFI (code 2) : 449 — Nombre d’entrées en commun avec les catégories grammaticales du DÉS différentes du TLFI (code 3) : 213 — Nombre d’entrées dans le DÉS absentes du TLFi (code 4) : 26.209 — Nombre d’entrées dans le TLFi absentes du DÉS (code 5) : 25.644 Suite au traitement des entrées différentes selon les codes 2 et 3, nous avons conclu que  les catégories grammaticales de : - 91 entrées (code 2) et 120 (code 3) étaient à corriger manuellement - 358 entrées (code 2) étaient du à une codification différentes pour les verbes - 93 entrées (code3) étaient du à des inversions (par exemple, "adj. et subst." d’un coté et "subst. et adj." de l’autre) <h4>Traitement de la source 2b</h4> Nous avons comme pour la source précédente calculé des indicateurs : - Nombre d’entrées dans le TLFi2 : 103.328 - Nombre d’entrées uniques dans le TLFi2 : 89.392 - Nombre d’entrées en commun DÉS- TLFi2 : 37.427 - Nombre d’entrées dans le DÉS absentes du TLFi2 : 13.007 - Nombre d’entrées dans le TLFi2 absentes du DÉS : 51.965 Sur le 37.427 entrées communes, nous avons réalisé un traitement pour ne retenir que les entrées à vérifier. L’algorithme du traitement est le suivant : <img src="https://www.numerev.com/img/ck_3267_32_image-20240411145830-1.png" style="width: 600px; height: 297px;" /> Les 336 entrées pour lesquelles la colonne « ok ? » est à False ont été vérifiées manuellement et corrigées dans la base du DES. <h4>Vérifications</h4> Pour ces dernières vérifications, nous sommes repartis sur une règle simple : pour deux mots synonymes, mot1 et mot2, si une des catégories grammaticales de l’un est présente dans l’autre, alors nous n’effectuons pas de vérification. Cela donnait toutefois 5.828 lignes à revoir, ce qui était impossible à vérifier à la main. Nous avons donc exclu des liaisons qui vérifiaient les critères des tables 14 et 15 du document de travail. Les 725 lignes restantes ont été vérifiées manuellement (Voir le <a href="https://git.unicaen.fr/crisco-des-public/descatgram/-/blob/master/CatGramErreursAcceptionsRecup_2023-07-13.csv">fichier CatGramErreursAcceptionsRecup_2023-07-13.csv</a> sur le git). <h2>Présentation du contenu et de l’organisation du jeu de données</h2> Le champ nature des 50.000 entrées du DÉS est renseigné avec une des 476 combinaisons de codes grammaticaux enregistrés. L’ensemble de ses combinaisons est présent sur le git public (<a href="https://git.unicaen.fr/crisco-des-public/descatgram/-/blob/master/catgram_20240411.csv?ref_type=heads">https://git.unicaen.fr/crisco-des-public/descatgram/-/blob/master/catgram_20240411.csv</a>). La table ci-dessous en donne un extrait : <img src="https://www.numerev.com/img/ck_3267_32_image-20240411150008-2.png" style="width: 600px; height: 460px;" /> <h2>Modalités d’accès aux données</h2> L’ensemble des données du DÉS sont téléchargeables sur la plate-forme<a href="https://www.ortolang.fr/fr/accueil/" target="_blank"> ORTOLANG</a> pour la communauté scientifique (authentification requise) et il existe un git public <a href="#halshs-03956407">1</a>. <h1>L’exploitation des données : analyse et interprétations</h1> L’ajout de cette information supplémentaire va permettre de filtrer selon : - les catégories grammaticales - les entrées ayant plusieurs sens par la présence d’un point virgule séparant les codes (acceptions) - de faciliter des recherches spéciales comme les entrées étant à la fois verbe et substantifs ou toutes les locutions, etc... <h1>Perspectives de réutilisation</h1> L’ajout de la catégorie grammaticale apporte plusieurs bénéfices : Tout d’abord, dans le domaine de recherche développée au CRISCO sur les graphes, il sera possible d’affiner des extractions afin d’initier ou de poursuivre des recherches <a href="#halshs-00666584">7 </a>et <a href="#hal-04526033">8</a>. De plus, les données, étant déposés avec la licence Creative Commons sur la plate-forme ORTOLANG, peuvent être utilisées dans d’autres domaines de recherche : le dépôt réalisé en novembre 2022 a été consulté plusieurs centaines de fois et téléchargé plus d’une centaine de fois. Il est aussi possible d’envisager la comparaison de cette base avec d’autres lexiques comme par exemple le <a href="http://www.ortolang.fr/market/lexicons/lexical-system-fr/v1" target="_blank">Réseau lexical du </a><a href="http://www.ortolang.fr/market/lexicons/lexical-system-fr/v1" target="_blank">Français </a>ou <a href="https://www.ortolang.fr/market/lexicons/holinet-1-0" target="_blank">Holinet</a> (ajouter liens) Enfin, la possibilité de l’afficher dans l’<a href="https://crisco4.unicaen.fr/des" target="_blank">interface graphique d’interrogation du DÉS</a> facilitera l’apprentissage des apprenants. <a href="#" name="halshs-03956407">1 </a>- Laurette Chardon. Insertion des catégories grammaticales dans le Dictionnaire Électronique des Synonymes (DES) -Document de travail. 2024. <a href="https://shs.hal.science/halshs-03956407v2" target="_blank">&lang;halshs-03956407v2&rang;</a> et le dépôt git <a href="https://git.unicaen.fr/crisco-des-public/descatgram" target="_blank">https://git.unicaen.fr/crisco-des-public/descatgram</a> <a href="#" name="halshs-03155459">2</a>- Laurette Chardon. L’espace sémantique du "Dictionnaire électronique des synonymes" (DES) et les méthodes de regroupement de sens : l’exemple de "sec". Syntaxe et Sémantique, 2020, Synonymie, polysémie et questions de sémantique lexicale, 1 (21), pp.87-126. <a href="https://dx.doi.org/10.3917/ss.021.0087" target="_blank">&lang;10.3917/ss.021.0087&rang;</a>. <a href="https://shs.hal.science/halshs-03155459" target="_blank">&lang;halshs-03155459&rang;</a> <a href="#" name="halshs-00009433">3</a> - Sabine Ploux, Bernard Victorri. Construction d'espaces sémantiques à l'aide de dictionnaires de synonymes. Revue TAL : traitement automatique des langues, 1998, 39, pp.161-182. <a href="https://shs.hal.science/halshs-00009433" target="_blank">&lang;halshs-00009433&rang;</a> <a href="#" name="hal-02430301">4 </a>- Sabine Ploux. Traitement des synonymes. [Rapport de recherche] CNRS; Université de Caen (France). 1995. <a href="https://hal.science/hal-02430301" target="_blank">&lang;hal-02430301&rang;</a> <a href="#" name="hal-02430342">5</a> - Sabine Ploux. Une étude pour le traitement informatique de la synonymie. 1996. <a href="https://hal.science/hal-02430342" target="_blank">&lang;hal-02430342&rang;</a> <a href="#" name="hal-04520029">6 </a>- Bernard Victorri, Jean-Luc Manguin. Représentation géométrique d'un paradigme lexical. Conférence TALN 1999, Jul 1999, Cargese (Corse), France. <a href="https://hal.science/hal-04520029" target="_blank">&lang;hal-04520029&rang;</a> <a href="#" name="halshs-00666584">7 </a>- Comme cette étude sur les verbes : Bernard Victorri. Quand les mots s'organisent en réseaux. L’Archicube , 2010, 8, pp.53-59. <a href="https://shs.hal.science/halshs-00666584" target="_blank">&lang;halshs-00666584&rang;</a> <a href="#" name="hal-04526033">8</a> - Comme cette étude sur les adjectifs : Fabienne Venant. REPRÉSENTATION ET CALCUL DYNAMIQUE DU SENS. <a href="https://my.editions-ue.com/catalog/details/store/de/book/978-613-1-53887-2/representation-et-calcul-dynamique-du-sens?search=Repr%C3%A9sentation%20et%20calcul%20dynamique%20du%20sens" target="_blank">éditions universitaires européennes</a>, Linguistique générale et comparée, 236p, 2010, 978-613-1-53887-2. <a href="https://hal.science/hal-04526033" target="_blank">&lang;hal-04526033&rang;</a>