<h2 style="text-align: justify;">Introduction</h2> <p style="text-align: justify;">Si l&rsquo;on reprend la terminologie propos&eacute;e par Basarab Nicolescu, &laquo;&nbsp;la pluridisciplinarit&eacute; concerne l&rsquo;objet d&rsquo;une seule et m&ecirc;me discipline par plusieurs disciplines &agrave; la fois&nbsp;&raquo; (Nicolescu, 1996, p.64). L&rsquo;interdisciplinarit&eacute; permet de faire franchir un cran suppl&eacute;mentaire dans l&rsquo;entrelacement des disciplines, puisqu&rsquo;elle &laquo;&nbsp;concerne le transfert des m&eacute;thodes d&rsquo;une discipline &agrave; une autre [&hellip;] mais sa finalit&eacute; reste aussi inscrite dans la recherche disciplinaire&nbsp;&raquo; (Nicolescu, 1996, p. 65‑66), avec des degr&eacute;s de bouleversements induits variables, du simple transfert-applicatif &agrave; l&rsquo;engendrement de nouvelles disciplines, en passant par les modifications de nature &eacute;pist&eacute;mologique. Enfin, stade ultime, la transdisciplinarit&eacute;, qui transcende les disciplines du fait de sa finalit&eacute;, &agrave; savoir la compr&eacute;hension du monde, &laquo;&nbsp;dont un des imp&eacute;ratifs est l&rsquo;unit&eacute; de la connaissance&nbsp;&raquo;.</p> <p style="text-align: justify;">Cette classification a &eacute;t&eacute; appr&eacute;hend&eacute;e de fa&ccedil;on l&eacute;g&egrave;rement diff&eacute;rente par J-L Le Moigne (Kourilsky, 2002, p. 26‑27) qui distingue l&rsquo;interdisciplinarit&eacute; de type pluri, soit l&rsquo;emprunt par une discipline de m&eacute;thodes valid&eacute;es issues d&rsquo;autres disciplines de l&rsquo;interdisciplinarit&eacute; de type trans qui &laquo;&nbsp;en affichant son postulat de &laquo;&nbsp;d&eacute;pendance au contexte&nbsp;&raquo; assume le primat de l&rsquo;intelligibilit&eacute; syst&eacute;mique sur la pr&eacute;visibilit&eacute; analytique&nbsp;&raquo;. Quel que soit le degr&eacute; d&rsquo;interdisciplinarit&eacute; in fine, nous partons du postulat de l&rsquo;existence d&rsquo;objets de recherche qui ont une ascendance issue de diff&eacute;rentes disciplines et, en ce sens, ces objets pourraient constituer un terrain propice aux croisements disciplinaires, au sein duquel il sera n&eacute;cessaire de favoriser le dialogue. Afin d&rsquo;identifier ces objets pluri/inter disciplinaires, nous proposons d&rsquo;interroger un syst&egrave;me d&rsquo;indexation de connaissances (la base des th&egrave;ses fran&ccedil;aises) crois&eacute; avec un syst&egrave;me d&rsquo;indexation des objets ou proc&eacute;d&eacute;s artificiels (la classification internationale des brevets). Dans ce qui suit nous contextualisons cette exp&eacute;rimentation, pr&eacute;sentons la m&eacute;thodologie puis les r&eacute;sultats obtenus, sous forme de visualisation, par le traitement d&rsquo;un cas particulier.&nbsp;</p> <h2 style="text-align: justify;">Contextualisation et probl&eacute;matisation</h2> <p style="text-align: justify;">Les nombreux d&eacute;bats sur le sens ou encore l&rsquo;utilit&eacute; de la recherche interdisciplinaire se confrontent souvent dans la fa&ccedil;on de d&eacute;finir et de distinguer les termes tels que la &laquo;&nbsp;pluridisciplinarit&eacute;&nbsp;&raquo;, la &laquo;&nbsp;multidisciplinarit&eacute;&nbsp;&raquo;, la &laquo;&nbsp;transdisciplinarit&eacute;&nbsp;&raquo; de Le Moigne (Kourilsky, 2002), ou m&ecirc;me la &laquo;&nbsp;m&eacute;tadisciplinarit&eacute;&nbsp;&raquo; (Prud&rsquo;homme &amp; Gingras, 2015). Le terme &laquo;&nbsp;polydisciplinaire&nbsp;&raquo; sera &eacute;galement rajout&eacute; par Morin pour d&eacute;signer &laquo;&nbsp;l&rsquo;association de disciplines en vertu d&#39;un projet ou d&#39;un objet qui leur est commun ; tant&ocirc;t les disciplines y sont appel&eacute;es comme techniciennes sp&eacute;cialistes pour r&eacute;soudre tel ou tel probl&egrave;me tant&ocirc;t au contraire elles sont en profonde interaction pour essayer de concevoir cet objet et ce projet, comme dans l&#39;exemple de l&#39;hominisation&nbsp;&raquo; (Morin, 1994).</p> <p style="text-align: justify;">L&rsquo;interdisciplinarit&eacute;, quant &agrave; elle, est vue par les politiques publiques et les dynamiques scientifiques comme un instrument de lutte contre l&rsquo;acad&eacute;misme de la recherche publique (Weingart et Stehr, 2000) et de promotion de ses retomb&eacute;es socio-&eacute;conomiques (Louvel, 2015). L&rsquo;interdisciplinarit&eacute; consiste en &laquo;&nbsp;la mise en relation d&rsquo;au moins deux disciplines en vue d&rsquo;&eacute;laborer une repr&eacute;sentation originale d&rsquo;une notion, d&rsquo;une situation, d&rsquo;une probl&eacute;matique&nbsp;&raquo; (Maingain, Dufour &amp; Fourez, 2002). Selon Lenoir (2003), l&rsquo;interdisciplinarit&eacute; doit avoir un ancrage dans le r&eacute;el. Pour Morin, elle signifie plusieurs choses&nbsp;: &laquo;&nbsp;que diff&eacute;rentes disciplines se mettent &agrave; une m&ecirc;me table, &agrave; une m&ecirc;me assembl&eacute;e, comme les diff&eacute;rentes nations se rassemblent &agrave; l&#39;ONU sans pouvoir faire autre chose que d&#39;affirmer chacune ses propres droits nationaux et ses propres souverainet&eacute;s par rapport aux empi&eacute;tements du voisin. Mais l&rsquo;interdisciplinarit&eacute; peut vouloir dire aussi &eacute;change et coop&eacute;ration, ce qui fait que l&#39;interdisciplinarit&eacute; peut devenir quelque chose d&#39;organique&nbsp;&raquo;.</p> <p style="text-align: justify;">Il a souvent &eacute;t&eacute; question de fractionnement des disciplines, de &quot;division arbitraire du savoir&quot; (Reisse, 1999), de &quot;d&eacute;coupage des connaissances&quot; ou encore &quot;d&#39;unit&eacute; de savoir&quot; dans certains domaines scientifiques. La sp&eacute;cialisation de certaines disciplines a cr&eacute;&eacute; de ce fait une caricature (utilisation d&#39;un jargon scientifique propre par exemple) rendant les champs &eacute;troits et les scientifiques enferm&eacute;s dans leur discipline (Guthleben, 2014). L&#39;approche de l&#39;interdisciplinarit&eacute; appara&icirc;t alors comme une &eacute;vidence, selon une logique de comp&eacute;tences. Les disciplines communiquent entre elles et sont parfois compl&eacute;mentaires les unes aux autres, mais pourtant : supprimer les fronti&egrave;res disciplinaires dans la production des connaissances parait irr&eacute;el &agrave; l&rsquo;heure actuelle. C&rsquo;est pourquoi nous pr&eacute;f&eacute;rons penser que les proc&eacute;d&eacute;s selon lesquels l&rsquo;interdisciplinarit&eacute; transforme et r&eacute;organise les disciplines, en tant qu&rsquo;unit&eacute;s essentielles d&rsquo;organisation et de diff&eacute;renciation des sciences contemporaines (Dubois, 2014) sont susceptibles d&rsquo;exister.</p> <p style="text-align: justify;">Le travail sur la question de l&rsquo;indexation et la classification ne date pas du XX&egrave;me si&egrave;cle bien au contraire, elle a &eacute;t&eacute; le sujet principal des travaux de Leibniz au travers des m&eacute;thodes d&rsquo;organisation des biblioth&egrave;ques (Le Deuff, 2015). Nous pouvons &eacute;galement &eacute;voquer les projets de Otlet et Lafontaine, l&rsquo;encyclop&eacute;die de Diderot et d&rsquo;Alembert, la classification de Melvil Dewey (1851-1931) pour illustrer la volont&eacute; des scientifiques &agrave; vouloir rassembler, archiver et diffuser les savoirs en un seul lieu, en un seul point, une r&eacute;f&eacute;rence qui s&rsquo;adapterait &agrave; tous les points de vue (disciplinaires). &nbsp;Cette notion m&ecirc;me de r&eacute;f&eacute;rentiel est, de longue date, accomplie au niveau de la classification internationale des brevets (CIB) dont l&rsquo;objet est de fournir un syst&egrave;me de classification dynamique (s&rsquo;adapte aux &eacute;volutions), univoque (chaque terme utilis&eacute; dans la description est d&eacute;fini et contextualis&eacute; &ndash;lingua franca) et international (ind&eacute;pendant de la langue) de tout ce qui est brevetable (objet ou proc&eacute;d&eacute;). Notre objectif est de mettre en lumi&egrave;re des objets &laquo;&nbsp;interdisciplinaires&nbsp;&raquo; par essence en mettant en exergue dans un syst&egrave;me documentaire acad&eacute;mique, ceux qui ont &eacute;t&eacute; abord&eacute;s par diff&eacute;rentes disciplines. Le sujet/contenu de chaque document extrait &agrave; un sujet donn&eacute; donnera les points de vue disciplinaires connexes. Avant de discuter de la m&eacute;thodologie &eacute;labor&eacute;e, nous pr&eacute;sentons les r&eacute;f&eacute;rentiels utilis&eacute;s pour construire ce pivot documentaire artificiel r&eacute;pondant &agrave; cette interrogation.</p> <h2 style="text-align: justify;">Les outils et ressources convoqu&eacute;es</h2> <h3 style="text-align: justify;">La classification internationale des brevets</h3> <p style="text-align: justify;">L&rsquo;Organisation Mondiale de la Propri&eacute;t&eacute; Intellectuelle (OMPI, traduit de l&rsquo;anglais WIPO &laquo;&nbsp;World Intellectual Property Organisation&nbsp;&raquo;)<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[1]</sup></a> a &eacute;t&eacute; cr&eacute;&eacute;e le 14 juillet 1967 &agrave; la suite de la signature de la convention de Stockholm par ses &Eacute;tats membres. A l&rsquo;origine, l&rsquo;organisation ne comptait que 51 &Eacute;tats, qui sont aujourd&rsquo;hui au nombre de 191 (dont la France depuis 1974).</p> <p style="text-align: justify;">C&rsquo;est la source de donn&eacute;es la plus compl&egrave;te au monde sur le syst&egrave;me de propri&eacute;t&eacute; intellectuelle, ainsi que d&rsquo;&eacute;tudes empiriques, de rapports et d&rsquo;informations factuelles sur la propri&eacute;t&eacute; intellectuelle. Sa mission principale est de promouvoir l&rsquo;innovation et la cr&eacute;ativit&eacute; aux fins du d&eacute;veloppement &eacute;conomique, social et culturel de tous les pays au moyen d&rsquo;un syst&egrave;me international de propri&eacute;t&eacute; intellectuelle &eacute;quilibr&eacute; et efficace. Ses services encouragent les personnes et les entreprises &agrave; innover et &agrave; cr&eacute;er.</p> <p style="text-align: justify;">Aujourd&rsquo;hui, plus de 110 millions de demandes de brevets ont &eacute;t&eacute; d&eacute;pos&eacute;es dans le monde. Cette masse informationnelle est accessible gr&acirc;ce &agrave; l&rsquo;Organisme Mondial de la Propri&eacute;t&eacute; Intellectuelle et l&rsquo;interface d&rsquo;acc&egrave;s &agrave; sa base mondiale EspaceNet<a href="#_ftn2" id="_ftnref2" name="_ftnref2"><sup>[2]</sup></a>.&nbsp;</p> <p style="text-align: justify;">Afin de classer et hi&eacute;rarchiser les brevets, l&rsquo;OMPI a mis en place l&rsquo;IPC (de l&rsquo;anglais &laquo;&nbsp;International Patent Classification&nbsp;&raquo;). La classification internationale des brevets (CIB)<a href="#_ftn3" id="_ftnref3" name="_ftnref3"><sup>[3]</sup></a> a &eacute;t&eacute; cr&eacute;&eacute;e par l&rsquo;Arrangement de Strasbourg en 1971. C&rsquo;est un syst&egrave;me hi&eacute;rarchique de symboles ind&eacute;pendants de la langue pour le classement des brevets et des mod&egrave;les d&rsquo;utilit&eacute; selon les diff&eacute;rents domaines technologiques auxquels ils appartiennent.</p> <p style="text-align: justify;">La CIB propose huit sections principales (cf. le Tableau 1 &agrave; gauche) avec plus de 70&nbsp;000 subdivisions (cf. le Tableau 2 qui pr&eacute;sente section par section les nombre de subdivisions qui les composent et permet d&rsquo;appr&eacute;cier la fine granularit&eacute; de ce sch&eacute;ma de classement). Chaque subdivision comprend un symbole, compos&eacute; de chiffres arabes et de lettres de l&rsquo;alphabet latin, qui constitue un code hi&eacute;rarchique (visible sur la colonne 3 du tableau suivant). Nous retrouvons ensuite ces symboles sur chaque document de brevet, attribu&eacute;s ou v&eacute;rifi&eacute;s par l&rsquo;expertise de l&rsquo;office national ou r&eacute;gional de propri&eacute;t&eacute; intellectuelle qui publie ce document.</p> <p style="text-align: center;"><em><img alt="" src="https://www.numerev.com/img/ck_153_8_image 11.JPG" style="display: block; margin-left: auto; margin-right: auto;" /></em></p> <p style="text-align: center;"><em>Tableau 1 : Syst&egrave;me de hi&eacute;rarchisation propos&eacute;e par la CIB (les sections et les modalit&eacute;s de leur subdivisions hi&eacute;rarchique en classe, sous-classe&hellip; et l&rsquo;exemple de leur description pour la classe A jusqu&rsquo;au sous-groupe A21C1/96. Source OMPI</em></p> <p style="text-align: justify;">Cette classification<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[4]</sup></a> est tr&egrave;s utile pour la recherche de documents brevet et pour effectuer une recherche sur l&rsquo;&eacute;tat de la technique. Elle constitue un point d&rsquo;entr&eacute;e principal car il s&rsquo;agit d&rsquo;un champ d&rsquo;indexation obligatoire et incontournable (Czajkowski, 2011; Durand-Barthez, 2013). Elle est tr&egrave;s utilis&eacute;e par les administrations charg&eacute;es de la d&eacute;livrance des brevets, les inventeurs potentiels, les unit&eacute;s de recherche-d&eacute;veloppement ainsi que tous ceux int&eacute;ress&eacute;s par les applications ou le d&eacute;veloppement de la technologie. La CIB est mise &agrave; jour r&eacute;guli&egrave;rement (au 1<sup>er</sup> janvier de chaque ann&eacute;e). La version actuelle et les versions pr&eacute;c&eacute;dentes sont disponibles en anglais et en fran&ccedil;ais. Cette r&eacute;vision est coordonn&eacute;e par le Comit&eacute; d&rsquo;experts de l&rsquo;Union de l&rsquo;IPC.</p> <p style="text-align: center;"><em><img alt="" src="https://www.numerev.com/img/ck_153_8_tableau de synthèse de la CIB (version 2019.01)2.JPG" /></em></p> <p style="text-align: center;"><em>Tableau 2 : tableau synth&eacute;tique des subdivisions de chaque section et des tailles de ces subdivisions. Version de janvier 2019, source OMPI: <a href="https://www.wipo.int/classifications/ipc/fr/ITsupport/Version20190101/transformations/stats.html">https://www.wipo.int/classifications/ipc/fr/ITsupport/Version20190101/transformations/stats.html</a></em></p> <p style="text-align: justify;">En plus de ce sch&eacute;ma de classification, l&rsquo;OMPI a d&eacute;velopp&eacute; des outils pour faciliter l&rsquo;utilisation de cette classification&nbsp;:</p> <ul> <li style="text-align: justify;"><strong>IPCCAT<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><strong><sup>[5]</sup></strong></a></strong>&nbsp;: Outil d&rsquo;aide au classement pour le syst&egrave;me de la CIB, cr&eacute;&eacute; principalement pour faciliter le classement des brevets aux niveaux des classes, sous-classes, groupes principaux ou sous-groupes de la CIB &agrave; l&rsquo;aide des r&eacute;sum&eacute;s ou d&rsquo;un texte court</li> <li style="text-align: justify;"><strong>STATS</strong>&nbsp;: Outil qui offre des pr&eacute;dictions de classement dans la CIB fond&eacute;es sur une analyse statistique des documents de brevet contenant les termes qui font l&rsquo;objet de la recherche</li> <li style="text-align: justify;"><strong>Inventaire vert</strong>&nbsp;: Facilite la recherche d&rsquo;information en mati&egrave;re de brevets relative aux technologies respectueuses de l&rsquo;environnement<br /> IPCCAT-neural est un ensemble de r&eacute;seaux de neurones (intelligence artificielle) accessible par une API qui, &agrave; un texte donn&eacute;, retourne un code de la CIB. Initialement mis au point en 2003, l&rsquo;outil est form&eacute; &agrave; la pr&eacute;vision du classement sous les 4 niveaux sup&eacute;rieurs de la CIB (section, classe, sous-classe et groupe principal). Il s&rsquo;utilise de cette fa&ccedil;on&nbsp;:</li> <li style="text-align: justify;">Le service web de l&rsquo;IPCCAT re&ccedil;oit un fragment XML comprenant&nbsp;: texte du document, langue, niveau attendu de la CIB et le nombre de codes IPC esp&eacute;r&eacute;s&nbsp;;</li> <li style="text-align: justify;">Le service retourne un nouveau fragment XML qui inclut le nombre demand&eacute; de cat&eacute;gories pr&eacute;dites au niveau IPC ainsi qu&rsquo;un score de confiance pour chaque pr&eacute;diction. Ce score de confiance est calcul&eacute; en valeur absolue.</li> </ul> <p style="text-align: justify;">L&rsquo;IPCCAT fonctionne aujourd&rsquo;hui avec les textes &eacute;crits en anglais ou en fran&ccedil;ais (Fi&eacute;vet &amp; Guyot, 2018). Nous utiliserons cet outil pour r&eacute;aliser un syst&egrave;me de pivot sur un syst&egrave;me d&rsquo;indexation de connaissances utilisant les disciplines en tant qu&rsquo;entr&eacute;e d&rsquo;index desquels nous extrairons le r&eacute;sum&eacute; (contenant hypoth&eacute;tiquement une description de connaissance) et la discipline aff&eacute;rente. IPCCAT construira un pivot vers le monde &laquo;&nbsp;tangible&nbsp;&raquo; d&eacute;crit par la classification brevet.</p> <h3 style="text-align: justify;">Le r&eacute;f&eacute;rentiel des disciplines&nbsp;</h3> <p style="text-align: justify;">Il existe plusieurs nomenclatures pour hi&eacute;rarchiser les domaines, sous domaines ou encore les disciplines et sous disciplines scientifiques. Cette diff&eacute;renciation est variable selon les institutions et organismes.</p> <p style="text-align: justify;">Nous en avons recens&eacute; quelques-unes et le Tableau 3 rend compte de la vari&eacute;t&eacute; des nomenclatures utilis&eacute;es selon les organismes (Domaines vs champ disciplinaires ou m&eacute;ta-regroupements) et du degr&eacute; des subdivisions selon :</p> <ol> <li style="text-align: justify;">ERC (European Research Council)<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[6]</sup></a>&nbsp;</li> <li style="text-align: justify;">AERES/ HCERES<a href="#_ftn2" id="_ftnref2" name="_ftnref2"><sup>[7]</sup></a> (Haut Conseil de l&rsquo;Evaluation de la Recherche et de l&rsquo;Enseignement Sup&eacute;rieur)</li> <li style="text-align: justify;">OST (Observatoire des Sciences et des Techniques)<a href="#_ftn3" id="_ftnref3" name="_ftnref3"><sup>[8]</sup></a></li> <li style="text-align: justify;">CNU (Conseil National des Universit&eacute;s)</li> <li style="text-align: justify;">INRA (Institut National de la Recherche Agronomique)</li> <li style="text-align: justify;">Minist&egrave;re de l&rsquo;enseignement sup&eacute;rieur et de la recherche et les Ecoles Doctorales</li> <li style="text-align: justify;">UNESCO (Organisation des Nations Unies pour l&rsquo;Education, la Science et la Culture)</li> <li style="text-align: justify;">Wikip&eacute;dia<a href="#_ftn4" id="_ftnref4" name="_ftnref4"><sup>[9]</sup></a></li> </ol> <p style="text-align: justify;">&nbsp;</p> <p><img alt="" src="https://www.numerev.com/img/ck_153_8_tableau.JPG" style="display: block; margin-left: auto; margin-right: auto;" /></p> <p style="text-align: center;"><em>Tableau 3 : tableau des nomenclatures et hi&eacute;rarchisation des disciplines selon les diff&eacute;rents organismes et structures comp&eacute;tentes</em></p> <p style="text-align: justify;">Ce tableau n&#39;est pas une analyse approfondie mais une liste exhaustive des diff&eacute;rents r&eacute;f&eacute;rentiels qui montre la diversit&eacute; des nomenclatures des disciplines (plus ou moins pr&eacute;dominantes selon les organismes avec les &quot;sciences exactes&quot;, les &quot;sciences de la vie&quot;, les &quot;sciences technologiques&quot; ou encore les &quot;sciences humaines et sociales&quot;) et qui rend compte &eacute;galement de la complexit&eacute; du dialogue interdisciplinaire &agrave; ce niveau de notre &eacute;tude.</p> <h3 style="text-align: justify;">La base des th&egrave;ses fran&ccedil;aises</h3> <p style="text-align: justify;">Le site fran&ccedil;ais &laquo;&nbsp;theses.fr&nbsp;&raquo;<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[10]</sup></a> est une base de donn&eacute;es ouverte en juillet 2011 recensant toutes les th&egrave;ses soutenues depuis 2006, dans les &eacute;tablissements ayant choisi le d&eacute;p&ocirc;t sous forme num&eacute;rique (et laissant de c&ocirc;t&eacute; le d&eacute;p&ocirc;t papier). Historiquement, c&rsquo;est une des applications du projet &laquo;&nbsp;Portail des th&egrave;ses&nbsp;&raquo; confi&eacute; &agrave; l&rsquo;ABES (Agence Bibliographique de l&rsquo;Enseignement Sup&eacute;rieur) en 2009, par le Minist&egrave;re de l&rsquo;Enseignement Sup&eacute;rieur et de la Recherche. &nbsp;</p> <p style="text-align: justify;">Les donn&eacute;es sont issues des personnels des &eacute;tablissements de soutenance et s&rsquo;agr&egrave;gent depuis les applications sources&nbsp;: STEP (Signalement des Th&egrave;ses En Pr&eacute;paration), STAR (Signalement des Th&egrave;ses Archivage Recherche) et le catalogue collectif SUDOC (Syst&egrave;me Universitaire de Documentation).</p> <p style="text-align: justify;">Depuis son lancement, la base de donn&eacute;es a connu plusieurs &eacute;volutions majeures&nbsp;:</p> <ul> <li style="text-align: justify;">Septembre 2011&nbsp;: versement des donn&eacute;es issues du Fichier Central des Th&egrave;ses vers theses.fr</li> <li style="text-align: justify;">Mai 2013&nbsp;: enrichissement de la bibliographie nationale des th&egrave;ses (th&egrave;ses soutenues en France depuis 1985).</li> </ul> <p style="text-align: justify;">Les donn&eacute;es sont accessibles via l&rsquo;interface du site (facilit&eacute;e par un moteur de recherche s&rsquo;appuyant sur les diff&eacute;rents champs d&rsquo;indexation). Les donn&eacute;es bibliographiques relevant du domaine public sont disponibles via une API. L&rsquo;exportation sous six formats diff&eacute;rents est &eacute;galement permise.</p> <p style="text-align: justify;">Pour mener &agrave; bien les op&eacute;rations et organiser le comit&eacute; de d&eacute;cision, l&rsquo;ABES s&rsquo;est entour&eacute;e de plusieurs partenaires&nbsp;: MISTRD (Mission de l&#39;information scientifique et technique et du r&eacute;seau documentaire), DGESIP (Direction g&eacute;n&eacute;rale pour l&#39;enseignement sup&eacute;rieur et l&#39;insertion professionnelle), DGRI (Direction g&eacute;n&eacute;rale pour la recherche et l&#39;innovation), Conf&eacute;rence des Pr&eacute;sidents d&rsquo;Universit&eacute;, Conf&eacute;rence des Grandes Ecoles, Formations doctorales dans les &eacute;tablissements habilit&eacute;s, Recherche priv&eacute;e ou monde &eacute;conomique, CNRS-INIST (Centre National de la Recherche Scientifique - Institut de l&rsquo;Information Scientifique et Technique), Atelier national de reproduction des th&egrave;ses de Lille, CINES (Centre Informatique National de l&rsquo;Enseignement Sup&eacute;rieur), Intelli&rsquo;Agence, ADBU (Association des Directeurs de Biblioth&egrave;ques Universitaires), AURA (Association du R&eacute;seau des Utilisateurs des produits de l&rsquo;ABES), CCSD (Centre pour la Communication Scientifique Directe) et TEL (Th&egrave;ses En Ligne).&nbsp;Bien que ces organismes se soient entendus sur les op&eacute;rations d&rsquo;indexation des th&egrave;ses, dans la pratique nous avons pu constater une immense vari&eacute;t&eacute;<a href="#_ftn2" id="_ftnref2" name="_ftnref2"><sup>[11]</sup></a> &nbsp;des disciplines.</p> <p style="text-align: justify;">En septembre 2019, la base nationale des th&egrave;ses fran&ccedil;aises compte 458&nbsp;964 th&egrave;ses (dont 385&nbsp;902 th&egrave;ses soutenues et 90&nbsp;560 th&egrave;ses accessibles). A chaque entr&eacute;e bibliographique de th&egrave;se les champs recueillis par la plateforme sont :</p> <ul style="text-align: justify;"> <li style="text-align: justify;">Discipline</li> <li style="text-align: justify;">&Eacute;tablissement</li> <li style="text-align: justify;">Date de soutenance</li> <li style="text-align: justify;">Etat&nbsp;: &laquo;&nbsp;en pr&eacute;paration depuis le&nbsp;&raquo;</li> <li style="text-align: justify;">&Eacute;coles Doctorales</li> <li style="text-align: justify;">Langues</li> <li style="text-align: justify;">Directeurs de th&egrave;se</li> <li style="text-align: justify;">Domaines</li> <li style="text-align: justify;">Description (fran&ccedil;ais et anglais)</li> <li style="text-align: justify;">Mots cl&eacute;s</li> <li style="text-align: justify;">Jury de th&egrave;se (pr&eacute;sident, rapporteurs).</li> </ul> <p style="text-align: justify;">Pour rappel, l&rsquo;acc&egrave;s au texte int&eacute;gral de la th&egrave;se est soumis &agrave; l&rsquo;autorisation accord&eacute;e par le docteur en question (et/ou les ayant-droits).</p> <h2 style="text-align: justify;">M&eacute;thode de recherche</h2> <p style="text-align: justify;">Pour donner &agrave; voir les documents acad&eacute;miques qui abordent des objets selon diff&eacute;rents points de vue disciplinaires et, en ce sens, r&eacute;pondent &agrave; une n&eacute;cessit&eacute; potentielle de dialogue interdisciplinaire, nous proposons une exp&eacute;rimentation qui vise &agrave; tester la CIB comme pivot de classement des r&eacute;sum&eacute;s des publications.</p> <p style="text-align: justify;">Le terrain acad&eacute;mique choisi se concentre ici sur la &laquo;&nbsp;science en train de de se faire&nbsp;&raquo;, soit : les th&egrave;ses de doctorat. Le sous-objectif de ce projet est de proposer des instruments de lecture et d&#39;exploration des donn&eacute;es collect&eacute;es et trait&eacute;es. Le sch&eacute;ma (Image 1) pr&eacute;sente la cha&icirc;ne de traitement globale de l&rsquo;exp&eacute;rimentation&nbsp;: la collecte des donn&eacute;es s&rsquo;effectue sur l&rsquo;API de la base des th&egrave;ses fran&ccedil;aises. Nous normalisons les disciplines recueillies en utilisant le r&eacute;f&eacute;rentiel CNU<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[12]</sup></a> et envoyons le r&eacute;sum&eacute; &agrave; l&rsquo;API IPCCAT pour identifier un code CIB associ&eacute; au texte. Le score nous permet de filtrer les r&eacute;sultats afin d&rsquo;obtenir un niveau de fiabilit&eacute; satisfaisant du proc&eacute;d&eacute; d&rsquo;identification des codes CIB. Enfin, les donn&eacute;es sont pr&eacute;par&eacute;es pour diff&eacute;rents outils de visualisation afin de mettre en exergue les &eacute;ventuels rapprochements interdisciplinaires potentiels. Cette proc&eacute;dure est d&eacute;taill&eacute;e ci-apr&egrave;s par la description des scripts de traitement.</p> <p style="text-align: center;"><em><img alt="" src="https://www.numerev.com/img/ck_153_8_image31.jpg" /></em></p> <p style="text-align: center;"><em>Image 1: cha&icirc;ne de traitement globale de l&rsquo;exp&eacute;rimentation : de la collecte (gauche) &agrave; la visualisation (droite) les diff&eacute;rentes op&eacute;rations de traitement, filtrage et seuillage des donn&eacute;es bibliographiques</em></p> <p style="text-align: center;"><em>&nbsp;</em></p> <h3 style="text-align: justify;">Les scripts</h3> <p style="text-align: justify;">De nombreux scripts ont &eacute;t&eacute; r&eacute;alis&eacute;s pour la mise en &oelig;uvre de cette exp&eacute;rimentation. Ils sont compl&eacute;mentaires et sont facilement exploitables, voire modifiables, pour &eacute;tendre les fonctionnalit&eacute;s (rajout de champs tels les &eacute;tablissements ou les directeurs de recherche) ou le terrain d&rsquo;application (revues acad&eacute;miques, r&eacute;sum&eacute;s des productions de laboratoire). Les scripts sont disponibles en Open Source sur Github<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[13]</sup></a>.</p> <p style="text-align: justify;">- Collecte de donn&eacute;es bibliom&eacute;triques de la base des th&egrave;ses fran&ccedil;aises (theses.fr)</p> <p style="text-align: justify;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; CollecteThese.pyest le script de d&eacute;part. Il suffit d&#39;adapter la ligne 12 valeur de &#39;requete&#39; &agrave; vos besoins. Afin de rester respectueux des serveurs il ne faut pas changer la valeur du time.sleep. La ligne 13 correspond au nom de fichier dans lequel seront &eacute;crites les donn&eacute;es.</p> <p style="text-align: justify;">- Pr&eacute;paration des donn&eacute;es r&eacute;colt&eacute;es</p> <p style="text-align: justify;">Le script <strong>LectureTheses.py</strong> s&#39;appuie sur un fichier JSON pr&eacute;par&eacute; par le script pr&eacute;c&eacute;dent. Il va r&eacute;cup&eacute;rer (si possible) le r&eacute;sum&eacute; de chaque entr&eacute;e bibliographique de th&egrave;se collect&eacute;e par le script pr&eacute;c&eacute;dent. Les entr&eacute;es qui n&rsquo;ont pas de r&eacute;sum&eacute; seront exclues de la suite. Le r&eacute;sum&eacute; est alors cat&eacute;goris&eacute; par IPCCAT<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[14]</sup></a>. Une s&eacute;rie de CIB et de scores de classement est alors ajout&eacute;e aux donn&eacute;es bibliographiques de la th&egrave;se. Le fichier JSON produit (ligne 20) contient les donn&eacute;es bibliographiques augment&eacute;es de ces deux &eacute;l&eacute;ments (r&eacute;sum&eacute; et liste CIB).</p> <p style="text-align: justify;">- Nettoyage des disciplines</p> <p style="text-align: justify;">Les donn&eacute;es ont n&eacute;cessit&eacute; la mise en place d&#39;un nettoyage du champ &quot;disciplines&quot; tant la vari&eacute;t&eacute; sur le plan lexical strict &eacute;tait importante (3307 disciplines diff&eacute;rentes pour 16790 th&egrave;ses recueillies). Sans pr&eacute;tention<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[15]</sup></a> le script <strong>TraiteDisicipline.py</strong> s&#39;appuie sur un dictionnaire cr&eacute;&eacute; (le 08/06/2019) &agrave; partir de la description des sections disciplinaires du site du CNU<a href="#_ftn2" id="_ftnref2" name="_ftnref2"><sup>[16]</sup></a>. Le dictionnaire utilis&eacute; est au format csv selon la nomenclature (Domaine; Num&eacute;ro de section;[liste lexicale;]) cf. &#39;DisciplinesCNU.csv). Le script utilise une distance de Levenshtein am&eacute;lior&eacute;e pour pouvoir rapprocher indiff&eacute;remment des tailles de cha&icirc;nes et les positions de mots au mieux par rapport aux entr&eacute;es du dictionnaire initial. Cf. fonction MatchSection. Le script a &eacute;t&eacute; lanc&eacute; plusieurs fois pour converger au mieux et le dictionnaire r&eacute;cursivement adapt&eacute; en rajoutant des termes pour qu&#39;ils soient associ&eacute;s &agrave; la &quot;bonne&quot; section. Nous avons cr&eacute;&eacute; un domaine transverse et des num&eacute;ros associ&eacute;s &agrave; ce domaine pour s&eacute;parer ce que nous ne pouvions classer... Reste aussi que l&#39;algorithme de classement et de rapprochement des unit&eacute;s lexicales serait &agrave; am&eacute;liorer. Le script construit un fichier JSON reprenant les donn&eacute;es bibliographiques de th&egrave;se pr&eacute;c&eacute;dentes et rajoute, pour chaque th&egrave;se, les champs :</p> <ol style="text-align: justify;"> <li>&quot;domaine&quot; : le domaine disciplinaire (DEG, SCIENCES, LSH1,2, Pharmacie ; Transverse)</li> <li>&quot;section&quot; : le num&eacute;ro de section CNU (1 &agrave; 77 + quelques entr&eacute;es au-dessus de 100)</li> <li>&quot;DiscipNorm&quot; : la discipline &quot;normalis&eacute;e&quot;, premi&egrave;re entr&eacute;e dans le dictionnaire csv apr&egrave;s le num&eacute;ro de section.</li> </ol> <h3 style="text-align: justify;">Les visualisations</h3> <p style="text-align: justify;">Une fois cette &eacute;tape termin&eacute;e, il ne reste plus qu&rsquo;&agrave; pr&eacute;parer les donn&eacute;es pour les visualisations. Les scripts suivants transforment les donn&eacute;es structur&eacute;es pr&eacute;c&eacute;demment trait&eacute;es dans des formats compatibles avec les diff&eacute;rents instruments de visualisation s&eacute;lectionn&eacute;s pour certains &agrave; partir des exemples de la librairie D3JS<a href="#_ftn1" id="_ftnref1" name="_ftnref1"><sup>[17]</sup></a> pour aider la lecture&nbsp;: &nbsp;</p> <ol style="text-align: justify;"> <li><strong>FiltresJsonDataPivot.py</strong>&nbsp;: export des donn&eacute;es pour Datable<a href="#_ftn2" id="_ftnref2" name="_ftnref2"><sup>[18]</sup></a> et PivotTable<a href="#_ftn3" id="_ftnref3" name="_ftnref3"><sup>[19]</sup></a>.</li> <li><strong>GraphHierarchie.py</strong>&nbsp;: pour chaque th&egrave;se, s&eacute;lectionne la valeur du score maximal et le num&eacute;ro CIB associ&eacute; (si pr&eacute;sent). Les scores nuls sont ignor&eacute;s. Trois fichiers de type json sont produits dont la d&eacute;nomination suit la nomenclature suivante : <ol> <li>HierarchieDiscipline-score-Titre&nbsp;: un tableau nomm&eacute; imbriquant la hi&eacute;rarchie des disciplines (corpus, domaine, section, discipline, etc. jusqu&rsquo;au titre de la th&egrave;se&nbsp;; des tableaux de tableaux) le score est le niveau de seuillage sur le score obtenu par IPCCAT&nbsp;;</li> <li>ValHierarchieDiscipline-score-Titre (m&ecirc;me que pr&eacute;c&eacute;demment mais la valeur de chaque n&oelig;ud est donn&eacute;e et fix&eacute;e au nombre d&#39;enfants de chaque niveau de branche&nbsp;;</li> <li>GraphHierarchie-score-Titre suit une autre repr&eacute;sentation en graphe&nbsp;: la liste des n&oelig;uds (sections, disciplines, etc.) et des liens (relation d&rsquo;appartenance) associ&eacute;s.</li> </ol> </li> </ol> <p style="text-align: justify;">Chacun de ces fichiers est utile &agrave; une ou plusieurs des repr&eacute;sentations diff&eacute;rentes. Voici les diff&eacute;rents diagrammes retenus pour l&rsquo;exploration (d&rsquo;autres non d&eacute;crits ici sont disponibles sur le d&eacute;p&ocirc;t)&nbsp;:</p> <p style="text-align: justify;">- <strong>PivotTable</strong>&nbsp;: tableau crois&eacute; dynamique permettant de g&eacute;n&eacute;rer des graphiques &agrave; partir de croisement de donn&eacute;es que l&rsquo;utilisateur choisi via l&rsquo;interface (histogramme des productions, cartes de chaleur par domaine, etc.).</p> <p><em><img alt="" height="313" src="https://www.numerev.com/img/ck_153_8_image71.jpg" style="display: block; margin-left: auto; margin-right: auto;" width="600" /></em></p> <p style="text-align: center;"><em>Image 2 : Tableau crois&eacute; dynamique avec, ci-contre, un histogramme modul&eacute; avec les diff&eacute;rentes donn&eacute;es pour obtenir &quot;nombre par date&quot; pour la requ&ecirc;te &quot;eau&quot;</em></p> <p style="text-align: justify;">- <strong>DataTable</strong>&nbsp;: tableur de donn&eacute;es permettant de visualiser et d&rsquo;explorer (tri, recherche dans les diff&eacute;rentes entr&eacute;es bibliographiques du corpus).</p> <p style="text-align: center;"><em>&nbsp;</em></p> <p style="text-align: center;"><em><img alt="" height="430" src="https://www.numerev.com/img/ck_153_8_image51.jpg" style="display: block; margin-left: auto; margin-right: auto;" width="844" /></em></p> <p style="text-align: center;"><em>Image 3 : Tableau de donn&eacute;es des diff&eacute;rentes informations appartenant &agrave; la requ&ecirc;te &quot;eau&quot; (identifiant, titre de la th&egrave;se, discipline, domaine, section CNU, directeur de th&egrave;se...)</em></p> <p style="text-align: justify;">- <strong>Collapsible Tree</strong>&nbsp;: arborescence pliable/ modulable. Utilitaire pour visualiser l&rsquo;arborescence disciplinaire reconstruite &agrave; partir des donn&eacute;es du corpus. Chaque branche (domaine) s&rsquo;ouvre sur les num&eacute;ros de section, elle-m&ecirc;me sur l&rsquo;entr&eacute;e choisie comme &laquo;&nbsp;cl&eacute;&nbsp;&raquo; pour les diff&eacute;rentes variations lexicales (ou autres entr&eacute;es d&eacute;crivant la section) identifi&eacute;es (Image2). La version TidyTree.html se veut pr&eacute;senter l&rsquo;ensemble de l&rsquo;arbre (sans interactions) des domaines aux titres des th&egrave;ses.</p> <p style="text-align: center;"><em><img alt="" height="488" src="https://www.numerev.com/img/ck_153_8_image-20191105125920-1.png" style="display: block; margin-left: auto; margin-right: auto;" width="740" /></em></p> <p style="text-align: center;"><em>Image 4 : La cartographie des domaines disciplinaires, les disciplines du CNU (num&eacute;ro de section) et l&#39;imbrication des diff&eacute;rentes &eacute;critures de ces derni&egrave;res. Les branches sont repliables et d&eacute;pliables pour pouvoir naviguer. Ici quatre disciplines sont &laquo;&nbsp;d&eacute;roul&eacute;es&nbsp;&raquo;&nbsp;: de haut en bas, les sections 74, 70, 76 et la section 23 qui permet de lire les nombreux d&eacute;clinaisons de la g&eacute;ographie dans les disciplines extraites des entr&eacute;es bibliographiques du corpus.</em></p> <p style="text-align: justify;">- <strong>Nested Treemap</strong>&nbsp;: carte proportionnelle imbriqu&eacute;e qui r&eacute;v&egrave;le le degr&eacute; de repr&eacute;sentation des domaines, sections et disciplines &quot;normalis&eacute;es&quot; dans le corpus d&#39;&eacute;tude en rendant chaque &eacute;l&eacute;ment proportionnel au nombre d&rsquo;entr&eacute;e (les code CIB). Le nombre de th&egrave;ses associ&eacute;es est aussi inscrit (cf. Image 3).</p> <p><img alt="" src="https://www.numerev.com/img/ck_153_8_image61.jpg" style="display: block; margin-left: auto; margin-right: auto;" /></p> <p style="text-align: center;"><em>Image 5 : Carte proportionnelle imbriqu&eacute;e. Permet de visualiser rapidement les codes CIB pr&eacute;dominants par section disciplinaire et leur nombre de th&egrave;se aff&eacute;rentes.</em></p> <p>- <strong>Sankey </strong>: diagramme de Sankey (ou diagramme de flux) met en lumi&egrave;re les croisements disciplinaires les plus marqu&eacute;s. Soit en partant des domaines vers les codes CIB, soit l&#39;inverse (cf. Image 4).</p> <p style="text-align: center;"><em><img alt="" src="https://www.numerev.com/img/ck_153_8_image-20191105130231-2.png" style="display: block; margin-left: auto; margin-right: auto;" /></em></p> <p style="text-align: center;"><em>Image 6 : Extrait du diagramme de flux (Sankey) repr&eacute;sentant les imbrications depuis les domaines disciplinaires aux codes CIB. Les relations et constructions (points de vue) interdisciplinaires sont manifestes par la lecture des croisements et codes couleurs associ&eacute;s (en milieu de figure, les codes CIB d&rsquo;ordre 4).</em></p> <p style="text-align: justify;">- <strong>Sunburst </strong>: un cercle int&eacute;rieur entour&eacute; d&#39;anneaux de niveaux hi&eacute;rarchiques plus profonds qui permet une exploration interactive de la hi&eacute;rarchie Corpus&nbsp; &gt; domaines &gt; section &gt; discipline &gt; codes CIB.</p> <p><img alt="" height="550" src="https://www.numerev.com/img/ck_153_8_image91.jpg" style="display: block; margin-left: auto; margin-right: auto;" width="600" /></p> <p style="text-align: center;"><em>Image 7 : Exemple de diagramme (Sunburst) pour la requ&ecirc;te &quot;eau&quot; avec les diff&eacute;rentes hi&eacute;rarchies interactives selon les disciplines, domaines et code CIB en r&eacute;f&eacute;rence aux th&egrave;ses obtenues (corpus)</em></p> <h2 style="text-align: justify;">Collecte et exploitations des donn&eacute;es</h2> <p style="text-align: justify;">Nous avons choisi, pour ce test, d&rsquo;utiliser un terme g&eacute;n&eacute;rique que l&rsquo;on sait relevant forc&eacute;ment de diff&eacute;rentes disciplines afin d&rsquo;illustrer notre exp&eacute;rimentation&nbsp;: la requ&ecirc;te ici est &laquo;&nbsp;eau&nbsp;&raquo;. Ce terme nous a permis de g&eacute;n&eacute;rer (au 08/06/2019) un corpus de 16790 entr&eacute;es bibliographiques au terme de 15 heures de collecte. Un total de 444 entr&eacute;es bibliographiques ne poss&eacute;dait pas de r&eacute;sum&eacute;.</p> <p style="text-align: justify;">Le Tableau 4 repr&eacute;sente les r&eacute;sultats du proc&eacute;d&eacute; de traitement et de filtrage (troisi&egrave;me colonne du sch&eacute;ma g&eacute;n&eacute;ral (Image 1)) qui consiste &agrave; classer les r&eacute;sum&eacute;s dans la CIB. Le score du classement obtenu nous sert &agrave; seuiller les r&eacute;sultats et &eacute;liminer les entr&eacute;es. Ce tableau montre les &eacute;volutions du nombre d&rsquo;entr&eacute;es bibliographiques (ligne 3) en fonction du score (ligne 1) qui induit l&rsquo;&eacute;limination des entr&eacute;es dont le score est en dessous. La ligne 2 repr&eacute;sente le nombre d&rsquo;entr&eacute;es &eacute;limin&eacute;es. La derni&egrave;re ligne du tableau r&eacute;v&egrave;le le nombre de disciplines pr&eacute;sente au sein de chaque sous corpus.</p> <p style="text-align: justify;"><img alt="" src="https://www.numerev.com/img/ck_153_8_seuil.jpg" /></p> <p style="text-align: justify;">Tableau 4 : g&eacute;n&eacute;ration de sous corpus par seuil sur le score obtenu par IPCCat pour les r&eacute;sum&eacute;s de th&egrave;se</p> <p style="text-align: justify;">Comme dit pr&eacute;c&eacute;demment, nous avons produit les outils d&rsquo;exploration des r&eacute;sultats sous forme visuelle qui permettent d&rsquo;explorer ce corpus.</p> <p style="text-align: justify;">Gr&acirc;ce &agrave; ces illustrations, nous pouvons voir que &laquo;&nbsp;l&rsquo;eau&nbsp;&raquo; (terme tr&egrave;s g&eacute;n&eacute;rique mais emprunt&eacute;) et les travaux utilisant ce terme se situent quelquefois au carrefour de plusieurs disciplines. Par l&rsquo;exploration appara&icirc;t que certains codes CIB sont adress&eacute;s par de multiples disciplines (par exemple, avec la requ&ecirc;te &quot;eau&quot;, nous obtenons : G06T &ndash; traitement de l&rsquo;image, A01N &ndash; pr&eacute;servation des plantes, G06F - traitement &eacute;lectrique de donn&eacute;es num&eacute;riques, etc&hellip;). Ce qui permet de relier les textes et les r&eacute;sum&eacute;s des th&egrave;ses selon un syst&egrave;me de hi&eacute;rarchisation/classification pr&eacute;cis et tangible.</p> <h2 style="text-align: justify;">Discussion (r&eacute;sultats et limites)</h2> <p style="text-align: justify;">Les r&eacute;sultats obtenus par les visualisations nous permettent de poser clairement les avantages et les limites de cette exp&eacute;rimentation.</p> <p style="text-align: justify;">Selon le cas, nous obtenons des r&eacute;sultats pertinents et ce gr&acirc;ce &agrave; l&rsquo;outil de classification utilis&eacute; (la CIB). Mais nous pouvons &agrave; ce stade d&eacute;gager d&eacute;j&agrave; deux limites&nbsp;:</p> <p style="text-align: justify;">&agrave;&nbsp; - La classification des inventions : des objets techniques qui ne sont pas des concepts qui implique des biais &eacute;vidents li&eacute;s &agrave; la s&eacute;mantique des termes (par simple opposition concept/concret). L&rsquo;utilisation d&rsquo;outil d&rsquo;extraction s&eacute;mantique avanc&eacute; permettrait potentiellement de filtrer en amont les textes dont le contenu ne rel&egrave;ve pas du concret ce qui augmenterait l&rsquo;efficacit&eacute; de l&rsquo;instrumentation propos&eacute;e</p> <p style="text-align: justify;">&nbsp;&nbsp;&nbsp; - Le classement grossier et imparfait des disciplines (mais ajustable) pose aussi quelques &eacute;cueils : certains croisements disciplinaires affich&eacute;s par le diagramme de Sankey (par exemple Image 6) peuvent venir d&#39;une erreur d&#39;affectation d&#39;une cha&icirc;ne lexicale &agrave; une section disciplinaire...</p> <p style="text-align: justify;">Toutefois, &agrave; partir de la requ&ecirc;te de d&eacute;part, l&rsquo;exp&eacute;rimentation peut &ecirc;tre adapt&eacute;e &agrave; toutes les disciplines &agrave; partir de n&rsquo;importe quel mot cl&eacute;. Par choix, nous avons privil&eacute;gi&eacute; une requ&ecirc;te nous conduisant &agrave; des domaines de recherche d&rsquo;applications tangibles (ing&eacute;nierie, g&eacute;ographie, pharmacie, chimie sont les plus repr&eacute;sent&eacute;s). Par construction, nous avons &eacute;vit&eacute; de nombreux sujets de recherche qui ne se pr&ecirc;tent pas &agrave; ce proc&eacute;d&eacute; de pivot telle la philosophie ou la politique par exemple. Mais nous avons pens&eacute; &agrave; des requ&ecirc;tes qui pourront faire l&#39;objet d&#39;une nouvelle &eacute;tude pour cette exp&eacute;rimentation, comme : &quot;communaut&eacute;&quot;, &quot;information&quot; ou encore &quot;r&eacute;seaux&quot;. A l&rsquo;aide des r&eacute;sultats obtenus, nous pouvons voir que notre proposition est au croisement de deux mondes&nbsp;: le monde acad&eacute;mique et le monde technologique (ce qui nous renvoie &agrave; la notion m&ecirc;me d&rsquo;interdisciplinarit&eacute; et &agrave; la probl&eacute;matique de d&eacute;part de notre &eacute;tude).</p> <p style="text-align: justify;">Cette exp&eacute;rimentation peut &ecirc;tre &eacute;galement modul&eacute;e &agrave; partir d&rsquo;autres sources de donn&eacute;es. Nous avons choisi par avance un syst&egrave;me d&rsquo;indexation issu de la production scientifique &agrave; partir des r&eacute;sum&eacute;s des th&egrave;ses fran&ccedil;aises, mais celui-ci peut s&rsquo;appliquer &agrave; d&rsquo;autres corpus (r&eacute;sum&eacute;s d&rsquo;article de recherche sur HAL, PubMed, Google Scholar, ArchiveSIC, ISTEX&hellip;).</p> <p style="text-align: justify;">Nous pensons &eacute;galement utiliser d&rsquo;autres r&eacute;f&eacute;rentiels de classement documentaire (comme la classification de Dewey ou Mesh) mais les outils pour automatiser sont manquants.</p> <h2 style="text-align: justify;">Conclusion</h2> <p style="text-align: justify;">L&rsquo;instrumentation documentaire produite permet (&agrave; la limite de son perfectionnement) d&rsquo;extraire &agrave; un sujet donn&eacute; les positionnements et interrogations disciplinaires potentielles. En s&rsquo;affranchissant des erreurs introduites par la projection sur le sch&eacute;ma de classement de la CIB des r&eacute;sum&eacute;s de th&egrave;ses, et par le classement approximatif des identification lexicales des disciplines, le r&eacute;sultat est interpr&eacute;table par la consid&eacute;ration de points de vue &laquo;&nbsp;disciplinaires&nbsp;&raquo;. De fait, les &eacute;changes et la communication peuvent alors se fonder sur ces points de vue singuliers afin de coconstruire le dialogue, s&rsquo;entendre (ou identifier) sur les terminologies et aborder alors la probl&eacute;matique initiale sous un angle potentiellement nouveau, r&eacute;solument interdisciplinaire.</p> <p style="text-align: justify;">Des travaux sont en cours pour am&eacute;liorer le dispositif et circonscrire les limites pr&eacute;cis&eacute;ment sur le plan lexical pour tenter d&rsquo;&eacute;liminer les &eacute;cueils de classification. En extension, en termes d&rsquo;application, nous projetons de r&eacute;aliser une approche comparative de diff&eacute;rentes bases d&rsquo;indexation documentaire afin de cartographier, au travers de la codification du sch&eacute;ma de la CIB, les diff&eacute;rences et ressemblances de ces bases documentaires afin d&rsquo;en r&eacute;v&eacute;ler des &eacute;ventuelles sp&eacute;cificit&eacute;s.</p> <p style="text-align: justify;">Cette exp&eacute;rimentation a &eacute;t&eacute; grandement facilit&eacute;e par l&rsquo;ouverture des donn&eacute;es et la diffusion des connaissances rendues possibles &agrave; leur tour par de nombreux facteurs aujourd&rsquo;hui indispensables, tels que&nbsp;: l&rsquo;Open Science, l&rsquo;interop&eacute;rabilit&eacute; des donn&eacute;es, les vocabulaires contr&ocirc;l&eacute;s (Linked Open Vocabulary) et les principes FAIR pour la gestion des donn&eacute;es.&nbsp;</p> <h2 style="text-align: justify;">Bibliographie</h2> <p style="text-align: justify;">Czajkowski, A. (2011). <em>Using patent classification for searching, in particular the International Patent Classification (IPC)</em>. Consult&eacute; &agrave; l&rsquo;adresse&nbsp;:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="https://www.wipo.int/export/sites/www/tisc/en/ppt/Philippines/patent_classification.pdf">https://www.wipo.int/export/sites/www/tisc/en/ppt/Philippines/patent_classification.pdf</a></p> <p style="text-align: justify;">Dubois, M. (2014). &laquo;&nbsp;<em>Private Knowledge</em> et &ldquo;programme disciplinaire&rdquo; en sciences sociales&nbsp;: &eacute;tude de cas &agrave; partir de la correspondance de Robert K. Merton&nbsp;&raquo;, <em>L&rsquo;Ann&eacute;e sociologique</em>, <em>64</em>, 1, p.&nbsp;79-119.</p> <p style="text-align: justify;">Durand-Barthez, M. (2013). Former &agrave; l&rsquo;information brevets dans l&rsquo;enseignement sup&eacute;rieur. <em>Revue Internationale D&rsquo;Intelligence &Eacute;conomique</em>, <em>5</em>(1), 25‑38.</p> <p style="text-align: justify;">Fi&eacute;vet, P., &amp; Guyot, F. (2018). <em>Automatic Categorization of Patent Documents in the International Patent Classification (IPCCAT)</em>. Pr&eacute;sent&eacute; &agrave; The International Conference on Search, Data and Text Mining and Visualization. (IC-SDV), Nice. Consult&eacute; &agrave; l&rsquo;adresse <a href="https://haxel.com/ii-sdv/2018/Programme/monday-23-april-2018">https://haxel.com/ii-sdv/2018/Programme/monday-23-april-2018</a></p> <p style="text-align: justify;">Fourez, G. (dir.), Maingain, A. &amp; Dufour, B. (2002). <em>Approches didactiques de l&rsquo;interdisciplinarit&eacute;</em>. Bruxelles&nbsp;: De Boeck.</p> <p style="text-align: justify;">Grant, J. L. (2011). <em>Searching Using Different Classification Systems</em>. Consult&eacute; &agrave; l&rsquo;adresse <a href="https://www.wipo.int/export/sites/www/tisc/en/ppt/Morocco/Classification_Systems_EN.pdf">https://www.wipo.int/export/sites/www/tisc/en/ppt/Morocco/Classification_Systems_EN.pdf</a></p> <p style="text-align: justify;">Guthleben, D. (2014). De l&#39;indispensable interdisciplinarit&eacute;. CNRS Le journal. Consult&eacute; sur : <a href="https://lejournal.cnrs.fr/billets/de-lindispensable-interdisciplinarite">https://lejournal.cnrs.fr/billets/de-lindispensable-interdisciplinarite</a></p> <p style="text-align: justify;">Kourilsky, F. (2002). <em>Ing&eacute;nierie de l&rsquo;interdisciplinarit&eacute;. Un nouvel esprit scientifique</em>. L&rsquo;Harmattan, Paris, 2002.</p> <p style="text-align: justify;">Le Deuff, O. (2015). ‪Utopies documentaires&nbsp;: de l&rsquo;indexation des connaissances &agrave; l&rsquo;indexation des existences‪. <em>Communication &amp; Organisation</em>, 48(2), 93-106. <a href="https://www.cairn.info/revue-communication-et-organisation-2015-2-page-93.htm.">https://www.cairn.info/revue-communication-et-organisation-2015-2-page-93.htm.</a></p> <p style="text-align: justify;">Lenoir, Y.(2003). La pratique de l&rsquo;interdisciplinarit&eacute; dans l&rsquo;enseignement: pour construire des savoirs transversaux et int&eacute;gr&eacute;s dans le cadre d&rsquo;une approche par comp&eacute;tences, CRIE</p> <p style="text-align: justify;">Facult&eacute; d&rsquo;&eacute;ducation, Universit&eacute; de Sherbrooke, P 76</p> <p style="text-align: justify;">Louvel, S. (2015). Ce que l&rsquo;interdisciplinarit&eacute; fait aux disciplines: Une enqu&ecirc;te sur la nanom&eacute;decine en France et en Californie. <em>Revue fran&ccedil;aise de sociologie</em>, vol. 56(1), 75-103. doi:10.3917/rfs.561.0075.</p> <p style="text-align: justify;">Morin, E. (1994). &laquo;&nbsp;Sur l&rsquo;interdisciplinarit&eacute;&nbsp;&raquo; Bulletin Interactif du Centre International de Recherches et &Eacute;tudes transdisciplinaires n&deg; 2 - Juin 1994 [En ligne, consult&eacute; en septembre 2018] <a href="http://ciret-transdisciplinarity.org/bulletin/b2c2.php">http://ciret-transdisciplinarity.org/bulletin/b2c2.php</a></p> <p style="text-align: justify;">Nicolescu, B. (1996). <em>La transdisciplinarit&eacute;</em>. Ed. du Rocher : Paris.</p> <p style="text-align: justify;">Prud&rsquo;homme, J. &amp; Gingras, Y. (2015). Les collaborations interdisciplinaires&nbsp;: raisons et obstacles. In&nbsp;: <em>Actes de la recherche en sciences sociales</em>, 210(5), 40-49. doi:<a href="http://dx.doi.org/10.3917/arss.210.0040">10.3917/arss.210.0040</a>.</p> <p style="text-align: justify;">Reisse, J. (1999). L&#39;interdisciplinarit&eacute;, cons&eacute;quence d&#39;une division arbitraire du savoir. <em>Revue de G&eacute;ographie Alpine</em>, 87-1, pp 13-18. Consult&eacute; sur : <a href="https://www.persee.fr/doc/rga_0035-1121_1999_num_87_1_2913">https://www.persee.fr/doc/rga_0035-1121_1999_num_87_1_2913</a></p> <p style="text-align: justify;">Weingart,&nbsp; P. &amp; Stehr, N. (eds.). 2000. <em>Practising Interdisciplinarity</em>, Toronto, University of Toronto Press.</p> <hr /> <p style="text-align: justify;">&nbsp;&nbsp;</p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[1]</a> <a href="https://www.wipo.int/portal/fr/">https://www.wipo.int/portal/fr/</a></p> <p style="text-align: justify;"><a href="#_ftnref2" id="_ftn2" name="_ftn2">[2]</a> <a href="https://worldwide.espacenet.com/">https://worldwide.espacenet.com/</a></p> <p style="text-align: justify;"><a href="#_ftnref3" id="_ftn3" name="_ftn3">[3]</a> <a href="https://www.wipo.int/classifications/ipc/fr">https://www.wipo.int/classifications/ipc/fr</a></p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[4]</a> Il existe d&rsquo;autres sch&eacute;ma de classification. La CIB est moins fine que l&rsquo;ECLA par ex. mais est internationale (utilis&eacute;e pour tous les brevets du monde). Un panorama des modalit&eacute;s de recherche &agrave; travers les diff&eacute;rents syst&egrave;mes de classification est propos&eacute; par Grant (2011).</p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[5]</a> <a href="https://www.wipo.int/classifications/ipc/ipcpub/?notion=scheme&amp;version=20190101&amp;symbol=none&amp;menulang=fr&amp;lang=fr&amp;viewmode=f&amp;fipcpc=no&amp;showdeleted=yes&amp;indexes=no&amp;headings=yes">https://www.wipo.int/classifications/ipc/ipcpub/?notion=scheme&amp;version=20190101&amp;symbol=none&amp;menulang=fr&amp;lang=fr&amp;viewmode=f&amp;fipcpc=no&amp;showdeleted=yes&amp;indexes=no&amp;headings=yes</a>&not;es=yes&amp;direction=o2n&amp;initial=A&amp;cwid=none&amp;tree=no&amp;searchmode=smart</p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[6]</a> <a href="https://cat.opidor.fr/index.php/Nomenclature_ERC">https://cat.opidor.fr/index.php/Nomenclature_ERC</a></p> <p style="text-align: justify;"><a href="#_ftnref2" id="_ftn2" name="_ftn2">[7]</a> <a href="https://esr-wikis.adc.education.fr/ca2co/index.php/Nomenclatures_">https://esr-wikis.adc.education.fr/ca2co/index.php/Nomenclatures_</a>:_2.1_Domaines_et_sous_domaines_scientifiques</p> <p style="text-align: justify;"><a href="#_ftnref3" id="_ftn3" name="_ftn3">[8]</a> <a href="https://www.ird.fr">https://www.ird.fr</a> &rsaquo; content &rsaquo; download &rsaquo; version &rsaquo; file &rsaquo; nomenclature OST</p> <p style="text-align: justify;"><a href="#_ftnref4" id="_ftn4" name="_ftn4">[9]</a> <a href="https://fr.wikipedia.org/wiki/Discipline_scientifique">https://fr.wikipedia.org/wiki/Discipline_scientifique</a></p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[10]</a> <a href="http://www.theses.fr">http://www.theses.fr</a></p> <p style="text-align: justify;"><a href="#_ftnref2" id="_ftn2" name="_ftn2">[11]</a> Sur le plan lexical le plus souvent (pluriels, coquilles) mais aussi au plan de la pr&eacute;cision recherch&eacute;e (histoire, histoire et arch&eacute;ologie&hellip;) ou inventive (Physicochimie, physicochimie, physique-chimie, chimie-physique&hellip;) et enfin s&eacute;mantique (combustion, thermique, &eacute;nergie thermique et combustion). De nombreux exemples li&eacute;s &agrave; notre cas d&rsquo;&eacute;tude permettent d&rsquo;appr&eacute;cier cette vari&eacute;t&eacute; cf. infra.</p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[12]</a> Cette op&eacute;ration a d&ucirc; &ecirc;tre rajout&eacute;e face &agrave; la disparit&eacute; des disciplines recueillies dans notre corpus de test. Le champ est en texte libre pour d&eacute;crire une th&egrave;se et de fait de tr&egrave;s nombreuses variantes lexicales sont pr&eacute;sentes.</p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[13]</a> Cf. <a href="https://github.com/ClaraGalliano/PivotCIB-NumeRev">https://github.com/ClaraGalliano/PivotCIB-NumeRev</a></p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[14]</a> Voici le point d&rsquo;entr&eacute;e de l&rsquo;Api IPCCAT&nbsp;: <a href="https://www.wipo.int/classifications/ipc/ipccat?&amp;hierarchiclevel=">https://www.wipo.int/classifications/ipc/ipccat?&amp;hierarchiclevel=</a></p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[15]</a> Notre objectif n&rsquo;est pas de normaliser les entr&eacute;es de disciplines de la base des th&egrave;ses mais de produire un r&eacute;f&eacute;rentiel de lecture humainement lisible&hellip; Les auteurs ne s&#39;engagent en rien sur la position &eacute;ventuelle d&#39;une (ou plusieurs) &quot;sous&quot;-discipline(s) dans une section erron&eacute;e, ni sur les horribles choix potentiels que nous avons d&ucirc; faire pour les besoins de la lecture !</p> <p style="text-align: justify;"><a href="#_ftnref1" id="_ftn1" name="_ftn1">[17]</a> Cf. <a href="https://github.com/d3/d3/wiki/Gallery">https://github.com/d3/d3/wiki/Gallery</a></p> <p style="text-align: justify;"><a href="#_ftnref2" id="_ftn2" name="_ftn2">[18]</a> Cf. <a href="https://datatables.net/">https://datatables.net/</a></p> <p style="text-align: justify;"><a href="#_ftnref3" id="_ftn3" name="_ftn3">[19]</a> Cf. <a href="https://github.com/nicolaskruchten/pivottable/tree/master/dist">https://github.com/nicolaskruchten/pivottable/tree/master/dist</a></p> <p style="text-align: justify;"><a href="#_ftnref2" id="_ftn2" name="_ftn2">[16]</a> <a href="http://www.cpcnu.fr/listes-des-sections-cnu">http://www.cpcnu.fr/listes-des-sections-cnu</a></p> <div style="clear: both; float: none; display: block; visibility: hidden; width: 0px; font-size: 0px; line-height: 0;">&nbsp;</div> <p>&nbsp;</p>