<p>R&eacute;sum&eacute;</p> <p>Notre proposition vise &agrave; pr&eacute;senter un retour d&rsquo;exp&eacute;rience sur les notions de lieu et nom de lieu en<br /> s&rsquo;appuyant sur les trois niveaux d&rsquo;analyse de l&rsquo;<em> &quot;interdisciplinarit&eacute; focalis&eacute;e</em>&quot; propos&eacute;e par [4]. Celle-ci, sur<br /> un m&ecirc;me objet d&rsquo;analyse &ndash; ici le lieu &ndash; vise &agrave; articuler entre eux les concepts, les outils d&rsquo;analyse et les<br /> r&eacute;sultats interpr&eacute;t&eacute;s par diff&eacute;rentes disciplines pour produire de la connaissance.<br /> Les lieux constituent une information structurante [3] pour de nombreux textes : r&eacute;cits de vie, romans,<br /> articles journalistiques, itin&eacute;raires de randonn&eacute;es, etc. Ils sont des &eacute;l&eacute;ments informationnels pertinents<br /> dont on parle et qui jouent un r&ocirc;le dans la description d&rsquo;un &eacute;v&eacute;nement, d&rsquo;un fait [8]. Mais le lieu du<br /> texte (et plus pr&eacute;cis&eacute;ment le signe du lieu dans le texte, i.e. sa d&eacute;nomination) fait r&eacute;f&eacute;rence &agrave; un lieu du<br /> monde physique. Les lieux et les objets localis&eacute;s, pertinents dans le contexte de chacun de ces textes, en<br /> constituent un mode d&rsquo;exploration pr&eacute;pond&eacute;rant.<br /> La probl&eacute;matique de ce travail est fond&eacute;e sur l&rsquo;articulation entre traitement automatique des langues<br /> (d&eacute;sormais TAL) et g&eacute;omatique pour pr&eacute;ciser ce qui fait lieu afin de construire la repr&eacute;sentation cartographique<br /> d&rsquo;un texte. L&rsquo;identification et la construction des lieux du texte et de ceux de la carte<br /> s&rsquo;appuient sur des concepts et outils m&eacute;thodologiques : mod&eacute;lisation, ressources mobilis&eacute;es, &eacute;valuation des<br /> ressources, recours &agrave; l&rsquo;automatisation, construction d&rsquo;une r&eacute;f&eacute;rence, &eacute;valuation des processus automatiques,<br /> etc. Il s&rsquo;agit donc d&rsquo;abord d&rsquo;identifier les noms des lieux dans un texte puis de repr&eacute;senter, de mani&egrave;re<br /> pertinente par rapport au contexte, ces lieux sur la carte.<br /> La d&eacute;marche d&rsquo;interdisciplinarit&eacute; s&rsquo;appuie sur la d&eacute;finition des concepts qui permettent de d&eacute;crire<br /> les objets d&rsquo;&eacute;tude, en l&rsquo;occurrence les lieux et les noms de lieux dans le texte et sur la carte, qui seront<br /> pr&eacute;sent&eacute;s dans une premi&egrave;re partie. La deuxi&egrave;me partie s&rsquo;emploiera &agrave; d&eacute;crire les m&eacute;thodes, outils et<br /> ressources mis en place pour proc&eacute;der &agrave; l&rsquo;analyse des objets d&rsquo;&eacute;tude dans les domaines du TAL et de la<br /> g&eacute;omatique. Dans la troisi&egrave;me partie, les r&eacute;sultats obtenus par ces analyses dans chacun des domaines<br /> seront discut&eacute;s et prolong&eacute;s par le recours &agrave; l&rsquo;autre domaine.</p> <p><br /> <strong>1. D&eacute;finitions</strong><br /> La g&eacute;omatique, contraction de <em>g&eacute;ographie </em>et <em>informatique</em>, s&rsquo;int&eacute;resse &agrave; l&rsquo;acquisition, la production, la<br /> mise &agrave; jour, le stockage, la v&eacute;rification, l&rsquo;int&eacute;gration, la repr&eacute;sentation de l&rsquo;information permettant de<br /> localiser un objet ou un ph&eacute;nom&egrave;ne g&eacute;ographique.<br /> Le TAL s&rsquo;appuie sur la linguistique et l&rsquo;informatique pour analyser sous l&rsquo;angle lexical, morphosyntaxique,<br /> pragmatique, s&eacute;mantique, des textes et y associer du sens par rapport &agrave; des t&acirc;ches d&eacute;finies.<br /> Les notions utiles &agrave; chaque discipline seront d&eacute;finies.<br /> Construire un lieu constitue un processus ancr&eacute; socialement qui permet de distinguer, d&rsquo;une mani&egrave;re qui<br /> vise &agrave; &ecirc;tre partag&eacute;e et p&eacute;renne, une portion de territoire et de la rep&eacute;rer sur la terre [2]. Ainsi la d&eacute;finition<br /> de lieu vient de la g&eacute;ographie et de la sociologie ; ses propri&eacute;t&eacute;s (p&eacute;rennit&eacute;, d&eacute;signateur rigide) font que le<br /> lien est fort avec la notion linguistique de nom propre (NPr) [6], qui se prolonge en TAL par celle d&rsquo;entit&eacute;<br /> nomm&eacute;e spatiale [8].<br /> En g&eacute;omatique, le lieu, r&eacute;f&eacute;renc&eacute; dans une base de donn&eacute;es g&eacute;ographiques, est cartographi&eacute; ce qui impose<br /> de d&eacute;finir les traits essentiels de sa repr&eacute;sentation cartographique, qui contrairement &agrave; sa d&eacute;nomination ne<br /> figurent pas dans le texte.<br /> Les concepts utiles &agrave; la d&eacute;finition &agrave; la notion de lieu en TAL : NPr, nom commun, NPr modifi&eacute;, et &agrave; sa<br /> repr&eacute;sentation sur la carte : localisation, implantation, variables visuelles [1] seront d&eacute;finis.<br /> <br /> <strong>2. Identifier et construire les propri&eacute;t&eacute;s du lieu dans le texte et la carte</strong><br /> L&rsquo;identification dans le texte du lieu et sa repr&eacute;sentation sur la carte reposent sur des ressources, des<br /> outils et des m&eacute;thodes diff&eacute;rentes mais qui visent une utilisation coh&eacute;rente.<br /> En TAL, l&rsquo;identification des noms de lieux s&rsquo;appuie en g&eacute;n&eacute;ral sur des ressources terminologiques. Cependant<br /> identifier un nom de lieu dans un texte ne permet pas de le localiser : <em>Paris </em>peut d&eacute;signer plus de cinquante objets<br /> g&eacute;ographiques (de cat&eacute;gorie ville, montagne , lac, ...) ; la d&eacute;sambigu&iuml;sation utilise des indices textuels et<br /> g&eacute;ographiques, et recourt &agrave; des m&eacute;thodes symboliques, statistiques ou &agrave; l&rsquo;apprentissage automatique [7].<br /> Les t&acirc;ches de TAL visent &agrave; produire des informations &agrave; partir du texte (lexique, syntaxe, m&eacute;tadonn&eacute;es,<br /> etc.) et de ressources ext&eacute;rieures (dictionnaires, mod&egrave;les statistiques) ; ces informations sont ajout&eacute;es aux<br /> mots du texte sous forme d&rsquo;annotations. Celles-ci constituent le support de la communication de l&rsquo;analyse<br /> textuelle avec les outils de g&eacute;omatique, dans le but de construire la carte. Par exemple, l&rsquo;annotation<br /> ajout&eacute;e &agrave; <em>Paris </em>contiendra sa cat&eacute;gorie g&eacute;ographique et sa localisation, voire des informations utilisables<br /> pour sa repr&eacute;sentation cartographique d&eacute;duites du texte.</p> <p><br /> Les m&eacute;thodes d&rsquo;identification et de repr&eacute;sentation des lieux du texte et de la carte comportent des<br /> verrous.<br /> En particulier, ceux li&eacute;s aux variations spatiales et temporelles se manifestent pour les deux disciplines<br /> selon des modalit&eacute;s diff&eacute;rentes : le nom d&rsquo;un lieu admet des variations orthographiques (translitt&eacute;ration,<br /> transcription, endonymes, exonymes) tout en d&eacute;signant le m&ecirc;me lieu au m&ecirc;me moment ; en revanche, un<br /> pays peut changer de fronti&egrave;re sans changer de nom. La coh&eacute;rence des ressources permettant d&rsquo;annoter<br /> le texte et celles utilis&eacute;s pour construire la carte doit donc &ecirc;tre v&eacute;rifi&eacute;e, puisque la permanence de la<br /> d&eacute;nomination masque les variations g&eacute;o-historico-politiques des entit&eacute;s &agrave; repr&eacute;senter.</p> <p><br /> <strong>3. Discussion</strong><br /> Le TAL emprunte &agrave; l&rsquo;informatique les m&eacute;thodes d&rsquo;&eacute;valuation des outils ; puisque les annotations<br /> constituent la production centrale, ce sont elles qui sont &eacute;valu&eacute;es (rappel, pr&eacute;cision) par comparaison entre<br /> les annotations pos&eacute;es automatiquement et celles obtenues manuellement.<br /> Le r&eacute;sultat obtenu &ndash; la carte &ndash; doit &ecirc;tre analys&eacute; en tant qu&rsquo;illustration du texte et objet cartographique.<br /> Les annotations (d&eacute;nomination, localisation, etc.) qui permettent de cartographier les lieux de la carte sont<br /> d&eacute;pendantes des ressources terminologiques utilis&eacute;es (la langue de d&eacute;signation des lieux, les informations<br /> apport&eacute;es par ces ressources, etc.) dont le choix est guid&eacute; aussi par des conditions extralinguistiques.<br /> La construction de la carte commence par la d&eacute;finition de son emprise qui s&rsquo;appuie sur les noms de<br /> lieux identifi&eacute;s par les outils de TAL et &eacute;valu&eacute;s comme pertinents, selon les objectifs de la repr&eacute;sentation<br /> cartographique.<br /> Le support de la carte (papier, &eacute;cran) influe sur les caract&eacute;ristiques de la repr&eacute;sentation : repr&eacute;sentation<br /> fig&eacute;e ou &eacute;chelle variable (fonction zoom de l&rsquo;interface), et donc sur le fond de carte qui doit &ecirc;tre adapt&eacute; au<br /> temps du texte, aux informations extraites &agrave; repr&eacute;senter, aux conditions de lecture, etc.<br /> Enfin, la repr&eacute;sentation cartographique produite par la carte traditionnelle fond&eacute;e sur des projections,<br /> des noms de lieux et des limites administratives, ne correspond pas &agrave; la r&eacute;alit&eacute; des lieux per&ccedil;ue par des<br /> usagers qui la remettent en cause [5]. La repr&eacute;sentation cartographique du texte offre ainsi un support &agrave;<br /> la mise en question de ce qui caract&eacute;rise un lieu.</p> <p>Un lieu constitue donc un <em>&quot;objet fronti&egrave;re</em>&quot; [9] parce qu&rsquo;il est assez flexible pour s&rsquo;adapter aux besoins<br /> du TAL et de la g&eacute;omatique : ce qui fait lieu peut &ecirc;tre sa d&eacute;nomination, sa localisation, sa cat&eacute;gorie<br /> g&eacute;ographique, son usage, les perceptions associ&eacute;es, et assez robuste pour maintenir une identit&eacute; partag&eacute;e :<br /> un point, une zone de la r&eacute;alit&eacute; physique que l&rsquo;on peut d&eacute;signer par son nom, sa localisation &agrave; travers les<br /> disciplines. La notion de lieu est centrale &agrave; plusieurs disciplines (onomastique, linguistique, g&eacute;ographie) mais<br /> ce sont des caract&eacute;ristiques diff&eacute;rentes qui sont &eacute;tudi&eacute;es par ces disciplines : entre onomastique et linguistique,<br /> la d&eacute;nomination ; entre TAL et g&eacute;ographie, la localisation en tant que marque de d&eacute;sambigu&iuml;sation. Le<br /> consensus sur sa d&eacute;finition et ses propri&eacute;t&eacute;s caract&eacute;ristiques n&rsquo;est pas n&eacute;cessaire pour que TAL et g&eacute;omatique<br /> utilisent, de mani&egrave;re coh&eacute;rente et chaque discipline pour ses besoins propres, ce concept central.</p> <p><br /> [1] Bertin, J. (1973). S&eacute;miologie graphique : Les diagrammes-les r&eacute;seaux-les cartes. Technical report,<br /> Gauthier-VillarsMouton &amp; Cie.<br /> [2] Brunet, R., Ferras, R., and Th&eacute;ry, H. (1992). Les mots de la g&eacute;ographie. dictionnaire critique,<br /> reclus-documentation fran&ccedil;aise.<br /> [3] Caquard, S. and Fiset, J.-P. (2014). How can we map stories? a cybercartographic application for<br /> narrative cartography. Journal of Maps, 10(1):18&ndash;25.<br /> [4] Charaudeau, P. (2010). Pour une interdisciplinarit&eacute; &laquo;focalis&eacute;e&raquo; dans les sciences humaines et sociales.<br /> Questions de communication, (17):195&ndash;222.<br /> [5] Goodchild, M. and Li, L. (2011). Formalizing space and place. In CIST2011-Fonder les sciences du<br /> territoire, pages 177&ndash;183.<br /> [6] Leroy, S. (2004). Le nom propre en fran&ccedil;ais. Ophrys.<br /> [7] Melo, F. and Martins, B. (2017). Automated geocoding of textual documents: A survey of current<br /> approaches. Transactions in GIS, 21(1):3&ndash;38.<br /> [8] Nouvel, D., Ehrmann, M., and Rosset, S. (2015). Les entit&eacute;s nomm&eacute;es pour le traitement automatique<br /> des langues. ISTE Editions.<br /> [9] Star, S. L. and Griesemer, J. R. (1989). Institutional ecology,translations&rsquo; and boundary objects:<br /> Amateurs and professionals in berkeley&rsquo;s museum of vertebrate zoology, 1907-39. Social studies of<br /> science, 19(3):387&ndash;420.<br /> &nbsp;</p>