<p>Résumé</p>
<p>Notre proposition vise à présenter un retour d’expérience sur les notions de lieu et nom de lieu en<br />
s’appuyant sur les trois niveaux d’analyse de l’<em> "interdisciplinarité focalisée</em>" proposée par [4]. Celle-ci, sur<br />
un même objet d’analyse – ici le lieu – vise à articuler entre eux les concepts, les outils d’analyse et les<br />
résultats interprétés par différentes disciplines pour produire de la connaissance.<br />
Les lieux constituent une information structurante [3] pour de nombreux textes : récits de vie, romans,<br />
articles journalistiques, itinéraires de randonnées, etc. Ils sont des éléments informationnels pertinents<br />
dont on parle et qui jouent un rôle dans la description d’un événement, d’un fait [8]. Mais le lieu du<br />
texte (et plus précisément le signe du lieu dans le texte, i.e. sa dénomination) fait référence à un lieu du<br />
monde physique. Les lieux et les objets localisés, pertinents dans le contexte de chacun de ces textes, en<br />
constituent un mode d’exploration prépondérant.<br />
La problématique de ce travail est fondée sur l’articulation entre traitement automatique des langues<br />
(désormais TAL) et géomatique pour préciser ce qui fait lieu afin de construire la représentation cartographique<br />
d’un texte. L’identification et la construction des lieux du texte et de ceux de la carte<br />
s’appuient sur des concepts et outils méthodologiques : modélisation, ressources mobilisées, évaluation des<br />
ressources, recours à l’automatisation, construction d’une référence, évaluation des processus automatiques,<br />
etc. Il s’agit donc d’abord d’identifier les noms des lieux dans un texte puis de représenter, de manière<br />
pertinente par rapport au contexte, ces lieux sur la carte.<br />
La démarche d’interdisciplinarité s’appuie sur la définition des concepts qui permettent de décrire<br />
les objets d’étude, en l’occurrence les lieux et les noms de lieux dans le texte et sur la carte, qui seront<br />
présentés dans une première partie. La deuxième partie s’emploiera à décrire les méthodes, outils et<br />
ressources mis en place pour procéder à l’analyse des objets d’étude dans les domaines du TAL et de la<br />
géomatique. Dans la troisième partie, les résultats obtenus par ces analyses dans chacun des domaines<br />
seront discutés et prolongés par le recours à l’autre domaine.</p>
<p><br />
<strong>1. Définitions</strong><br />
La géomatique, contraction de <em>géographie </em>et <em>informatique</em>, s’intéresse à l’acquisition, la production, la<br />
mise à jour, le stockage, la vérification, l’intégration, la représentation de l’information permettant de<br />
localiser un objet ou un phénomène géographique.<br />
Le TAL s’appuie sur la linguistique et l’informatique pour analyser sous l’angle lexical, morphosyntaxique,<br />
pragmatique, sémantique, des textes et y associer du sens par rapport à des tâches définies.<br />
Les notions utiles à chaque discipline seront définies.<br />
Construire un lieu constitue un processus ancré socialement qui permet de distinguer, d’une manière qui<br />
vise à être partagée et pérenne, une portion de territoire et de la repérer sur la terre [2]. Ainsi la définition<br />
de lieu vient de la géographie et de la sociologie ; ses propriétés (pérennité, désignateur rigide) font que le<br />
lien est fort avec la notion linguistique de nom propre (NPr) [6], qui se prolonge en TAL par celle d’entité<br />
nommée spatiale [8].<br />
En géomatique, le lieu, référencé dans une base de données géographiques, est cartographié ce qui impose<br />
de définir les traits essentiels de sa représentation cartographique, qui contrairement à sa dénomination ne<br />
figurent pas dans le texte.<br />
Les concepts utiles à la définition à la notion de lieu en TAL : NPr, nom commun, NPr modifié, et à sa<br />
représentation sur la carte : localisation, implantation, variables visuelles [1] seront définis.<br />
<br />
<strong>2. Identifier et construire les propriétés du lieu dans le texte et la carte</strong><br />
L’identification dans le texte du lieu et sa représentation sur la carte reposent sur des ressources, des<br />
outils et des méthodes différentes mais qui visent une utilisation cohérente.<br />
En TAL, l’identification des noms de lieux s’appuie en général sur des ressources terminologiques. Cependant<br />
identifier un nom de lieu dans un texte ne permet pas de le localiser : <em>Paris </em>peut désigner plus de cinquante objets<br />
géographiques (de catégorie ville, montagne , lac, ...) ; la désambiguïsation utilise des indices textuels et<br />
géographiques, et recourt à des méthodes symboliques, statistiques ou à l’apprentissage automatique [7].<br />
Les tâches de TAL visent à produire des informations à partir du texte (lexique, syntaxe, métadonnées,<br />
etc.) et de ressources extérieures (dictionnaires, modèles statistiques) ; ces informations sont ajoutées aux<br />
mots du texte sous forme d’annotations. Celles-ci constituent le support de la communication de l’analyse<br />
textuelle avec les outils de géomatique, dans le but de construire la carte. Par exemple, l’annotation<br />
ajoutée à <em>Paris </em>contiendra sa catégorie géographique et sa localisation, voire des informations utilisables<br />
pour sa représentation cartographique déduites du texte.</p>
<p><br />
Les méthodes d’identification et de représentation des lieux du texte et de la carte comportent des<br />
verrous.<br />
En particulier, ceux liés aux variations spatiales et temporelles se manifestent pour les deux disciplines<br />
selon des modalités différentes : le nom d’un lieu admet des variations orthographiques (translittération,<br />
transcription, endonymes, exonymes) tout en désignant le même lieu au même moment ; en revanche, un<br />
pays peut changer de frontière sans changer de nom. La cohérence des ressources permettant d’annoter<br />
le texte et celles utilisés pour construire la carte doit donc être vérifiée, puisque la permanence de la<br />
dénomination masque les variations géo-historico-politiques des entités à représenter.</p>
<p><br />
<strong>3. Discussion</strong><br />
Le TAL emprunte à l’informatique les méthodes d’évaluation des outils ; puisque les annotations<br />
constituent la production centrale, ce sont elles qui sont évaluées (rappel, précision) par comparaison entre<br />
les annotations posées automatiquement et celles obtenues manuellement.<br />
Le résultat obtenu – la carte – doit être analysé en tant qu’illustration du texte et objet cartographique.<br />
Les annotations (dénomination, localisation, etc.) qui permettent de cartographier les lieux de la carte sont<br />
dépendantes des ressources terminologiques utilisées (la langue de désignation des lieux, les informations<br />
apportées par ces ressources, etc.) dont le choix est guidé aussi par des conditions extralinguistiques.<br />
La construction de la carte commence par la définition de son emprise qui s’appuie sur les noms de<br />
lieux identifiés par les outils de TAL et évalués comme pertinents, selon les objectifs de la représentation<br />
cartographique.<br />
Le support de la carte (papier, écran) influe sur les caractéristiques de la représentation : représentation<br />
figée ou échelle variable (fonction zoom de l’interface), et donc sur le fond de carte qui doit être adapté au<br />
temps du texte, aux informations extraites à représenter, aux conditions de lecture, etc.<br />
Enfin, la représentation cartographique produite par la carte traditionnelle fondée sur des projections,<br />
des noms de lieux et des limites administratives, ne correspond pas à la réalité des lieux perçue par des<br />
usagers qui la remettent en cause [5]. La représentation cartographique du texte offre ainsi un support à<br />
la mise en question de ce qui caractérise un lieu.</p>
<p>Un lieu constitue donc un <em>"objet frontière</em>" [9] parce qu’il est assez flexible pour s’adapter aux besoins<br />
du TAL et de la géomatique : ce qui fait lieu peut être sa dénomination, sa localisation, sa catégorie<br />
géographique, son usage, les perceptions associées, et assez robuste pour maintenir une identité partagée :<br />
un point, une zone de la réalité physique que l’on peut désigner par son nom, sa localisation à travers les<br />
disciplines. La notion de lieu est centrale à plusieurs disciplines (onomastique, linguistique, géographie) mais<br />
ce sont des caractéristiques différentes qui sont étudiées par ces disciplines : entre onomastique et linguistique,<br />
la dénomination ; entre TAL et géographie, la localisation en tant que marque de désambiguïsation. Le<br />
consensus sur sa définition et ses propriétés caractéristiques n’est pas nécessaire pour que TAL et géomatique<br />
utilisent, de manière cohérente et chaque discipline pour ses besoins propres, ce concept central.</p>
<p><br />
[1] Bertin, J. (1973). Sémiologie graphique : Les diagrammes-les réseaux-les cartes. Technical report,<br />
Gauthier-VillarsMouton & Cie.<br />
[2] Brunet, R., Ferras, R., and Théry, H. (1992). Les mots de la géographie. dictionnaire critique,<br />
reclus-documentation française.<br />
[3] Caquard, S. and Fiset, J.-P. (2014). How can we map stories? a cybercartographic application for<br />
narrative cartography. Journal of Maps, 10(1):18–25.<br />
[4] Charaudeau, P. (2010). Pour une interdisciplinarité «focalisée» dans les sciences humaines et sociales.<br />
Questions de communication, (17):195–222.<br />
[5] Goodchild, M. and Li, L. (2011). Formalizing space and place. In CIST2011-Fonder les sciences du<br />
territoire, pages 177–183.<br />
[6] Leroy, S. (2004). Le nom propre en français. Ophrys.<br />
[7] Melo, F. and Martins, B. (2017). Automated geocoding of textual documents: A survey of current<br />
approaches. Transactions in GIS, 21(1):3–38.<br />
[8] Nouvel, D., Ehrmann, M., and Rosset, S. (2015). Les entités nommées pour le traitement automatique<br />
des langues. ISTE Editions.<br />
[9] Star, S. L. and Griesemer, J. R. (1989). Institutional ecology,translations’ and boundary objects:<br />
Amateurs and professionals in berkeley’s museum of vertebrate zoology, 1907-39. Social studies of<br />
science, 19(3):387–420.<br />
</p>