<p>Il y a trace numérique dans la mesure où toute action dans un environnement informatisé est aussi une interaction avec des machines. Toute action volontaire comme écrire un courrier électronique, naviguer sur le web ou préparer un diaporama se fait sur un support numérique et avec des outils numériques, elle est médiée par un système technique, un programme informatique. Elle passe par un codage qui en rend certains aspects manipulables. Autrement dit, les activités dont la forme est socialement partageable (poster un commentaire, partager une photographie, enregistrer un son, etc.) se doublent “toujours d’un code traductible en données calculables” (Jeanneret, 2011, p. 68) : la trace numérique. Ainsi, un nombre croissant d’activités laisse des traces – numériques – car “l’informatique exige que les objets et les actes passent par l’inscription pour exister”. Les traces numériques ne sont donc pas des signes (Peirce, 1978), ni des indices (Peirce, 1978), ni des textes, ni même des données. Elles sont des inscriptions, au sens d’une altération de matière qui n’est pas faite au hasard, qui doublent toujours les activités ayant lieu dans des environnements informatisés.</p>
<p>Ces traces numériques, inhérentes à l’interaction avec des machines computationnelles endossent les propriétés du numérique : manipulabilité, asignifiance, discrétisation et autothéticité (Bachimont, 2004). Ces caractéristiques leur font pleinement mériter le nom de “trace”, au sens philosophique du terme, en particulier au sens derridien du terme pour qui toute trace est toujours déjà déliaison, dissémination, dérive, marque abandonnée, pouvant être insérée dans des chaînes de significations qui ne sont pas celles de son « contexte » de production (Derrida, 1971 ; Ginzburg, 1989).</p>
<p>De nombreux chercheurs en sciences humaines et sociales (SHS) ont critiqué la mise en donnée de la trace numérique. Contrairement à la trace (“Un like n’a pas besoin de théorie” (Boullier, 2015), la donnée porte déjà en elle toute une série d’hypothèses et d’interprétations, elle n’est jamais neutre et embarque toujours des décisions en amont de sa collecte ou de sa production : quels sont les attributs ou les variables que l’on considère comme intéressants, lesquels peuvent être ignorés, etc. Latour (1993) affirme même que plutôt que de parler de “données”, on devrait parler d’ “obtenues”.</p>
<p>Parmi les critiques qui visent la mise en données en SHS des traces numériques, on trouve le reproche d’un biais quantitativiste, scientiste et néo-positiviste (Rebillard, 2011), où le calcul automatisé couplé à l’héritage en SHS de théorisations qui viennent des sciences du vivant et des sciences exactes (la “nouvelle science des réseaux”) se retrouvent au coeur de recherches qui finissent par dénier la composante humaine et sociale des phénomènes. D’autres critiques visent la qualité des données issues des traces numériques : les indicateurs sont superficiels (Rebillard, 2011), ces données sont limitées et biaisées même si elles sont présentées comme très nombreuses (“bigger isn’t better” boyd & Crawford, 2012), elles sont souvent réduites à ce qui peut rentrer dans un modèle mathématique (boyd & Crawford, 2012), elles ne débouchent que sur des analyses qui aplatissent les phénomènes (Rieder, 2007), elles proviennent de plateformes qui les ont générées pour des buts marketing et qui se retrouvent détournées à des fins scientifiques (c’est le repurposing de Rogers, 2010) menant soit à “un déficit plus général de problématisation en amont de la recherche” (Rebillard, 2011), soit à la pré-construction par les plateformes numériques des questions de recherche (boyd & Crawford, 2012).</p>
<p>Conscients des problèmes méthodologiques et épistémologiques que posent la mise en données des traces numériques, les chercheurs en SHS ne sont toutefois pas dans une posture réactionnaire. Ils essaient au contraire de faire preuve d’ouverture, moyennant le déploiement de précautions méthodologiques conséquentes, et formulent des propositions. Certains estiment que les données issues des traces numériques ne sont pas incompatibles avec des approches qualitatives : Paul Gerbaudo (2016) applique par exemple une herméneutique de la donnée, Josiane Jouët et Coralie Le Caroff (2013) déploient une forme d’ethnographie en ligne. D’autres chercheurs, selon des degrés variables militent en faveur d’une articulation entre approches quantitatives et qualitatives en SHS (Rebillard, 2011 ; Venturini, 2012). Certains chercheurs, enfin, estiment que le travail à partir de traces numériques constituées en données permettent la constitution de nouveaux objets de recherche. Boullier (2015) estime ainsi que les traces numériques, qui ne sont pas des données structurées socio-démographiquement significatives, peuvent donner lieu à une nouvelle sociologie, une sociologie des vibrations : “c’est une autre strate du social qui affleure grâce à ces dispositifs de traçabilité à haute fréquence.” (Boullier, 2015) Boyd et Crawford (2012) estiment quant à elles, après Latour, qu’en changeant les instruments, c’est toute la théorie du social qui change également. La disponibilité des big data (je préfère parler de disponibilités des traces numériques, exploitées comme données en SHS), débouchent selon elles sur l’analyse de deux types de réseaux sociaux particuliers : les réseaux articulés et les réseaux comportementaux - qui ne doivent pas être confondus avec les réseaux personnels, par ailleurs bien connus de la sociologie.</p>
<p>Consciente de ces critiques, je soutiens qu’il faut faire preuve d’une certaine prudence lorsqu’on se livre à une opération de mise en données des traces numériques dans la recherche en SHS. Dans l’article que je vous propose, j’entends montrer qu’avant la mise en donnée de la trace, un travail avec la trace est non seulement possible, mais aussi souhaitable. La trace numérique n’est pas la donnée en SHS, elle est une inscription inhérente à l’interaction avec une machine computationnelle. Avant de chercher à faire de la trace, une donnée pour nous, chercheurs en SHS, je soutiens qu’il est précieux de s’installer dans le trouble (Haraway, 2016) dans lequel nous plonge cet objet étrange qu’est la trace numérique, un objet où s’hybrident humains et machines. Les SHS doivent désormais composer avec cet objet technique qu’est l’ordinateur, qui a sa propre logique et sa propre logistique, ses propres styles de raisonnement, ses modes de valorisation (Rieder, 2007). La trace numérique appartient peut-être plus au monde des ordinateurs qu’à celui des chercheurs en SHS, mais avec un travail de décentrement, avec un peu de patience qui nous permette de séjourner auprès des traces numériques sans en faire tout de suite des données, nous pouvons produire une recherche en SHS qui fasse de la place à ce nouvel acteur non-humain qu’est l’ordinateur et qui est entré dans nos mondes.</p>
<p>Je propose d’illustrer concrètement cette posture en décrivant un projet de recherche technologique financé par la DGA et sur lequel je travaille avec deux entreprises : l’une spécialisée en fouille de données du clear, deep et darkweb ; l’autre, en design d’interface. Il s’agit donc d’un projet de recherche mêlant informatique et SHS, où l’on développe des méthodes de collecte de traces numériques qui sont représentées sous forme de graphes statistiques, avant d’être basculés dans des interfaces de graphes sémantiques. Le chercheur doit apprendre à s’installer un certain temps dans un travail avec des traces numériques représentées sous forme de graphe statistique. Il se livre à une forme de data jujitsu (DJ Patil, 2012), où il explore les traces dans un graphe, où il les travaille en tant que traces et non pas en tant que données, dans une forme d’artisanat haute technologie (Ghitalla, 2014), de tissage (Ingold, 2013), dans une forme de culture technique de la trace plus que dans un expertise scientifique de la donnée. Ce n’est que dans un second temps, après être allé à la rencontre des traces en tant que traces, que le chercheur - chargé d’hypothèses nouvelles - peut faire un travail de construction de connaissance, avec des traces devenues données, dans un graphe sémantique. Cette étape de trouble auprès de la trace est importante, tel est mon argument, si l’on veut produire une recherche en SHS de qualité, une recherche en SHS qui n’oublie pas trop vite l’un de ses acteur principal : la machine computationelle.</p>
<p>L’article que je souhaite soumettre entend, dans un premier temps, proposer une définition de la trace numérique à partir des travaux du philosophe Jacques Derrida et des propriétés techniques du numérique. Dans un deuxième temps, je procéderai à un état de l’art portant sur la critique de l’exploitation des traces numériques en tant que données en SHS. Enfin, dans un troisième temps, je défendrai l’idée qu’il est intéressant, pour les chercheurs en SHS, de ne pas tout de suite chercher à mettre en données les traces numériques, mais de se laisser troubler par ces traces. J’illustrerai très concrètement cet argument en décrivant un environnement logiciel de collecte et de représentation de traces numériques sous forme de graphes, développé dans le cadre d’un projet de recherche technologique dans lequel je suis actuellement embarquée.</p>
<p>Bibliographie des auteurs cités dans le résumé :</p>
<p>Bachimont B. (2012). Pour une critique phénoménologique de la raison computationnelle. In D. Frau-Meigs, É. Bruillard & É. Delamotte (dir.), E-dossier de l’audiovisuel : L’éducation aux cultures de l’information. En ligne sur : http:// www.ina-expert.com/e-dossier-de-l-audiovisuel-l-education-aux-cultures-de-l-information/pour-une-critique-phenomenologique-de-la-raison- computationnelle.html</p>
<p>Bachimont B. (2004). Arts et Sciences du numérique : ingénierie des connaissances et critique de la raison computationnelle (Mémoire d’Habilitation à diriger les Recherches). UTC, Compiègne. En ligne sur : http://www.utc.fr/ ~bachimon/Livresettheses_attachments/HabilitationBB.pdf</p>
<p>Bachimont B. (1999). De l’hypertexte à l’hypotexte : les parcours de la mémoire documentaire. In C. Lenay & V. Havelange (dir.), Mémoire de la technique et techniques de la mémoire. Toulouse, Érès, p. 195-225.</p>
<p>Barats C. (dir.) (2013). Manuel d'analyse du web en sciences humaines et sociales. Paris : Armand Colin.</p>
<p>Boullier, D. (2015). Les sciences sociales face aux traces du big data : Société, opinion ou vibrations ?. Revue française de science politique, 5(5-6), 805-828.</p>
<p>Boyd d. and Crawford K. (2012). Critical Questions for Big Data: Provocations for a Cultural, Technological, and Scholarly Phenomenon. Information, Communication, & Society, 15:5. p. 662-679.</p>
<p>Derrida J. (1971). Signature, événement, contexte. Communication au Congrès international des Sociétés de philosophie de langue française, Montréal.</p>
<p>Gerbaudo P. (2016). From Data Analytics to Data Hermeneutics. Online Political Discussions, Digital Methods and the Continuing Relevance of Interpretive Approaches. Digital Culture and Society, Vol. 2, Issue 2.</p>
<p>Ghitalla F. (2014). Data Intelligence, un projet d’atelier. L’atelier cartographie [blog]. En ligne sur : https://ateliercartographie.wordpress.com/2014/12/07/data-intelligence-un-projet-datelier/</p>
<p>Ginzburg C. (1989). Mythes, emblèmes, traces. Paris : Flammarion.</p>
<p>Haraway D. (2016).Staying with the Trouble. Making Kin in the Chthulucene. Duke : Duke University Press.</p>
<p>Ingold T. (2013). Marcher avec les dragons. Paris : Zones Sensibles.</p>
<p>Jeanneret Y. (2011). Complexité de la notion de trace. De la traque au tracé. In B. Galinon-Mélénec (dir.) L’homme trace. Paris, CNRS Editions.</p>
<p>Latour, B. (1993). Le topofil de Boa Vista ou la référence scientifique–montage photo- philosophique. Raison Pratique, 4, p. 187–216.</p>
<p>Patil DJ (2012). Data Jujitsu :The Art of Turning Data into Product. Strata Conference, 01/03/2012. En ligne sur : http://strataconf.com/strata2012/public/ schedule/detail/23092</p>
<p>Peirce C. (1978). Ecrits sur le signe. Paris : Editions du Seuil.</p>
<p>Rebillard F. (2011). L’étude des médias est-elle soluble dans l’informatique et la physique ? À propos du recours aux digital methods dans l’analyse de l’information en ligne. Questions de communication, 20.<br />
Rieder B. (2007). Étudier les réseaux comme phénomènes hétérogènes : quelle place pour la “nouvelle science des réseaux” en sciences humaines et sociales ? Journées d’étude Dynamiques de réseaux – Information, complexité et non-linéarité, université de Bordeaux. Accès : http://archivesic.ccsd.cnrs.fr/sic_00379526/.</p>
<p>Rogers R. 2010. Internet Research : The Question of Method. Journal of Information Technology and Politics, 7 (2/3), pp. 241-260.</p>
<p>Venturini T. (2012). Great expectations. In Fourmentraux, Jean-Paul. L’ère post-média. Humanités digitales et cultures numériques. Paris : Hermann, pp.39-51.</p>
<p> </p>