<h1>Archiver le web durant la covid-19 et le premier confinement : organisation, bilan et perspectives</h1> <p>&nbsp;</p> <blockquote> <p>Fran&ccedil;aises, fran&ccedil;ais, mes chers compatriotes, depuis quelques semaines notre pays connait sa plus grave crise sanitaire, le covid19. Je m&#39;appelle C&eacute;dric et je suis coach&nbsp; sportif, passionn&eacute;, et vous propose tous les jours sur cette page des entrainements de 30 minutes que vous allez pouvoir faire &agrave; la maison.[1]</p> </blockquote> <p>Cette allocution parodique de lancement d&rsquo;une cha&icirc;ne de coaching sportif fait partie des contenus publi&eacute;s sur le web lors du confinement de mars 2020 et archiv&eacute;s par la BnF dans le cadre de sa collecte Covid-19. Elle nous rappelle la diversit&eacute; des initiatives et contenus qui furent publi&eacute;s sur le web au moment o&ugrave; les interactions humaines r&eacute;elles &eacute;taient strictement limit&eacute;es.</p> <p>De nombreuses institutions patrimoniales ont ressenti une urgence et se sont fait un devoir de collecter et conserver les traces de ce premier confinement. Elles ont pris l&rsquo;initiative de lancer des appels aux dons pour recueillir le t&eacute;moignage &eacute;crit des Fran&ccedil;ais comme le firent les archives d&eacute;partementales des Vosges[2] ou bien des objets marqueurs de cette p&eacute;riode (cartes de p&eacute;rim&egrave;tre de sortie, calendriers de confinement&hellip;etc) comme le proposa le Mucem[3]. Le Museum of London[4] ou en France le chercheur Herv&eacute; Mazurel[5] se mirent m&ecirc;me &agrave; collecter les r&ecirc;ves.</p> <p>Cet article propose de revenir sur la collecte Covid-19 men&eacute;e par la Biblioth&egrave;que nationale de France dans le cadre du d&eacute;p&ocirc;t l&eacute;gal de l&rsquo;internet. Celle-ci s&rsquo;est d&eacute;roul&eacute;e dans un moment o&ugrave; le basculement de la vie sociale vers le num&eacute;rique s&rsquo;est fortement accentu&eacute; du fait du confinement,&nbsp; le web pouvant appara&icirc;tre plus encore qu&rsquo;en temps normal comme un objet marqueur d&rsquo;une &eacute;poque. Cette pr&eacute;sentation rappelle bri&egrave;vement l&rsquo;ampleur de ce ph&eacute;nom&egrave;ne, avant de revenir sur l&rsquo;implication des &eacute;quipes de la BnF et de son r&eacute;seau de partenaires dans le processus de collecte, sur les actions de valorisation mises en &oelig;uvre &agrave; destination du grand public et des chercheurs de conclure par une interrogation sur les apports et cons&eacute;quences de cette collecte dans les pratiques professionnelles des archivistes de l&rsquo;internet.</p> <p><img height="239" src="https://www.numerev.com/img/ck_993_1_image.png" width="605" /></p> <h2>&nbsp;Un temps de pand&eacute;mie ultraconnect&eacute;</h2> <p>La crise sanitaire de la Covid-19 fut marqu&eacute;e dans de nombreux pays par la r&eacute;currence de p&eacute;riodes de confinement visant &agrave; limiter les contacts directs entre personnes. En France, un confinement national fut annonc&eacute; par le pr&eacute;sident Emmanuel Macron dans son intervention t&eacute;l&eacute;vis&eacute;e du 16 mars 2020. Le report d&rsquo;une grande partie des activit&eacute;s quotidiennes vers le monde num&eacute;rique fut imm&eacute;diat, en particulier pour les interactions sociales&nbsp;et les relations de travail : 40% des internautes fran&ccedil;ais d&eacute;clarent avoir cr&eacute;&eacute; un compte sur un r&eacute;seau social ou une application de messagerie instantan&eacute;e pendant le confinement[6]. Le nombre de t&eacute;l&eacute;travailleurs a atteint 41 % des salari&eacute;s[7].</p> <p>La Covid-19 a imm&eacute;diatement satur&eacute; l&rsquo;espace m&eacute;diatique traditionnel, comptant pour plus de 80% du temps d&rsquo;antenne des journaux t&eacute;l&eacute;vis&eacute;es[8] et &eacute;tant mentionn&eacute;e dans 60% des articles publi&eacute;s de la presse r&eacute;gionale durant le mois d&rsquo;avril 2020[9]. Le ph&eacute;nom&egrave;ne s&rsquo;est &eacute;tendu &agrave; l&rsquo;ensemble du web et aux r&eacute;seaux sociaux avec un record de&nbsp; 1,4 million de tweets compt&eacute;s par l&rsquo;INA pour la journ&eacute;e du 17 mars et une augmentation de 15% du temps pass&eacute; chaque jour sur internet en 2020[10].</p> <p>Face &agrave; cette situation in&eacute;dite, les Fran&ccedil;ais ont investi le web et les r&eacute;seaux sociaux pour s&rsquo;entraider, pour se cultiver, pour s&rsquo;&eacute;duquer mais aussi pour s&rsquo;exprimer ou exprimer leur solidarit&eacute; avec les soignants dans le prolongement des applaudissements qui avaient lieu chaque jour &agrave; 20h. De nombreux exemples attestent d&rsquo;un v&eacute;ritable confinement cr&eacute;atif[11] et une multitude d&rsquo;initiatives furent prises dans un esprit Do-it-Yourself : mise en ligne de tutoriels pour cr&eacute;er son masque, vid&eacute;os de coaching sportif, circulation de memes et r&eacute;alisation de d&eacute;fis cr&eacute;atifs sur les r&eacute;seaux sociaux comme avec le hashtag #artenquarantaine. Le web se fit &eacute;galement le relais des d&eacute;bats politiques sur la p&eacute;nurie de masques et de gel hydroalcoolique, ainsi que des controverses sur l&rsquo;usage de l&rsquo;hydroxychloroquine pr&ocirc;n&eacute; par le professeur Didier Raoult. Pour s&rsquo;adapter &agrave; la situation, de nombreux organismes, associations ou encore salles de spectacle ont utilis&eacute; le web et les r&eacute;seaux sociaux pour garder un contact avec leurs adh&eacute;rents, leur public ou plus largement les internautes.&nbsp; Les h&ocirc;pitaux, mairies, agences de sant&eacute;, instituts de recherche ont cr&eacute;&eacute; des pages d&rsquo;information d&eacute;di&eacute;es et parfois de v&eacute;ritables plateformes documentaires comme celle mise en place par l&rsquo;Assistance publique des h&ocirc;pitaux de Paris (AP-HP) et ont mis directement en ligne les fiches m&eacute;dico-sanitaires de leurs propres &eacute;quipes.</p> <p><img height="480" src="https://www.numerev.com/img/ck_993_1_image1.png" width="605" /></p> <h2>Lancement d&#39;une collecte internationale</h2> <p>Les archivistes de l&rsquo;internet se devaient de saisir l&rsquo;ensemble de ce d&eacute;ferlement &laquo; Covid-19 &raquo;. Consid&eacute;rant imm&eacute;diatement l&rsquo;ampleur mondiale du ph&eacute;nom&egrave;ne, l&rsquo;IIPC sous l&rsquo;impulsion du Content Development Group (CDG) et en partenariat avec Archive-It d&eacute;cida de lancer une collecte internationale. Les membres du consortium eurent la possibilit&eacute; d&rsquo;alimenter un tableau excel en s&eacute;lections documentaires d&egrave;s le 16 f&eacute;vrier 2020. Les consignes initiales donn&eacute;es par le CDG, avant m&ecirc;me les premiers confinements en Europe, structur&egrave;rent fortement les premi&egrave;res s&eacute;lections en proposant un ensemble de cat&eacute;gories pour qualifier les s&eacute;lections. Outre les aspects m&eacute;dicaux et scientifiques, la collecte se proposait de couvrir l&rsquo;ensemble des aspects que pouvait prendre la crise sanitaire (aspects sociaux, aspects &eacute;conomiques, aspects politiques) et accordait une place importante aux mesures d&rsquo;endiguement prises localement (sous une &eacute;tiquette &laquo;&nbsp;Regional or local containment efforts&nbsp;&raquo;).</p> <p>La BnF r&eacute;pondit &agrave; l&rsquo;initiative du consortium en apportant trois jeux&nbsp; de donn&eacute;es durant l&rsquo;ann&eacute;e 2020, repr&eacute;sentant un total 591 s&eacute;lections dont les archives sont d&eacute;sormais consultables en ligne sur le site d&rsquo;archive-it. Mais cet ensemble ne repr&eacute;sente qu&rsquo;une petite partie, une s&eacute;lection dans la s&eacute;lection, de ce qui allait devenir la collecte Covid-19.</p> <p>En effet, apr&egrave;s l&rsquo;annonce du confinement de mars 2020 et face &agrave; l&rsquo;ampleur des cons&eacute;quences de la crise sanitaire, il est apparu &eacute;vident que la collecte en cours devait et allait prendre une ampleur nouvelle. La pr&eacute;sidence de la BnF a de fait rapidement souhait&eacute; mettre en place une collecte collaborative d&rsquo;envergure en mobilisant le r&eacute;seau des partenaires. Les objectifs documentaires rest&egrave;rent proches de ceux de la collecte IIPC, tout en &eacute;tant &eacute;largis aux r&eacute;seaux sociaux (principalement Twitter) et aux chaines vid&eacute;os (Youtube), et ils furent repris &agrave; travers un &laquo;&nbsp;Memento pour la collecte en rapport avec la crise sanitaire du coronavirus (Covid-19)&nbsp;&raquo;.</p> <p>La coop&eacute;ration nationale alimenta en retour les contributions de la BnF au projet d&rsquo;archivage international Novel Coronavirus (2019-nCoV) outbreak[12] par des s&eacute;lections de contenus de m&eacute;dias et sites locaux aussi bien pour les r&eacute;gions m&eacute;tropolitaines que pour les Outre-mer.</p> <h2>Premi&egrave;res s&eacute;lections</h2> <p>Les premi&egrave;res s&eacute;lections men&eacute;es par les archivistes[13] de la BnF ont &eacute;t&eacute; faites fin janvier 2020, alors que la m&eacute;gapole de Wuhan &eacute;tait mise en quarantaine par les autorit&eacute;s chinoises. Les hashtags #JeNeSuisPasUnVirus et #CORONAVIRUSENFRANCE firent leur apparition sur Twitter pour d&eacute;noncer la stigmatisation v&eacute;cue par les membres de la communaut&eacute; asiatique en France. Le Mouvement contre le racisme et pour l&rsquo;amiti&eacute; entre les peuples (MRAP) publia rapidement une page &laquo; un virus n&rsquo;a pas d&rsquo;origine ethnique &raquo; sur son site web. Ces publications font partie des premiers contenus archiv&eacute;s.</p> <p>Tout au long de la crise sanitaire, la r&eacute;activit&eacute; a &eacute;t&eacute; un &eacute;l&eacute;ment essentiel de la r&eacute;ussite de cette collecte. Contrairement aux autres collectes projets pr&eacute;par&eacute;s tr&egrave;s en amont, il &eacute;tait impossible pour les archivistes de pr&eacute;voir une date de d&eacute;but et de fin de collecte, ni de conna&icirc;tre &agrave; l&rsquo;avance les r&eacute;actions et les mesures sanitaires &agrave; chacune des phases de l&rsquo;&eacute;pid&eacute;mie[14]. Cette r&eacute;activit&eacute; est apparue d&rsquo;autant plus n&eacute;cessaire que certaines pages web ont pu disparaitre rapidement ou connaitre des mises &agrave; jour r&eacute;guli&egrave;res.</p> <p>Pour &eacute;tablir leurs s&eacute;lections, les archivistes utilisent de s&eacute;lection BCweb d&eacute;velopp&eacute;e par la BnF, qui pr&eacute;sente l&rsquo;avantage full web et donc accessible aussi bien sur son lieu de travail que depuis son domicile en t&eacute;l&eacute;travail. Cet outil permet aux archivistes de g&eacute;rer diff&eacute;rentes collectes, d&rsquo;y saisir des s&eacute;lections sous la forme de fiches documentaires et de d&eacute;finir le meilleur param&egrave;tre de collecte en fonction de l&rsquo;objectif de collecte. Il peut par exemple s&rsquo;agir de crawler l&rsquo;ensemble d&rsquo;un site en utilisant une profondeur dite &laquo;&nbsp;domaine&nbsp;&raquo; &agrave; une fr&eacute;quence faible d&rsquo;&nbsp;&laquo;&nbsp;une fois par an&nbsp;&raquo; ou bien de capturer plusieurs fois par jours les derni&egrave;res publications li&eacute;es &agrave; un hashtag Twitter.</p> <p>Le dispositif technique et organisationnel retenu au sein de l&rsquo;outil de s&eacute;lection BCweb fut celui de la collecte de &laquo;&nbsp;l&rsquo;Actualit&eacute; &eacute;ph&eacute;m&egrave;re&nbsp;&raquo; mise en place apr&egrave;s les attentats de 2015 pour permettre une meilleure r&eacute;activit&eacute; des &eacute;quipes. Son objectif est de faciliter les s&eacute;lections documentaires d&eacute;termin&eacute;es par les enjeux contemporains et l&rsquo;actualit&eacute; imm&eacute;diate. Il faut noter d&egrave;s &agrave; pr&eacute;sent que cette collecte diff&egrave;re totalement des crawls des collectes &laquo; Actualit&eacute; &raquo; et &laquo; Presse payante &raquo;, qui regroupent plus d&rsquo;une centaine de sites de presse nationale et r&eacute;gionale dont la une, les articles li&eacute;s et les comptes Twitter sont collect&eacute;s une fois par jour. Elle a justement pour but de permettre la s&eacute;lection de contenus en lien avec l&rsquo;Actualit&eacute; pour les sites qui ne rel&egrave;vent du p&eacute;rim&egrave;tre de la presse traditionnelle. Il peut s&rsquo;agir de collecter les tweets li&eacute;s &agrave; un hashtag populaire, des communiqu&eacute;s de presse d&rsquo;association, des n&eacute;crologies, des articles de presse professionnelle ou sp&eacute;cialis&eacute;, des blogs personnels d&rsquo;opinion&hellip;etc. Elle s&rsquo;appuie sur la coordination d&rsquo;un r&eacute;seau de correspondants, interne &agrave; la BnF, r&eacute;f&eacute;rents pour leur discipline.</p> <h2>Une entreprise collective</h2> <p>&Agrave; la suite de l&rsquo;annonce du confinement, ces correspondants au r&eacute;seau interne BnF se sont fortement investis. Ils pouvaient s&rsquo;appuyer sur leur base de travail, c&rsquo;est-&agrave;-dire la liste des sites web relevant d&rsquo;une discipline et d&eacute;j&agrave; collect&eacute;s par ailleurs dans le cadre des collectes th&eacute;matiques courantes[15], le plus souvent sur un rythme annuel[16], et y rechercher des contenus publi&eacute;s en lien avec la crise sanitaire pour les s&eacute;lectionner. Cette approche m&eacute;thodique fut&nbsp; notamment utilis&eacute;e par la correspondante du D&eacute;partement Sciences et techniques.</p> <p>Dans le m&ecirc;me temps, la collecte fut ouverte au r&eacute;seau externe de correspondants r&eacute;gionaux, qui &eacute;tait d&eacute;j&agrave; mobilis&eacute; par la collecte des &laquo;&nbsp;&Eacute;lections municipales&nbsp;&raquo; de 2020.&nbsp; Ce r&eacute;seau de partenaires territoriaux est une pi&egrave;ce essentielle du dispositif de coop&eacute;ration nationale. Il est constitu&eacute; de 26 biblioth&egrave;ques territoriales[17] et services d&rsquo;archives qui partagent la mission de d&eacute;p&ocirc;t l&eacute;gal de l&rsquo;internet et qui participent aux collectes collaboratives comme celles qui touchent l&rsquo;activit&eacute; &eacute;lectorale fran&ccedil;aise. Sa participation[18] s&rsquo;est rapidement av&eacute;r&eacute;e essentielle, dans le cadre d&rsquo;une pand&eacute;mie qui touchait diff&eacute;remment les territoires, de pouvoir enrichir la collecte par des s&eacute;lections de niveau r&eacute;gional ou local. Ainsi l&rsquo;approche r&eacute;gionale et locale fut &eacute;galement au c&oelig;ur de la dynamique d&rsquo;archivage avec l&rsquo;archivage des publications web de nombreux CHU, mus&eacute;es, groupes syndicaux locaux, dioc&egrave;ses, municipalit&eacute;s, acad&eacute;mies, sans oublier des blogs et sites d&rsquo;information locale qui pouvaient &eacute;chapper aux collectes courantes de la BnF.</p> <p>Gr&acirc;ce au renfort de 70 correspondants volontaires, les s&eacute;lections connurent une augmentation spectaculaire entre la mi-mars et le mois de mai. Un point haut fut atteint durant le mois d&rsquo;avril avec 500 s&eacute;lections r&eacute;alis&eacute;es par semaine. En analysant les mots cl&eacute;s saisis par les correspondants, il apparaissait que la moiti&eacute; des contenus poss&eacute;daient une indexation g&eacute;ographique (r&eacute;gion, d&eacute;partement ou ville). Ainsi, la r&eacute;partition de la veille et des s&eacute;lections entre le r&eacute;seau interne et externe permit d&rsquo;obtenir une couverture disciplinaire et territoriale jug&eacute;e relativement compl&egrave;te et donc repr&eacute;sentative du web &agrave; cet instant.</p> <p>Dans la pratique, les correspondants pouvaient s&rsquo;appuyer sur le &laquo; Memento&nbsp;&raquo; r&eacute;dig&eacute; par l&rsquo;&eacute;quipe du service du d&eacute;p&ocirc;t l&eacute;gal de l&rsquo;internet. Dans le cadre du p&eacute;rim&egrave;tre qui &eacute;tait le leur, couverture plut&ocirc;t disciplinaire pour le r&eacute;seau interne et r&eacute;gionale pour le r&eacute;seau externe, ils sont rest&eacute;s totalement libres dans leurs choix de s&eacute;lections. En analysant le r&eacute;sultat de la collecte pour cette p&eacute;riode de f&eacute;vrier-juillet 2020, on note toutefois des variations du nombre de s&eacute;lections d&rsquo;une r&eacute;gion &agrave; l&rsquo;autre. Elle s&rsquo;explique par le temps consacr&eacute; par le correspondant r&eacute;gional &agrave; cette t&acirc;che, mais aussi par la m&eacute;thodologie adopt&eacute;e. L&rsquo;existence d&rsquo;une collecte r&eacute;gionale d&eacute;j&agrave; en place, ce qui reste un cas minoritaire actuellement, peut faciliter la mobilisation de cette premi&egrave;re base de travail pour la veille. L&rsquo;adoption de techniques de veille m&eacute;thodiques conduit &eacute;galement &agrave; un plus grand nombre de s&eacute;lections. Ainsi, la correspondante de Bourgogne-Franche-Comt&eacute; renouvelait r&eacute;guli&egrave;rement les m&ecirc;mes requ&ecirc;tes en recherche avanc&eacute;e sur Google pour pouvoir ajouter syst&eacute;matiquement de nouveaux contenus pertinents pour sa r&eacute;gion. Pour plusieurs r&eacute;gions comme la Corse ou le Grand Est et en particulier pour l&rsquo;Alsace, qui &eacute;tait fortement touch&eacute;e par la premi&egrave;re vague, la BnF a pu pallier les difficult&eacute;s techniques et humaines locales en r&eacute;alisant directement des s&eacute;lections r&eacute;gionales.</p> <p>Il fut cependant difficile de conserver un haut niveau de mobilisation du r&eacute;seau de partenaires dans la dur&eacute;e. N&eacute;anmoins, l&rsquo;ensemble des s&eacute;lections documentaires de la premi&egrave;re vague put servir de base de travail lors des vagues &eacute;pid&eacute;miques suivantes et la collecte resta toujours ouverte aux correspondants r&eacute;gionaux. Plusieurs d&rsquo;entre eux, comme la correspondante de Provence-Alpes-C&ocirc;te d&rsquo;Azur, reprirent contact lors de la deuxi&egrave;me vague et relanc&egrave;rent les s&eacute;lections pour couvrir les &eacute;volutions locales de la fin 2020 et la mise en place des premiers couvre-feux.</p> <p><img height="484" src="https://www.numerev.com/img/ck_993_1_image2.png" width="605" /></p> <h2>Diversit&eacute; des archives : sites web, r&eacute;seaux sociaux et vid&eacute;os</h2> <p>Dans leur s&eacute;lection, les archivistes sont amen&eacute;s &agrave; consid&eacute;rer la diversit&eacute; des formats et des plateformes qui constituent le web aujourd&rsquo;hui. La notion d&rsquo;espace num&eacute;rique[19] a ainsi &eacute;t&eacute; appliqu&eacute;e. Pour une institution comme l&rsquo;Inserm, ce sont &agrave; la fois le site web principal, la salle de presse (presse.inserm.fr), le compte twitter et la chaine Youtube, qui ont &eacute;t&eacute; archiv&eacute;s. Techniquement plus d&eacute;licate, les collectes des vid&eacute;os Youtube et des contenus Instagram ont &eacute;t&eacute; r&eacute;alis&eacute; s&eacute;par&eacute;ment en juillet et d&eacute;cembre 2020. Quel que soit le type d&rsquo;objet archiv&eacute;, les outils employ&eacute;s en production restent les m&ecirc;mes (la BnF utilise le&nbsp; crawler Heritrix) de fa&ccedil;on &agrave; d&eacute;livrer des fichiers de conservation r&eacute;pondant tous aux m&ecirc;mes standards (format WARC).</p> <p>Pour la collecte Vid&eacute;o, la d&eacute;marche retenue consiste &agrave; capturer l&rsquo;ensemble des vid&eacute;os d&rsquo;une chaine et &agrave; ne pas faire de s&eacute;lection au niveau de la vid&eacute;o. Dans la mesure du possible, les &eacute;quipes techniques de la BnF s&rsquo;efforcent de capturer l&rsquo;environnement des pages web des vid&eacute;os (onglets &Agrave; propos, Communaut&eacute;) ou &agrave; d&eacute;faut des m&eacute;tadonn&eacute;es permettant de recr&eacute;er l&rsquo;environnement artificiellement. Tr&egrave;s importante en termes de consommation budg&eacute;taire, cette op&eacute;ration requi&egrave;re l&rsquo;adoption de crit&egrave;res plus stricts pour &eacute;viter que les besoins de stockage d&eacute;passent les capacit&eacute;s des espaces allou&eacute;s sur les serveurs de la BnF. Une priorit&eacute; fut donc donn&eacute;e aux chaines dont le contenu &eacute;tait majoritairement en lien avec la crise sanitaire et les chaines vid&eacute;o g&eacute;n&eacute;ralistes des grands m&eacute;dias furent &eacute;cart&eacute;es. 109 chaines vid&eacute;o Youtube furent archiv&eacute;es couvrant aussi bien la vid&eacute;o scientifique que la vid&eacute;o d&rsquo;humour confin&eacute;. C&rsquo;est &agrave; cette occasion que fut archiv&eacute;e la chaine vid&eacute;o du coach sportif de la R&eacute;publique, cit&eacute;e en pr&eacute;ambule de cet article.</p> <p>Pour compl&eacute;ter ces s&eacute;lections, les archivistes de la BnF souhait&egrave;rent int&eacute;grer des sites web apparus durant le confinement consid&eacute;rant que ces cr&eacute;ations ad-hoc t&eacute;moignaient &eacute;galement de la r&eacute;action du web. Le travail fut men&eacute; &agrave; partir des listes produites par l&rsquo;AFNIC [20], ce qui permet de rep&eacute;rer les nouveaux noms de domaine d&eacute;pos&eacute;s. Dans un premier temps, un filtrage fut effectu&eacute; pour ne retenir que les noms de domaine comportant les cha&icirc;nes de caract&egrave;re &ldquo;corona&rdquo;, virus&rdquo; et &ldquo;covid&rdquo;. Une analyse m&eacute;thodique des r&eacute;sultats permit de recenser 640 sites actifs r&eacute;pondant aux crit&egrave;res de la collecte. Il s&rsquo;agit essentiellement de sites commerciaux (vente de visi&egrave;res), d&rsquo;entraide (r&eacute;seau de makers proposant des masques aux soignants), d&rsquo;information locale ou municipale sur le virus...etc.</p> <h2>Bilan de la collecte apr&egrave;s le premier confinement</h2> <p>Durant la premi&egrave;re phase de l&rsquo;&eacute;pid&eacute;mie, entre janvier et juillet 2020, les archivistes ont ainsi r&eacute;alis&eacute; 5&nbsp;142 s&eacute;lections de sites, blogs, r&eacute;seaux sociaux et vid&eacute;os correspondant &agrave; 1&nbsp;014 crawls effectu&eacute;s par les robots de la BnF et une production de 15&nbsp;504 fichiers WARC. L&rsquo;ensemble repr&eacute;sente 274&nbsp;784&nbsp;516 urls collect&eacute;es et un volume de 15To de donn&eacute;es compress&eacute;es dont 1To de vid&eacute;o. &Agrave; titre de comparaison, la collecte large qui vise &agrave; couvrir l&rsquo;ensemble du domaine .fr et des sites h&eacute;berg&eacute;s en France atteint 110/120 To chaque ann&eacute;e tandis que le poids des collectes projets[21] (Intelligence artificielle, Enjeux environnementaux, Jeux olympiques) est g&eacute;n&eacute;ralement compris entre 1 et 2 To.</p> <p>Les mots cl&eacute; qui ont guid&eacute; la s&eacute;lection donnent &eacute;galement quelques indications de la r&eacute;partition th&eacute;matique des contenus. Sans surprise, les Aspects sociaux (1&nbsp;531) dominent, devant les Aspects &eacute;conomiques (522), les Aspects m&eacute;dicaux et scientifiques (451), les Mesures d&rsquo;endiguement (374) et enfin les Aspects politiques (146)[22]. Des mots cl&eacute;s plus pr&eacute;cis permettent de retrouver plus finement certains types de publications web (journal de confinement, t&eacute;moignage, &eacute;ducation...etc).</p> <p>Les statistiques de production t&eacute;moignent de la forte mobilisation du r&eacute;seau des correspondants (internes et externes) et de la maitrise de l&rsquo;application de s&eacute;lection BCweb. Les archivistes ont pu continuer &agrave; travailler tout en &eacute;tant confin&eacute;(e)s. La collecte Covid-19 repr&eacute;senta d&rsquo;ailleurs pour certaines &eacute;quipes une occasion de garder le contact entre coll&egrave;gues durant le confinement et de continuer &agrave; travailler ensemble dans un contexte g&eacute;n&eacute;ral de d&eacute;ploiement du t&eacute;l&eacute;travail[23].</p> <h2>Gestion de la collecte sur un temps long</h2> <p>Du fait de cette dynamique initiale, la masse des s&eacute;lections g&eacute;n&eacute;ra une charge importante de gestion et de v&eacute;rification pour les archivistes du service du d&eacute;p&ocirc;t l&eacute;gal num&eacute;rique de la BnF. La prise en compte de l&rsquo;&eacute;volution temporelle des contenus est une difficult&eacute; majeure de ce type de collecte dynamique. Lorsqu&rsquo;un archiviste saisit l&rsquo;url d&rsquo;une s&eacute;lection dans la base de travail, il lui attribue une url et compl&egrave;te la fiche avec certaines informations techniques et descriptives (mot-cl&eacute;, notes de contenu). Il d&eacute;finit &eacute;galement une fr&eacute;quence de collecte.&nbsp; De nombreuses s&eacute;lections visaient &agrave; capturer les contenus de pages et de rubriques r&eacute;guli&egrave;rement actualis&eacute;es. Pages de CHU, d&rsquo;ARS, de municipalit&eacute;s, d&rsquo;association, de syndicat et presse professionnelle ont relay&eacute; massivement les bilans &eacute;pid&eacute;miologiques, les recommandations gouvernementales, des consignes et proc&eacute;dures pour le d&eacute;confinement[24] aupr&egrave;s de leurs lecteurs et adh&eacute;rents. Elles entrent de fait dans cette cat&eacute;gorie.</p> <p>D&egrave;s juin 2020, il devenait essentiel de d&eacute;sactiver une partie des s&eacute;lections, revoir les fr&eacute;quences de collecte, mettre &agrave; jour les urls. Pour ce dernier cas, les changements s&eacute;mantiques (/coronavirus /covid_19) et l&rsquo;actualit&eacute; (/variant /vaccin) se sont souvent r&eacute;percut&eacute;s dans les adresses des pages vis&eacute;es. Ce travail fastidieux de v&eacute;rification des urls de d&eacute;part et de contr&ocirc;le des r&eacute;sultats aussi bien technique que visuel accompagna l&rsquo;&eacute;volution de la pand&eacute;mie et fut poursuivi de 2020 &agrave; 2022 &agrave; chaque nouvelle vague &eacute;pid&eacute;mique. Gr&acirc;ce &agrave; cela, la base de travail cr&eacute;&eacute;e durant le premier confinement continua de servir de r&eacute;servoir aux archivistes, qui pouvaient ainsi plus ais&eacute;ment s&eacute;lectionner et d&eacute;sactiver en masse des urls de d&eacute;part pour les crawls &agrave; lancer. Le nombre total de s&eacute;lections originales durant les deux ann&eacute;es de crise sanitaire avoisina les 6300. Ce bilan d&eacute;montre que les outils et l&#39;organisation des collectes ont aujourd&rsquo;hui atteint une certaine maturit&eacute;.</p> <p>Parall&egrave;lement &agrave; la poursuite de la collecte, l&rsquo;objectif pour les &eacute;quipes de la BnF &eacute;tait de maintenir l&rsquo;&eacute;lan initial pour mettre en &oelig;uvre la valorisation des archives produites durant le premier confinement.</p> <p><img height="479" src="https://www.numerev.com/img/ck_993_1_image3.png" width="605" /></p> <h2>Publication d&#39;un parcours guid&eacute; de l&#39;archive</h2> <p>Afin de donner une visibilit&eacute; &agrave; ces archives, les &eacute;quipes de la BnF entreprirent la r&eacute;daction d&rsquo;un parcours guid&eacute; intitul&eacute; &laquo;&nbsp;L&rsquo;&eacute;pid&eacute;mie de Covid-19 et le premier confinement&nbsp;&raquo;. Ces publications permettent d&rsquo;ordonner la collection autour de grands th&egrave;mes et proposent un choix de captures pour chacun d&rsquo;eux. Chaque capture est d&eacute;crite bri&egrave;vement et contextualiser. Fonctionnant comme un outil de d&eacute;couverte, les parcours guid&eacute;s donnent la possibilit&eacute; de rejouer les sites web archiv&eacute;s mis en avant et de naviguer dans les captures ou bien de faire d&eacute;filer les captures via une barre chronologique. Ils peuvent &ecirc;tre produits par les archivistes pour toucher le grand public ou par des chercheurs partenaires qui publient et documentent leurs sources en histoire ou sociologie du web sous cette forme. Les parcours guid&eacute;s sont consultables dans leur int&eacute;gralit&eacute; &agrave; la BnF et au sein du r&eacute;seau des biblioth&egrave;ques partenaires[25]. Une version PDF de chaque parcours publi&eacute; est mise en ligne sur le site de la BnF[26]. Celle de &laquo;&nbsp;L&#39;&eacute;pid&eacute;mie de Covid-19&nbsp;et du premier confinement &raquo; est accompagn&eacute;e d&rsquo;un diaporama r&eacute;alis&eacute; avec l&rsquo;accord des ayants-droits r&eacute;alis&eacute; pour faciliter les r&eacute;utilisations p&eacute;dagogiques. Les illustrations de cet article en sont tir&eacute;es.</p> <p>Le parcours guid&eacute; consacr&eacute; &agrave; &laquo;&nbsp;L&rsquo;&eacute;pid&eacute;mie de Covid-19 et le premier confinement&nbsp;&raquo; fut publi&eacute; en mars 2021. 16 th&egrave;mes le composent pour un ensemble de 126 captures.</p> <p>Organisation th&eacute;matique du parcours guid&eacute;&nbsp;:</p> <p>1. Les mots de la Covid-19.</p> <p>2. Une pand&eacute;mie hors de contr&ocirc;le.</p> <p>3. Confinement et restriction des libert&eacute;s publiques</p> <p>4. Le syst&egrave;me de sant&eacute;.</p> <p>5. Chercher, informer, vulgariser</p> <p>6. Je veux aider.</p> <p>7. Une mondialisation &agrave; l&rsquo;arr&ecirc;t, une &eacute;conomie en panne.</p> <p>8. Au th&eacute;&acirc;tre chez vous ! Spectacles en confinement</p> <p>9. Un confinement cr&eacute;atif</p> <p>10. Le quotidien du confinement</p> <p>11. Ma commune durant le confinement.</p> <p>12. Une attention aux plus fragiles et vuln&eacute;rables.</p> <p>13. Un monde du travail boulevers&eacute;.</p> <p>14. L&rsquo;enseignement &agrave; distance.</p> <p>15. Le d&eacute;confinement.</p> <p>16. Interpr&eacute;ter l&rsquo;&eacute;v&egrave;nement, se r&eacute;inventer.</p> <p>Le PDF et le diaporama sont accessibles sur le site de la BnF.</p> <p><img height="224" src="https://www.numerev.com/img/ck_993_1_image4.png" width="605" /></p> <h2>Une indexation n&eacute;cessairement large</h2> <p>En parall&egrave;le, les archives constitu&eacute;es furent index&eacute;e pour permettre la recherche par mot et offrir ce service aux chercheurs. N&eacute;anmoins, l&rsquo;indexation de cette collection posa des probl&eacute;matiques de d&eacute;finition du p&eacute;rim&egrave;tre de la collection. Les collections index&eacute;es pr&eacute;c&eacute;demment correspondaient &agrave; des ensembles plus ais&eacute;s &agrave; d&eacute;finir&nbsp;avec une correspondance plus &eacute;vidente entre les fichiers de conservation produits et le contenu documentaire. Ainsi, les crawls des collectes &laquo; Actualit&eacute; &raquo; et &laquo; Presse payante &raquo; regroupent plus d&rsquo;une centaine de sites de presse nationale et r&eacute;gionale dont la une, les articles li&eacute;s et les comptes Twitter sont collect&eacute;s une fois par jour. Les fichiers produits sont clairement s&eacute;par&eacute;s et identifiables. Au final, l&rsquo;indexation de la collecte &laquo;&nbsp;Actualit&eacute;s 2010 &ndash; 2021&nbsp;&raquo;[27] est une op&eacute;ration essentiellement technique qui ne pose pas de difficult&eacute; documentaire.</p> <p>Il est important de rappeler &agrave; ce niveau que la collecte Covid-19 est avant tout un travail de s&eacute;lection documentaire. Elle ne recoupe pas l&rsquo;organisation technique des collectes et surtout des crawls r&eacute;alis&eacute;s par les robots de la BnF. Techniquement, elle rel&egrave;ve des collectes courantes qui sont organis&eacute;es selon les param&egrave;tres de fr&eacute;quence et de profondeur de collecte, ce qui signifie que les contenus conserv&eacute;s au sein d&rsquo;un fichier d&rsquo;archive sont m&eacute;lang&eacute;s et proviennent de diff&eacute;rentes collectes documentaires courantes (collecte de l&rsquo;Actualit&eacute; &eacute;ph&eacute;m&egrave;re, collecte Litt&eacute;rature et Arts, collecte Alsatiques&hellip;etc). Pour d&eacute;finir une collection, il &eacute;tait donc n&eacute;cessaire de s&rsquo;appuyer sur un crit&egrave;re chronologique. L&rsquo;ensemble index&eacute; correspond concr&egrave;tement aux fichiers WARC produits entre janvier et juillet 2020 dans le cadre des collectes Actualit&eacute;, Presse payante et des collectes courantes[28]. En parall&egrave;le, les cha&icirc;nes vid&eacute;os collect&eacute;es furent int&eacute;gr&eacute;es au parcours guid&eacute; &laquo;&nbsp;Vid&eacute;o&nbsp;&raquo; et la liste des s&eacute;lections sur la Covid-19 fut publi&eacute;e sur le site API et Jeux de donn&eacute;es de la BnF[29].</p> <h2>Exp&eacute;rimentation de nouveaux outils : datavisualisation et appr&eacute;hension des donn&eacute;es</h2> <p>La BnF prit &eacute;galement l&rsquo;initiative de r&eacute;unir un groupe de chercheurs sous la forme de deux ateliers qui eurent lieu &agrave; la fin de l&rsquo;ann&eacute;e 2020[30]. L&rsquo;objectif de ces ateliers &eacute;tait de mesurer leur int&eacute;r&ecirc;t pour la collecte et de les associer &agrave; des r&eacute;flexions sur l&rsquo;&eacute;volution des outils. Ils firent en outre ressortir la n&eacute;cessit&eacute; de renforcer le dispositif d&rsquo;accueil, ce qui conduisit &agrave; proposer les archives web de la Covid-19 comme objet de recherche[31] pour la publication du premier appel &agrave; projet du BnF DataLab.</p> <p>Conscientes de la difficult&eacute; que pouvait repr&eacute;senter l&rsquo;appr&eacute;hension et l&rsquo;analyse de la masse consid&eacute;rable de donn&eacute;es que repr&eacute;sentent les archives web de la covid-19, les &eacute;quipes de la BnF souhait&egrave;rent tester de nouveaux outils de datavisualisation et recueillir l&rsquo;avis des chercheurs sur ces derniers. Une recherche n-grams fut d&eacute;velopp&eacute;e pour permettre de comparer les occurrences de mots ou d&rsquo;expressions et visualiser leur &eacute;volution temporelle. Cette fonctionnalit&eacute;, m&ecirc;me si elle peut pr&eacute;senter des biais d&rsquo;interpr&eacute;tation[32], fut int&eacute;gr&eacute;e en septembre 2021 et fait aujourd&rsquo;hui partie de l&rsquo;offre standard propos&eacute;e pour les collections index&eacute;es (Actualit&eacute;s, Attentats, Incunables du web et d&eacute;sormais Covid-19). L&rsquo;installation de l&rsquo;outil SolrWayback d&eacute;velopp&eacute; par la Biblioth&egrave;que royale du Danemark permit &eacute;galement de tester cette application, qui int&egrave;gre de nombreuses fonctionnalit&eacute;s de datavisualistion et facilite les recherches d&rsquo;images. Un petit &eacute;chantillon correspondant &agrave; 10% de la collecte Covid-19 fut index&eacute; avec cet outil.&nbsp; Jug&eacute; tr&egrave;s concluant, il est aujourd&rsquo;hui utilis&eacute; sur d&rsquo;autres projets de recherche lorsque la taille du corpus le permet[33].</p> <p><img height="522" src="https://www.numerev.com/img/ck_993_1_image5.png" width="604" /></p> <p><img height="489" src="https://www.numerev.com/img/ck_993_1_image6.png" width="588" /></p> <h2>Une m&eacute;moire imm&eacute;diate : l&#39;archive web au regard de la sensibilit&eacute;</h2> <p>Durant le confinement et la p&eacute;riode suivante du d&eacute;confinement, plusieurs articles de presse se sont int&eacute;ress&eacute;s &agrave; l&rsquo;archivage du web et &agrave; la collecte Covid-19 men&eacute;e par la BnF. Ils t&eacute;moignent d&rsquo;une curiosit&eacute; pour la m&eacute;moire de l&rsquo;&eacute;v&egrave;nement et ce nouveau type d&rsquo;archives encore peu famili&egrave;res du grand public. La collecte web y est associ&eacute;e collectes aux autres collectes physiques organis&eacute;es par les mus&eacute;es et les services d&#39;archives (collecte d&rsquo;artefacts ou recueil de journaux de confinement).</p> <p>La constitution d&#39;une m&eacute;moire imm&eacute;diate de l&#39;&eacute;v&egrave;nement a sembl&eacute; &eacute;vidente tant nos vies &eacute;taient boulevers&eacute;es et l&#39;intention m&eacute;morielle peut expliquer le rapprochement avec les collectes &laquo; sensibles &raquo; &eacute;voqu&eacute;es dans l&#39;introduction de cet article. L&#39;usage des m&ecirc;mes termes &laquo;&nbsp;collecte&nbsp;&raquo;et &laquo;&nbsp;archives&nbsp;&raquo; entretient d&rsquo;ailleurs une certaine confusion entre des projets qui ne reposent pas sur les m&ecirc;mes m&eacute;thodes de constitution des collections. Le travail de l&rsquo;archiviste web s&#39;apparente plus &agrave; un travail de documentaliste, reposant sur la s&eacute;lection et l&rsquo;organisation des ressources en vue de leur archivage et ult&eacute;rieurement de leur valorisation. Les modalit&eacute;s du crawl donne de fait un caract&egrave;re massif &agrave; aux collectes web, puisque le robot suit les liens trouv&eacute;s sur le web sans &ecirc;tre guid&eacute;. De plus pour une seule page web, il copie &eacute;galement une grande quantit&eacute; de fichiers de toute nature qui entrent dans la composition de la page (images, scripts, fichiers de mise en page).</p> <p>Les collectes des mus&eacute;es et des services d&#39;archives reposent le plus souvent sur des appels aux dons et permettent de r&eacute;colter des objets marqueurs de l&rsquo;&eacute;poque (masques, attestations de sortie), ainsi que des cr&eacute;ations ordinaires personnelles (journaux de confinement, calendrier de confinement). Ces artefacts sont porteurs d&rsquo;une certaine &eacute;motion et se font l&rsquo;&eacute;cho d&rsquo;un rapport personnel &agrave; l&rsquo;&eacute;v&egrave;nement. N&eacute;anmoins, derri&egrave;re ces premi&egrave;res diff&eacute;rences, des rapprochements naturels peuvent &ecirc;tre faits entre les archives physiques et les archives web. En effet, des &eacute;quivalents aux objets physiques collect&eacute;s ont circul&eacute; sur le web et ont &eacute;t&eacute; archiv&eacute;s&nbsp;: tutoriel en ligne pour cr&eacute;er son propre masque, site web g&eacute;n&eacute;rant une attestation de sortie, journaux de confinement, t&eacute;moignages sur les r&eacute;seaux sociaux...etc. Tous rel&egrave;vent du quotidien et nous sont familiers. Ces traces de nos v&eacute;cus intimes de l&rsquo;&eacute;v&egrave;nement participent aussi bien l&rsquo;exercice d&rsquo;une m&eacute;moire qu&rsquo;&agrave; la constitution d&rsquo;un patrimoine au sens proprement documentaire[34]. En ce sens, la collecte covid-19 repr&eacute;sente une &eacute;tape importante dans le renforcement de la l&eacute;gitimit&eacute; patrimoniale des archives du web[35].</p> <p><img height="473" src="https://www.numerev.com/img/ck_993_1_image7.png" width="605" /></p> <h2>De la repr&eacute;sentativit&eacute;</h2> <p>L&#39;acquisition d&#39;une l&eacute;gitimit&eacute; patrimoniale n&#39;est pourtant pas universelle, m&ecirc;me dans le cas d&rsquo;un &eacute;v&egrave;nement plan&eacute;taire comme celui que nous venons de traverser. En changeant d&#39;&eacute;chelle, on constate que cette forme de patrimonialisation imm&eacute;diate concerne essentiellement l&#39;Am&eacute;rique du Nord et l&#39;Europe. Pour l&#39;archivage du web, en utilisant comme r&eacute;f&eacute;rence la collecte collaborative internationale port&eacute;e par l&rsquo;IIPC, la carte s&#39;&eacute;largit toutefois &agrave; l&#39;Am&eacute;rique du Sud et &agrave; plusieurs pays d&#39;Asie. Une r&eacute;elle fracture g&eacute;ographique persiste avec les pays les moins d&eacute;velopp&eacute;s et plus encore les r&eacute;gimes autoritaires. Les collectes Covid-19 peuvent ainsi &ecirc;tre consid&eacute;r&eacute;es comme des marqueurs culturels et politiques de nos soci&eacute;t&eacute;s. Le plus souvent, elles invitent les citoyens &agrave; participer promouvant l&rsquo;id&eacute;e que l&#39;histoire de chacun est importante. Cette ouverture &agrave; tous est n&eacute;anmoins questionnable dans la mesure o&ugrave; elle ne saurait g&eacute;n&eacute;rer d&#39;elle-m&ecirc;me une parfaite &eacute;galit&eacute; de repr&eacute;sentation[36]. Le m&ecirc;me questionnement peut &ecirc;tre port&eacute; sur les archives du web, d&#39;autant que la construction des politiques documentaires d&#39;archivage pose la repr&eacute;sentativit&eacute; comme principe de directeur. Que signifie cette id&eacute;e appliqu&eacute;e au web, espace transnational compos&eacute; d&rsquo;une multitude de plateformes et de formats&nbsp;? La communication d&rsquo;une documentation de la collecte la plus compl&egrave;te possible apporte de nombreux &eacute;l&eacute;ments de r&eacute;ponse &agrave; cette question. Documenter une collecte est un &eacute;l&eacute;ment essentiel pour en appr&eacute;cier &nbsp;les lacunes et les pertinences, permettre l&rsquo;exercice de la critique. Crit&egrave;res et listes de s&eacute;lection d&rsquo;une part, statistiques et donn&eacute;es techniques d&rsquo;autre part (nombre de fichiers WARC produits, param&egrave;tres de collecte, code r&eacute;ponse des sites) sont les informations essentielles pour que les chercheurs puissent exercer une critique des mat&eacute;riaux. Il est ind&eacute;niable que l&rsquo;am&eacute;lioration des outils de consultation et de recherche facilite l&rsquo;exploitation de ces grands corpus archivistiques issus du web. Pour autant, ils ne doivent pas masquer le mat&eacute;riau ou conduire &agrave; d&eacute;roger &agrave; cette premi&egrave;re prise de connaissance de la source &eacute;tudi&eacute;e.</p> <h2>Comparaisons internationales : le projet Warcnet</h2> <p>L&rsquo;analyse et la comparaison des collectes web est un exercice d&rsquo;autant plus essentiel dans le cadre de la pand&eacute;mie, que les dispositifs nationaux de collecte mis en place par les biblioth&egrave;ques nationales varient aussi bien au niveau technique qu&rsquo;organisationnel. Les formats et les outils, m&ecirc;me s&rsquo;ils sont largement partag&eacute;s par la communaut&eacute; des archivistes, ne sont pas toujours employ&eacute;s avec les m&ecirc;mes configurations. Dans le cadre du projet Warcnet, la chercheuse Val&eacute;rie Schafer a ainsi men&eacute; une s&eacute;rie d&rsquo;entretiens pour &eacute;clairer ces collectes avec l&rsquo;objectif de pouvoir entamer des comparaisons entre pays europ&eacute;ens.</p> <p>Cette s&eacute;rie d&rsquo;interviews illustrent la diversit&eacute; des paysages juridiques nationaux et des choix techniques et documentaires[37]. Elle aide les archivistes &agrave; prendre du recul sur leurs pratiques de veille. La collecte de chaines vid&eacute;o Youtube ressort comme une sp&eacute;cificit&eacute; forte de la BnF, m&ecirc;me si l&rsquo;Ina a &eacute;galement collect&eacute; une douzaine de chaines en lien avec la pand&eacute;mie[38]. L&#39;approche des r&eacute;seaux sociaux diff&eacute;re d&#39;une institution &agrave; l&#39;autre. En France, l&#39;Ina s&#39;appuie sur les API Twitter et r&eacute;cup&egrave;re des millions de donn&eacute;es bien format&eacute;es propres &agrave; des analyses massives[39]. La BnF a opt&eacute; pour une approche plus &laquo;&nbsp;photographique&nbsp;&raquo; permettant de restituer la page &agrave; la date de la capture et donc le contexte de publication des tweets &agrave; un instant t. Cependant seuls les derniers tweets sont captur&eacute;s ce qui ne permet pas d&#39;avoir une archive exhaustive. Ces diff&eacute;rences ont de profondes implications pour les chercheurs, qui peuvent d&egrave;s lors s&rsquo;orienter vers une collection plut&ocirc;t qu&rsquo;une autre, tandis que les archivistes peuvent consid&eacute;rer que ces approches s&rsquo;av&egrave;rent compl&eacute;mentaires. Suite &agrave; cette prise de conscience, la BnF a souhait&eacute; poursuivre ce type d&rsquo;&eacute;change m&eacute;thodologique et comparatif avec ses partenaires territoriaux en organisant le 9 novembre 2021 un webinaire consacr&eacute; aux collectes r&eacute;gionales du web[40].</p> <p><img height="480" src="https://www.numerev.com/img/ck_993_1_image8.png" width="605" /></p> <h2>Temporalit&eacute;s appliqu&eacute;es &agrave; la collection</h2> <p>L&#39;appr&eacute;hension d&rsquo;une archive produite sur une dur&eacute;e aussi longue reste toutefois difficile. Par nature une archive renvoie &agrave; une multitude de temporalit&eacute;s. La date qui pr&eacute;vaut lorsqu&rsquo;on r&eacute;alise une recherche est la date d&rsquo;archivage, qui est n&eacute;cessairement post&eacute;rieure &agrave; la date de publication. Il est de fait difficile de reconstituer les temporalit&eacute;s originales de publication et de circulation des contenus. La navigation en elle-m&ecirc;me au sein de l&#39;archive web conduit &agrave; des sauts temporels, minimes ou au contraire importants, lorsqu&#39;on passe d&#39;une page &agrave; une autre en fonction de l&#39;&eacute;cart temporel entre les deux captures[41]. Dans le cadre de la collecte Covid-19, l&#39;&eacute;volution des s&eacute;lections dans le temps complexifie encore l&#39;appr&eacute;hension de la temporalit&eacute; des contenus. Une page web peut avoir connu de multiples mises &agrave; jour durant le confinement sans que toutes ses versions aient &eacute;t&eacute; captur&eacute;es et &agrave; l&#39;inverse une page peut avoir donn&eacute; lieu &agrave; des captures r&eacute;guli&egrave;res sans modification des contenus. Surtout, les s&eacute;lections se sont poursuivies apr&egrave;s l&#39;&eacute;t&eacute; 2020 et des s&eacute;lections r&eacute;trospectives peuvent avoir &eacute;t&eacute; faites longtemps apr&egrave;s la fin du premier confinement. Les contenus ne sont alors pas inclus dans l&#39;index de recherche par mot-cl&eacute;. Dans le m&ecirc;me ordre d&rsquo;id&eacute;e, il semble difficile d&rsquo;envisager une indexation de l&rsquo;ensemble des archives produites entre f&eacute;vrier 2020 et la vague omicron de janvier 2022. La difficult&eacute; est &agrave; la fois technique (capacit&eacute; machine) et conceptuelle (pourrait-on encore parler de collecte Covid-19 si le bruit g&eacute;n&eacute;r&eacute; par d&rsquo;autres contenus s&rsquo;accroit&nbsp;?).</p> <p><img height="403" src="https://www.numerev.com/img/ck_993_1_image9.png" width="605" /></p> <h2>Analyse quantitative et analyse qualitative</h2> <p>De fait, la collecte covid-19 de par sa masse r&eacute;sume &agrave; elle seule la probl&eacute;matique que rencontre d&eacute;sormais la communaut&eacute; des archivistes et des chercheurs. Pour reprendre les termes de l&rsquo;historien Ian Milligan : We can collecte all this data, but what happens when it comes time to analyze it ?[42] Le BnF DataLab entend r&eacute;pondre &agrave; ce d&eacute;fi. Inaugur&eacute; le 18 octobre 2021, cet espace propose un service d&rsquo;assistance et d&rsquo;accompagnement &agrave; la recherche en partenariat avec la Tr&egrave;s grande infrastructure de recherche Huma-Num (CNRS). Pour sa premi&egrave;re ann&eacute;e d&rsquo;existence, il accueille 5 projets pour une dur&eacute;e d&rsquo;un an, dont un consacr&eacute; &agrave; la viralit&eacute; sur le web port&eacute; par Val&eacute;rie Schafer. L&rsquo;offre de service concernant les archives du web a &eacute;t&eacute; pens&eacute;e &agrave; partir de l&rsquo;exp&eacute;rience acquise depuis 2002&nbsp;et est structur&eacute;e autour de trois besoins : la collecte &agrave; la demande, l&rsquo;aide &agrave; la fouille de donn&eacute;es et l&rsquo;extraction de m&eacute;tadonn&eacute;es et d&rsquo;archives. C&rsquo;est dans ce cadre que de nouvelles approches sont explor&eacute;es pour articuler analyse quantitative et qualitative gr&acirc;ce &agrave; des m&eacute;thodes d&rsquo;&eacute;chantillonage, de cartographie exploratoire ou de traitement en masse des urls.</p> <p>&Agrave; c&ocirc;t&eacute; de ces travaux qui rel&egrave;vent des humanit&eacute;s num&eacute;riques, les approches plus classiques reposent elles aussi sur une m&eacute;thodologie de plus en plus formalis&eacute;e. Dans son ouvrage Web site Stories, la chercheuse Sophie Gebeil[43] expose ainsi sa d&eacute;marche. Le travail critique des archives web&nbsp; est enrichi par la r&eacute;alisation d&rsquo;enqu&ecirc;tes aupr&egrave;s des producteurs et l&rsquo;&eacute;tablissement de comparaisons avec les autres m&eacute;dias audiovisuels (TV, films documentaires, militants) et apportent une profondeur historique &agrave; l&rsquo;analyse. Le projet M&eacute;moires du Covid-19 et archives du Web port&eacute; par Sarah Gensburger devrait aussi&nbsp; continuer &agrave; enrichir ses r&eacute;flexions en interrogeant la relation entre histoire et m&eacute;moire num&eacute;rique de l&rsquo;&eacute;v&egrave;nement v&eacute;cu.</p> <h2>Nouvelles perspectives : le projet ResPadon</h2> <p>La collecte Covid-19 a aussi suscit&eacute; de nombreuses questions de la part des professionnels de l&rsquo;information et du monde acad&eacute;mique &eacute;veillant un int&eacute;r&ecirc;t nouveau pour ce type de sources encore m&eacute;connues. Un des objectifs des prochaines ann&eacute;es est la valorisation de cette offre documentaire au sein des universit&eacute;s. C&rsquo;est le sens du projet ResPadon (R&eacute;seau pour d&eacute;velopper et diversifier les usages des archives du web) lanc&eacute; conjointement par la BnF, l&#39;Universit&eacute; de Lille, le campus Condorcet et Sciences Po[44]. Le projet repose sur l&rsquo;exp&eacute;rimentation d&rsquo;un acc&egrave;s distant exp&eacute;rimental aux archives du web au sein biblioth&egrave;ques de l&rsquo;Universit&eacute; de Lille. Si les enjeux juridiques et organisationnels sont encore nombreux, cette avanc&eacute;e permet d&eacute;j&agrave; de rassembler une communaut&eacute; de professionnels et de chercheurs autour des archives du web et dessiner ensemble, patiemment, les collections et les outils de demain.</p> <blockquote> <p>Vive la R&eacute;publique, vive la France et vive le sport[45].</p> </blockquote> <p>Pour suivre l&rsquo;actualit&eacute; des Archives du web &agrave; la BnF&nbsp;: @DLwebBnF</p> <p>&nbsp;</p> <p>[1]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Training Plus, Allocution du coach sportif de la R&eacute;publique https://youtu.be/mWF9iI9XEd8</p> <p>[2]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Cl&eacute;mence Jost, Elles ont archiv&eacute; le confinement : zoom sur 4 collectes d&#39;archives pour l&#39;Histoire. Archimag, 24/03/2021 pour la version en ligne. https://www.archimag.com/archives-patrimoine/2021/03/24/archives-confinement-4-collectes-histoire</p> <p>[3]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; MUCEM, Vivre au temps du confinement. https://www.mucem.org/vivre-au-temps-du-confinement-la-collection</p> <p>[4]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Guy Boyer, Recueillir les r&ecirc;ves du confinement. Connaissance des arts, 30/11/2020 pour la version en ligne. https://www.connaissancedesarts.com/arts-expositions/art-contemporain/recueillir-les-reves-du-confinement-11149478/</p> <p>[5]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Elizabeth Serin, Herv&eacute; Mazurel, Arianna Cecconi, Tuia Cherici, Colloque &laquo;&nbsp;R&ecirc;ves de confins&nbsp;&raquo;. Enregistrement vid&eacute;o. BnF, 22/05/2021. Consultable en ligne&nbsp;: https://www.youtube.com/watch?v=xxGereF1kwY</p> <p>[6]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; M&eacute;diam&eacute;trie. L&rsquo;ann&eacute;e internet 2020. https://www.mediametrie.fr/fr/lannee-internet-2020</p> <p>[7] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; C&eacute;line Boulay-Esp&eacute;ronnier, C&eacute;cile Cukierman, St&eacute;phane Sautarel, 8 questions sur l&#39;avenir du t&eacute;l&eacute;travail, vers une r&eacute;volution un travail &agrave; distance ? Rapport d&#39;information du S&eacute;nat n&deg;89, enregistr&eacute; le 22 octobre 2021.</p> <p>[8]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; G&eacute;raldine Poels et V&eacute;ronique Lefort, &laquo; Covid-19 dans les JT : un niveau de m&eacute;diatisation in&eacute;dit pour une pand&eacute;mie &raquo;, La Revue des m&eacute;dias, 1er octobre 2020. Les journaux t&eacute;l&eacute;vis&eacute;s sont ceux de TF1, France 2, France 3, France 5, Arte et M6. https://larevuedesmedias.ina.fr/pandemie-covid-19-coronavirus-journal-televise</p> <p>[9]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Claude Grasland, &laquo; La pand&eacute;mie de Covid-19 a boulevers&eacute; les contenus de la presse r&eacute;gionale &raquo;, La Revue des m&eacute;dias, 20 ao&ucirc;t 2020. https://larevuedesmedias.ina.fr/la-pandemie-de-covid-19-bouleverse-les-contenus-de-la-presse-regionale</p> <p>[10]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; M&eacute;diam&eacute;trie. L&rsquo;ann&eacute;e internet 2020. https://www.mediametrie.fr/fr/lannee-internet-2020</p> <p>[11]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ce confinement cr&eacute;atif, qui par certains c&ocirc;t&eacute;s relevait d&rsquo;une forme d&rsquo;injonction sociale, a pu &eacute;galement &ecirc;tre consid&eacute;r&eacute; comme une reconnaissance acquise par la cr&eacute;ativit&eacute; ordinaire en un si&egrave;cle. Voir : Jules Zimmermann, Fallait-il &ecirc;tre cr&eacute;atif pour r&eacute;ussir son confinement ? Usbek et Rica, 25 mai 2020 [Retir&eacute; du site]. Consultable sur les archives de l&rsquo;internet : http://archivesinternet.bnf.fr/20200921123328/http://usbeketrica.com/fr/article/fallait-il-etre-creatif-pour-reussir-son-confinement</p> <p>[12]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Novel Coronavirus (2019-nCoV) outbreak : la collection internationale est accessible en ligne &agrave; l&rsquo;adresse : https://archive-it.org/collections/13529</p> <p>[13]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Le terme &laquo;&nbsp;archiviste&nbsp;&raquo; est entendu ici au sens g&eacute;n&eacute;rique recouvrant diff&eacute;rents statuts&nbsp;: archiviste et biblioth&eacute;caire.</p> <p>[14]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Alexandre Faye, Les archives web du coronavirus : une entreprise collective. Web Corpora, 22 avril 2020. https://webcorpora.hypotheses.org/856</p> <p>[15]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Au sein de la BnF, chaque d&eacute;partement organise sa propre collecte pour que des sites web jug&eacute;s importants et relevant de son p&eacute;rim&egrave;tre documentaire puissent &ecirc;tre r&eacute;guli&egrave;rement archiv&eacute;s.</p> <p>[16]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; V&eacute;ronique Tranchant, Chantal Puech, Sophie Gebeil, Val&eacute;rie Schafer et Alexandre Faye, Dans les coulisses de la collecte Covid-19. Entretien sur les pratiques des correspondants du DLWeb. Web Corpora, 16 novembre 2020. https://webcorpora.hypotheses.org/953</p> <p>[17]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ange Aniesa, Ariane Bouchard. Constituer un r&eacute;seau d&rsquo;acc&egrave;s aux archives de l&rsquo;internet : l&rsquo;exemple</p> <p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; fran&ccedil;ais. IFLA WLIC 2017, IFLA, Aug 2017, Wroclaw, Pologne. ffhal-01703421 https://hal-bnf.archives-ouvertes.fr/hal-01703421/ Voir la liste : https://www.bnf.fr/fr/selection-partagee-et-acces-en-region-aux-archives-de-linternet</p> <p>[18]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 11 biblioth&egrave;ques du r&eacute;seau territorial&nbsp; ont accept&eacute; de participer &agrave; l&rsquo;effort de collecte.</p> <p>[19]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; La notion est utilis&eacute;e ici pour d&eacute;signer l&rsquo;ensemble des canaux de communication num&eacute;rique mobilis&eacute;s par des candidats : sites web, r&eacute;seaux sociaux, cha&icirc;ne vid&eacute;o</p> <p>[20]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; L&rsquo;Association fran&ccedil;aise pour le nommage Internet en coop&eacute;ration (AFNIC) est une association loi de 1901. Elle a pour mission de g&eacute;rer les domaines Internet nationaux de premier niveau de la France comme le .fr ou le .re. L&rsquo;agence est aussi prestataire le .bzh, le .alsace, le .corsica&hellip;etc. La coop&eacute;ration entre l&rsquo;association et la BnF am&eacute;liore la qualit&eacute; des collectes.</p> <p>[21] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Les collectes projets couvrent des sujets d&#39;int&eacute;r&ecirc;t d&eacute;finis au niveau international par le consortium IIPC&nbsp;: https://netpreserve.org/projects/collaborative-collections/. La BnF contribue &agrave; ces collectes collaboratives transnationales dont le r&eacute;sultat est accessible en ligne sur https://archive-it.org/explore?show=Collections. Elle m&egrave;ne et reconduit &eacute;galement ses propres collectes projets sur le sujet, souvent avec des s&eacute;lections et des param&egrave;tres de collecte plus larges.</p> <p>[22] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ces grandes cat&eacute;gories qui structurent la collecte ont &eacute;t&eacute; reprises de la collecte collaborative &laquo;&nbsp;Novel Coronavirus (2019-nCoV) outbreak&nbsp;&raquo; lanc&eacute;e par consortium International Internet Preservation Consortium (IIPC) en association avec Internet Archive. Il a &eacute;t&eacute; demand&eacute; aux correspondants de les utiliser. D&rsquo;autres mots cl&eacute;s ont pu &ecirc;tre ajout&eacute;s plus librement pour qualifier plus finement le contenu de la s&eacute;lection.</p> <p>[23]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; David Benoist, Alexandre Faye, Pascal Tanesie, Sophie Gebeil, Val&eacute;rie Schafer. Exploring special web archive collections related to COVID-19: The case of the French National Library (BnF). WARCnet Papers, 2020. hal-03066879&nbsp;:&nbsp; https://hal.archives-ouvertes.fr/hal-03066879/</p> <p>[24] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &Agrave; titre d&rsquo;exemples&nbsp;: chu-lyon.fr/fr/covid-19 et mplusinfo.fr/tag/coronavirus (rubrique du site M+ votre Mulhouse)</p> <p>[25] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Voir la carte mise &agrave; jour des d&eacute;ploiements en r&eacute;gion et Outre-mer&nbsp;: https://umap.openstreetmap.fr/fr/map/ou-consulter-les-archives-de-linternet-de-la-bnf_73737#6/46.362/3.450</p> <p>[26]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; L&rsquo;ensemble des versions PDF des parcours guid&eacute;s sont disponibles sur le site de la BnF&nbsp;: https://www.bnf.fr/fr/parcours-guides-archives-de-linternet</p> <p>[27] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Cette collection index&eacute;e est mise &agrave; jour chaque ann&eacute;e.</p> <p>[28] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Toutefois, les fr&eacute;quences de collecte qui ne sont pas propos&eacute;es dans le cadre de la collecte &laquo;&nbsp;Actualit&eacute; &eacute;ph&eacute;m&egrave;re&nbsp;&raquo; furent &eacute;cart&eacute;es pour &eacute;viter de g&eacute;n&eacute;rer du bruit. Les fichiers WARC retenus correspondent aux crawls de fr&eacute;quence &laquo;&nbsp;mensuelle&nbsp;&raquo;, &laquo;&nbsp;hebdomadaire&nbsp;&raquo; et &laquo;&nbsp;plusieurs fois par jour&nbsp;&raquo; (param&egrave;tre de fr&eacute;quence utilis&eacute; pour les r&eacute;seaux sociaux) pour la p&eacute;riode d&eacute;finie.</p> <p>[29]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Apr&egrave;s un travail de v&eacute;rification et nettoyage, la liste propose 4600 urls de d&eacute;part utilis&eacute;s pour les crawls men&eacute;s entre le 1er f&eacute;vrier et le 31 juillet 2020. Elle est accessible au format CSV&nbsp;: https://api.bnf.fr/fr/node/176</p> <p>[30]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; En visioconf&eacute;rence &eacute;videmment !</p> <p>[31]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Le BnF DataLab accueille des &eacute;quipes de recherche porteuse de projets en analyse et traitement des collections num&eacute;riques. https://www.bnf.fr/fr/actualites/bnf-data-lab-appel-projets-2021</p> <p>[32]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Le r&eacute;sultat des recherches &agrave; partir des index ne peut s&rsquo;interpr&eacute;ter comme celui que donnerait une base de donn&eacute;es structur&eacute;e.</p> <p>[33] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; L&rsquo;outil a &eacute;t&eacute; d&eacute;ploy&eacute; par la BNUS dans le cadre du projet Bodycapital pour indexer une collecte &laquo;&nbsp;Corpus de recherche&nbsp;&raquo; r&eacute;alis&eacute; par la BnF pour les chercheurs. Le corpus porte sur les questions d&rsquo;alimentation et de sant&eacute;.</p> <p>[34] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nicolas Truong et alter, Les penseurs de l&rsquo;intime. Editions de l&rsquo;Aube, 2021.</p> <p>[35] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Sur la question de la l&eacute;gitimit&eacute; conf&eacute;r&eacute;e au patrimoine num&eacute;rique, voir&nbsp;: Emmanuelle Berm&egrave;s, Le num&eacute;rique en biblioth&egrave;que : naissance d&#39;un patrimoine : l&#39;exemple de la Biblioth&egrave;que nationale de France (1997-2019). Histoire. Paris, Ecole nationale des chartes, 2020. NNT : 2020ENCP0001. HAL Id : tel-02475991, version 1 https://tel.archives-ouvertes.fr/tel-02475991/document</p> <p>[36] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Daniella Kostroun, Collecter les histoires de la Covid-19 pour les g&eacute;n&eacute;rations futures. In : Shigehisa Kuriyama, Ota de Leonardis, Carlos Sonnenschein, et Ibrahima Thioub. Covid-19. Tour du monde. Editions du Manucius, 2021. pp124-125.</p> <p>[37] Voir&nbsp;la publication des WarcNet Papers - Exploring special web archives collections related to COVID-19&nbsp;: https://cc.au.dk/en/warcnet/warcnet-papers/</p> <p>[38] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; J&eacute;r&ocirc;me Thi&egrave;vre, Boris Blanckemane, Val&eacute;rie Schafer. Exploring special web archive collections related to COVID-19: The case of INA. WARCnet Papers, Niels Br&uuml;gger, Jane Winters, Val&eacute;rie Schafer, Kees Teszelszky, Peter Webster and Michael Kurzmeier, 2020. https://cc.au.dk/fileadmin/user_upload/WARCnet/Schafer_et_al_Exploring_special_web_archives.pdf</p> <p>[39] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Sur les applications possibles &agrave; la recherche de ces donn&eacute;es, on peut citer &agrave; titre d&rsquo;exemple les travaux de Fr&eacute;d&eacute;ric Clavert sur le centenaire de la Premi&egrave;re guerre mondiale. Fr&eacute;d&eacute;ric Clavert, Temporalit&eacute;s du Centenaire de la Grande Guerre sur Twitter. In&nbsp;: Val&eacute;rie Schafer (sous la dir.), Temps et temporalit&eacute;s du web. Presse universitaire de Nanterre, 2018.</p> <p>[40] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Lucie Behr, Francisco Calderon, Eve Charras, Ana&iuml;s Crini&egrave;re-Boizet, Arnaud Dhermy et Catherine Soul&eacute;-Sandic, Les collectes r&eacute;gionales du web. Web Corpora, 29 d&eacute;cembre 2021. https://webcorpora.hypotheses.org/1004</p> <p>[41] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Niels Br&uuml;gger, A brief Outline of Temporalities of the Web. In&nbsp;: Val&eacute;rie Schafer (sous la dir.), Temps et temporalit&eacute;s du web. Presse universitaire de Nanterre, 2018.</p> <p>[42] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ian Milligan, You shouldn&rsquo;t need to be a web historian to use web archives. WARCnet Web Archive Studie, Youtube 2020. https://www.youtube.com/watch?v=Ki-QGu9AGiQ</p> <p>[43] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Sophie Gebeil, Website Story. INA, 2021</p> <p>[44] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; https://www.collexpersee.eu/projet/respadon/ et sur Twitter @Respadon_Projet</p> <p>[45] &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Training Plus, ibid.</p>