&lt;h2&gt;Le contexte l&amp;eacute;gislatif et la m&amp;eacute;thodologie d&amp;rsquo;acquisition des ressources web &amp;agrave; Biblioth&amp;egrave;que et Archives Canada&lt;/h2&gt;

&lt;p&gt;Sous quelle autorit&amp;eacute; Biblioth&amp;egrave;que et Archives Canada (BAC) recueille-t-elle l&amp;rsquo;Internet canadien ?&lt;/p&gt;

&lt;p&gt;Selon la Loi sur la Biblioth&amp;egrave;que et les Archives du Canada (L.C. 2004), section 8(2) :&lt;/p&gt;

&lt;p style=&quot;margin-left: 40px;&quot;&gt;&lt;strong&gt;Attributions de l&amp;rsquo;administrateur g&amp;eacute;n&amp;eacute;ral&lt;/strong&gt;&lt;/p&gt;

&lt;p style=&quot;margin-left: 40px;&quot;&gt;8&amp;nbsp;(1)&amp;nbsp;L&amp;rsquo;administrateur g&amp;eacute;n&amp;eacute;ral peut prendre toute mesure qui concourt &amp;agrave; la r&amp;eacute;alisation de la mission de Biblioth&amp;egrave;que et Archives du Canada et, notamment&amp;nbsp;:&lt;/p&gt;

&lt;p style=&quot;margin-left: 40px;&quot;&gt;&lt;strong&gt;R&amp;eacute;alisation d&amp;rsquo;&amp;eacute;chantillons &amp;agrave; partir d&amp;rsquo;Internet&lt;/strong&gt;&lt;/p&gt;

&lt;p style=&quot;margin-left: 40px;&quot;&gt;(2)&amp;nbsp;Pour l&amp;rsquo;application de l&amp;rsquo;alin&amp;eacute;a (1)a), l&amp;rsquo;administrateur g&amp;eacute;n&amp;eacute;ral peut, &amp;agrave; des fins de pr&amp;eacute;servation, constituer des &amp;eacute;chantillons repr&amp;eacute;sentatifs, selon les modalit&amp;eacute;s de temps ou autres qu&amp;rsquo;il d&amp;eacute;termine, des &amp;eacute;l&amp;eacute;ments d&amp;rsquo;information pr&amp;eacute;sentant un int&amp;eacute;r&amp;ecirc;t pour le Canada et accessibles au public sans restriction dans Internet ou par tout autre m&amp;eacute;dia similaire.&lt;/p&gt;

&lt;p&gt;La loi &amp;eacute;tait visionnaire &amp;agrave; l&amp;rsquo;&amp;eacute;poque et d&amp;eacute;rivait du r&amp;ocirc;le de BAC en tant que membre fondateur du Consortium international pour la pr&amp;eacute;servation d&amp;rsquo;Internet (IIPC) en 2003. Selon l&amp;rsquo;IIPC, l&amp;rsquo;archivage web est le processus qui consiste &amp;agrave; acqu&amp;eacute;rir des parties du web, &amp;agrave; effectuer la pr&amp;eacute;servation num&amp;eacute;rique de ces donn&amp;eacute;es et &amp;agrave; les rendre accessibles et utilisables. Ainsi, l&amp;rsquo;objectif de l&amp;rsquo;archivage du web &amp;agrave; BAC est de pr&amp;eacute;server et d&amp;rsquo;assurer l&amp;rsquo;acc&amp;egrave;s futur aux ressources web qui sont un aspect essentiel du patrimoine documentaire du Canada.&lt;/p&gt;

&lt;p&gt;Le programme de Pr&amp;eacute;servation du web et des m&amp;eacute;dias sociaux est la m&amp;eacute;thode principale pour r&amp;eacute;aliser le mandat de BAC en lien avec l&amp;#39;article 8(2) de la loi. Pour l&amp;rsquo;acquisition du patrimoine documentaire num&amp;eacute;rique du Canada publi&amp;eacute; sur le web, nous avons &amp;eacute;labor&amp;eacute; un programme avec cinq activit&amp;eacute;s strat&amp;eacute;giques principales :&lt;/p&gt;

&lt;ol&gt;
	&lt;li&gt;Collection compl&amp;egrave;te de la pr&amp;eacute;sence web du Gouvernement du Canada (depuis 2005-)&lt;/li&gt;
	&lt;li&gt;Collections de recherche th&amp;eacute;matique sur le web et les m&amp;eacute;dias sociaux (2009-)&lt;/li&gt;
	&lt;li&gt;Documentation des &amp;eacute;v&amp;eacute;nements impr&amp;eacute;vus d&amp;#39;importance historique nationale (2013-)&lt;/li&gt;
	&lt;li&gt;R&amp;eacute;colte de sauvetage ou de conservation (2005-)&lt;/li&gt;
	&lt;li&gt;Acquisition des ressources nomin&amp;eacute;es (2005-)&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;La cr&amp;eacute;ation d&amp;rsquo;archives web sur la COVID-19 et ses r&amp;eacute;percussions sur le Canada fait appel aux strat&amp;eacute;gies et aux m&amp;eacute;thodologies inh&amp;eacute;rentes aux activit&amp;eacute;s num&amp;eacute;ros 2 et 3.&lt;/p&gt;

&lt;h2 style=&quot;text-align: justify;&quot;&gt;Pourquoi l&amp;rsquo;archivage web est-il important pour les &amp;eacute;v&amp;eacute;nements historiques nationaux&amp;nbsp;? Pour qui organisons-nous une archive web sur la COVID-19&amp;nbsp;?&lt;/h2&gt;

&lt;p&gt;La COVID-19 a d&amp;eacute;montr&amp;eacute; que l&amp;rsquo;archivage web est l&amp;rsquo;une des rares mesures que les professionnels de l&amp;rsquo;information peuvent prendre imm&amp;eacute;diatement pour pr&amp;eacute;server un historique complet et ses ressources num&amp;eacute;riques cl&amp;eacute;s.&lt;/p&gt;

&lt;p&gt;Cependant, l&amp;rsquo;archivage du web est rarement un simple geste de collecte de donn&amp;eacute;es. Il existe des pr&amp;eacute;jug&amp;eacute;s humains (conscients et inconscients) dans le choix des ressources &amp;agrave; inclure dans toute collection de recherche, et les archives web ne font pas exception &amp;agrave; cette r&amp;egrave;gle. Comment le caract&amp;egrave;re et la facilit&amp;eacute; d&amp;rsquo;utilisation de l&amp;rsquo;ensemble de donn&amp;eacute;es recueillies sont-ils influenc&amp;eacute;s par cela? De quelle fa&amp;ccedil;on la s&amp;eacute;lection des ressources &amp;agrave; inclure dans la collection influe-t-elle sur les sujets qu&amp;rsquo;elle peut &amp;eacute;tudier ? (Milligan, 2019).&lt;/p&gt;

&lt;p&gt;Il est important de savoir que ces biais ont une incidence directe sur la s&amp;eacute;lection des donn&amp;eacute;es et, par cons&amp;eacute;quent, sur la continuit&amp;eacute; de l&amp;rsquo;information. Lorsque nous consid&amp;eacute;rons la nature dynamique et pr&amp;eacute;caire du web, nous devons &amp;ecirc;tre conscients du fait que notre s&amp;eacute;lection d&amp;rsquo;une ressource web pour l&amp;rsquo;inclusion dans une archive web pourrait &amp;ecirc;tre la seule action de pr&amp;eacute;servation num&amp;eacute;rique que la ressource re&amp;ccedil;oit. Cela pourrait donc d&amp;eacute;terminer si la ressource survit et si elle est accessible aux chercheurs de l&amp;rsquo;avenir, ou si elle est perdue ou oubli&amp;eacute;e. Ainsi, les archives web et l&amp;rsquo;action de leur conservation num&amp;eacute;rique peuvent fonctionner comme une sorte de &amp;laquo; bateau de sauvetage num&amp;eacute;rique &amp;raquo; dans l&amp;rsquo;oc&amp;eacute;an des m&amp;eacute;gadonn&amp;eacute;es. Ce bateau pourrait d&amp;eacute;terminer quelles voix survivent pour t&amp;eacute;moigner des perspectives et de l&amp;rsquo;histoire d&amp;rsquo;une telle communaut&amp;eacute;.&lt;/p&gt;

&lt;p&gt;Peu importe &amp;agrave; quel point nous pr&amp;eacute;tendons &amp;ecirc;tre objectifs, ces pr&amp;eacute;jug&amp;eacute;s demeurent. En plus de la n&amp;eacute;cessit&amp;eacute; de lutter contre les pr&amp;eacute;jug&amp;eacute;s, nous sommes &amp;eacute;galement limit&amp;eacute;s par les ressources dont nous disposons et nous devons parfois prendre des d&amp;eacute;cisions difficiles au sujet de nos collections. Cependant, il y a des strat&amp;eacute;gies que nous pouvons &amp;eacute;laborer et d&amp;eacute;ployer pour essayer de cr&amp;eacute;er des archives web qui sont aussi inclusives que possibles.&lt;/p&gt;

&lt;p&gt;Depuis 2005, les principaux partenaires et intervenants du programme de pr&amp;eacute;servation du web et des m&amp;eacute;dias sociaux de BAC sont les biblioth&amp;egrave;ques universitaires qui s&amp;rsquo;int&amp;eacute;ressent aux donn&amp;eacute;es f&amp;eacute;d&amp;eacute;rales et aux documents officiels, les chercheurs professionnels et le public. Qu&amp;rsquo;est-ce que les chercheurs esp&amp;egrave;rent trouver pour faciliter leur recherche &amp;agrave; travers une masse de donn&amp;eacute;es telle&amp;nbsp;que les archives web ? Autrement dit, dans 20 ans, lorsqu&amp;rsquo;un historien r&amp;eacute;digera l&amp;rsquo;histoire de la COVID-19 et de ses r&amp;eacute;percussions sur le Canada, quelles sources et donn&amp;eacute;es principales aimerait-il avoir&amp;nbsp;?&lt;/p&gt;

&lt;p&gt;Nous devons nous poser cette question lorsque nous voulons organiser une collection sp&amp;eacute;ciale de ressources web pour documenter quelque chose de pr&amp;eacute;cis, comme un &amp;eacute;v&amp;eacute;nement historique. Il est &amp;eacute;galement important d&amp;rsquo;examiner comment les ressources web pourraient &amp;ecirc;tre utilis&amp;eacute;es dans les futurs contextes de donn&amp;eacute;es de recherche (Smyth, 2022a). Nous pourrions explorer textuellement (textually mine) le contenu des archives web, des visualisations pourraient &amp;ecirc;tre produites, des sujets obscurs r&amp;eacute;&amp;eacute;crits, des hyperliens analys&amp;eacute;s pour leurs associations &amp;agrave; d&amp;rsquo;autres sites, des sentiments textuels et des images pourraient &amp;ecirc;tre &amp;eacute;tudi&amp;eacute;s.&lt;/p&gt;

&lt;p&gt;Les chercheurs sont tr&amp;egrave;s int&amp;eacute;ress&amp;eacute;s &amp;agrave; avoir tout le domaine de premier niveau national canadien (c.‑&amp;agrave;‑d. *.ca) pour la recherche (Milligan et Smyth, 2019). Lorsque cela n&amp;rsquo;est pas possible, en raison d&amp;rsquo;un manque de ressources ou de capacit&amp;eacute; et qu&amp;rsquo;un certain sous-ensemble du domaine doit &amp;ecirc;tre s&amp;eacute;lectionn&amp;eacute; et acquis, nous devons nous assurer de saisir un ensemble de donn&amp;eacute;es aussi vaste et diversifi&amp;eacute; que possible &amp;ndash; un peu comme les principes et les m&amp;eacute;thodologies r&amp;eacute;gissant le d&amp;eacute;p&amp;ocirc;t l&amp;eacute;gal &amp;agrave; une biblioth&amp;egrave;que nationale. Mais en m&amp;ecirc;me temps, il est &amp;eacute;galement important de noter que ce ne sont pas tous les cr&amp;eacute;ateurs de contenu canadien, par exemple, qui souhaitent ou ressentent le besoin d&amp;rsquo;enregistrer leurs sites web utilisant un domaine .ca. Par cons&amp;eacute;quent, le contenu web canadien ou le contenu d&amp;rsquo;int&amp;eacute;r&amp;ecirc;t pour le Canada ne font pas tous partie du domaine .ca (Milligan et Smyth, 2019; Webster, 2019). Cela montre qu&amp;rsquo;une strat&amp;eacute;gie hybride de collecte de domaine et de ciblage de contenu pertinent &amp;agrave; l&amp;rsquo;ext&amp;eacute;rieur du domaine est id&amp;eacute;ale et n&amp;eacute;cessaire (Milligan et Smyth, 2019; Webster, 2019).&lt;/p&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;h2 style=&quot;text-align: justify;&quot;&gt;Strat&amp;eacute;gies pour documenter les &amp;eacute;v&amp;eacute;nements historiques nationaux : comment notre exp&amp;eacute;rience, &amp;agrave; ce jour, nous a-t-elle pr&amp;eacute;par&amp;eacute;s &amp;agrave; documenter la COVID-19&amp;nbsp;?&lt;/h2&gt;

&lt;p&gt;Pendant la pand&amp;eacute;mie, il &amp;eacute;tait important de g&amp;eacute;rer le travail du projet d&amp;rsquo;archivage web avec plus de pr&amp;eacute;cision pour nous assurer que nous concentrions nos ressources limit&amp;eacute;es sur les sujets et les activit&amp;eacute;s prioritaires, afin d&amp;rsquo;obtenir un rendement maximal. Pour ce faire, nous avons d&amp;eacute;velopp&amp;eacute; notre m&amp;eacute;thodologie de gestion de projets d&amp;rsquo;archivage web, bas&amp;eacute;s sur les principes de d&amp;eacute;veloppement des collections de biblioth&amp;egrave;ques, pour l&amp;rsquo;organisation et la conservation des collections d&amp;rsquo;archives web th&amp;eacute;matiques.&lt;/p&gt;

&lt;p&gt;Au d&amp;eacute;but de 2016, apr&amp;egrave;s avoir document&amp;eacute; plusieurs &amp;eacute;v&amp;eacute;nements historiques nationaux (p. ex., les feux de for&amp;ecirc;ts catastrophiques au Canada, le mouvement &amp;laquo; Idle No More &amp;raquo; en 2012, la catastrophe ferroviaire du Lac-M&amp;eacute;gantic en 2014, l&amp;rsquo;attaque sur la Colline du Parlement en 2014 et la mort de Leonard Cohen en 2016), le programme a d&amp;eacute;cid&amp;eacute; d&amp;rsquo;&amp;eacute;laborer une m&amp;eacute;thodologie pour &amp;eacute;valuer les sites web des m&amp;eacute;dias et des journaux, dans les deux langues officielles et repr&amp;eacute;sentant diff&amp;eacute;rentes perspectives politiques et r&amp;eacute;gionales. Nous avons ensuite choisi des sites web ayant un volume &amp;eacute;lev&amp;eacute; de production de contenu, qui ont d&amp;eacute;montr&amp;eacute; une architecture web qui convient&amp;nbsp;&amp;agrave; la r&amp;eacute;colte et &amp;agrave; la pr&amp;eacute;servation num&amp;eacute;rique, et qui ont &amp;eacute;galement la plus grande distribution, et nous avons commenc&amp;eacute; &amp;agrave; cibler les pages de couverture pour la collecte quotidienne :&lt;/p&gt;

&lt;table border=&quot;1&quot; cellpadding=&quot;3&quot; cellspacing=&quot;3&quot; style=&quot;height:250px;width:800px;&quot;&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td&gt;Acadie Nouvelle&lt;/td&gt;
			&lt;td&gt;Global News&lt;/td&gt;
			&lt;td&gt;La Presse&lt;/td&gt;
			&lt;td&gt;Toronto Star&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Bloomberg Canada&lt;/td&gt;
			&lt;td&gt;Globe and Mails&lt;/td&gt;
			&lt;td&gt;Le Devoir&lt;/td&gt;
			&lt;td&gt;Vancouver Sun&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;CBC&lt;/td&gt;
			&lt;td&gt;Huffington Post Canada&lt;/td&gt;
			&lt;td&gt;Le Droit&lt;/td&gt;
			&lt;td&gt;Whitehorse Daily Star&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;City News Toronto&lt;/td&gt;
			&lt;td&gt;iPolitics&lt;/td&gt;
			&lt;td&gt;National Post&lt;/td&gt;
			&lt;td&gt;Winnipeg Free Press&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;CTV News&lt;/td&gt;
			&lt;td&gt;Journal de Montreal&lt;/td&gt;
			&lt;td&gt;Radio-Canada&lt;/td&gt;
			&lt;td&gt;Macleans - COVID-19&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Financial Post&lt;/td&gt;
			&lt;td&gt;Journal de Quebec&lt;/td&gt;
			&lt;td&gt;Rabble.ca&lt;/td&gt;
			&lt;td&gt;&amp;nbsp;&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;p&gt;Cette m&amp;eacute;thode a &amp;eacute;t&amp;eacute; adopt&amp;eacute;e pour veiller &amp;agrave; ce que la chronologie historique de tout &amp;eacute;v&amp;eacute;nement historique national impr&amp;eacute;vu soit imm&amp;eacute;diatement document&amp;eacute;e &amp;agrave; mesure que les d&amp;eacute;tails apparaissent dans les m&amp;eacute;dias grand public partout au Canada. Cela a lib&amp;eacute;r&amp;eacute; du temps et des efforts au sein du programme, qui peut maintenant &amp;ecirc;tre consacr&amp;eacute; &amp;agrave; la recherche, &amp;agrave; l&amp;rsquo;&amp;eacute;valuation, &amp;agrave; la s&amp;eacute;lection et &amp;agrave; l&amp;rsquo;acquisition de ressources web plus pr&amp;eacute;cieuses au lieu de r&amp;eacute;pondre de fa&amp;ccedil;on ad hoc &amp;agrave; la collection de m&amp;eacute;dias. Au moment de la r&amp;eacute;daction du pr&amp;eacute;sent rapport, nous avons men&amp;eacute; environ 4 535 op&amp;eacute;rations techniques de collecte et d&amp;rsquo;analyse web (web archival crawls), recueillant environ 656 millions d&amp;rsquo;objets repr&amp;eacute;sentant environ 18 t&amp;eacute;raoctets de donn&amp;eacute;es, soit 25 % de nos archives totales &amp;ndash; et en croissance quotidienne.&lt;/p&gt;

&lt;p&gt;En cons&amp;eacute;quence directe, les collections d&amp;#39;&amp;eacute;v&amp;eacute;nements historiques nationaux depuis 2016 sont beaucoup plus riches et comprennent des ressources plus sp&amp;eacute;cialis&amp;eacute;es qui n&amp;#39;auraient pas &amp;eacute;t&amp;eacute; incluses et pr&amp;eacute;serv&amp;eacute;es auparavant.&lt;/p&gt;

&lt;p&gt;Le programme a commenc&amp;eacute; &amp;agrave; recueillir passivement des m&amp;eacute;dias aux premiers stades de la pand&amp;eacute;mie de COVID-19 d&amp;egrave;s qu&amp;rsquo;elle a &amp;eacute;t&amp;eacute; signal&amp;eacute;e en d&amp;eacute;cembre 2019. Cela nous a permis de d&amp;eacute;finir de fa&amp;ccedil;on beaucoup plus pr&amp;eacute;cise les objectifs de conservation des archives web sur la COVID-19 et de r&amp;eacute;fl&amp;eacute;chir plus largement aux sujets que nous voulions documenter.&lt;/p&gt;

&lt;h2 style=&quot;text-align: justify;&quot;&gt;D&amp;eacute;finir les objectifs et la port&amp;eacute;e d&amp;rsquo;une archive web sur la COVID-19&lt;/h2&gt;

&lt;p style=&quot;text-align: justify;&quot;&gt;Comme toute autre collection de biblioth&amp;egrave;ques, il est essentiel d&amp;rsquo;avoir une politique de d&amp;eacute;veloppement de la collection qui d&amp;eacute;finit les objectifs, les sous-th&amp;egrave;mes qu&amp;rsquo;elle contient, l&amp;rsquo;ordre ou la priorit&amp;eacute; du d&amp;eacute;veloppement et le degr&amp;eacute; d&amp;rsquo;exhaustivit&amp;eacute; pr&amp;eacute;vu. Pour l&amp;rsquo;archivage web et selon notre m&amp;eacute;thodologie, nous d&amp;eacute;finissons la port&amp;eacute;e (et par d&amp;eacute;finition ce qui est d&amp;eacute;lib&amp;eacute;r&amp;eacute;ment hors de port&amp;eacute;e) de chaque sous-th&amp;egrave;me, m&amp;eacute;tadonn&amp;eacute;es sp&amp;eacute;cialis&amp;eacute;es ou vocabulaire contr&amp;ocirc;l&amp;eacute; appliqu&amp;eacute;, et un aper&amp;ccedil;u du degr&amp;eacute; de contr&amp;ocirc;le de la qualit&amp;eacute; &amp;agrave; effectuer par sous-th&amp;egrave;me.&lt;/p&gt;

&lt;p&gt;En d&amp;eacute;finissant, en surveillant et en contr&amp;ocirc;lant l&amp;rsquo;effort maximal &amp;agrave; investir dans chaque sous-th&amp;egrave;me de collecte en mati&amp;egrave;re de nombre total de ressources web &amp;agrave; acqu&amp;eacute;rir, d&amp;rsquo;activit&amp;eacute;s techniques &amp;agrave; r&amp;eacute;aliser et du nombre maximal d&amp;rsquo;&amp;eacute;quivalents temps plein (ETP) &amp;agrave; investir en fonction du niveau de contr&amp;ocirc;le de la qualit&amp;eacute; assign&amp;eacute;e, les progr&amp;egrave;s peuvent &amp;ecirc;tre surveill&amp;eacute;s et ajust&amp;eacute;s au besoin. Ceci est particuli&amp;egrave;rement important pour les op&amp;eacute;rations de contr&amp;ocirc;le de la qualit&amp;eacute; pour les grandes collections puisque, comme d&amp;eacute;crit dans une pr&amp;eacute;sentation pour la conf&amp;eacute;rence annuelle d&amp;rsquo;IIPC, le&amp;nbsp;contr&amp;ocirc;le de la qualit&amp;eacute; est comme un trou noir et peut absorber des ressources infinies (Smyth 2021)&amp;nbsp;! En m&amp;ecirc;me temps, il faut demeurer flexible et &amp;ecirc;tre en mesure de s&amp;rsquo;adapter et d&amp;rsquo;accueillir de nouveaux sous-th&amp;egrave;mes &amp;agrave; mesure que l&amp;rsquo;&amp;eacute;v&amp;eacute;nement national &amp;eacute;volue et que de nouveaux contenus qui justifient la collecte sont g&amp;eacute;n&amp;eacute;r&amp;eacute;s.&lt;/p&gt;

&lt;p&gt;En termes d&amp;rsquo;acquisition de m&amp;eacute;dias sociaux et de Twitter en particulier, que nous pr&amp;eacute;f&amp;eacute;rons collecter en utilisant l&amp;rsquo;API et le logiciel ouvert &amp;laquo; Twarc &amp;raquo;, nous r&amp;eacute;alisons &amp;eacute;galement des gains d&amp;rsquo;efficacit&amp;eacute; en analysant des &amp;laquo; hashtags &amp;raquo; topiques et canadiens de premier plan, puis en les recueillant par th&amp;egrave;me en fonction du taux le plus &amp;eacute;lev&amp;eacute; de production de contenu, plut&amp;ocirc;t que de cibler les comptes. Cette m&amp;eacute;thode &amp;eacute;tait particuli&amp;egrave;rement importante pour documenter le &amp;laquo;&amp;nbsp;Convoi de la libert&amp;eacute; &amp;raquo; (&amp;laquo; Convoi de camionneurs &amp;raquo;) pendant la pand&amp;eacute;mie, o&amp;ugrave; le dialogue principal sur ces questions a eu lieu sur les m&amp;eacute;dias sociaux (Smyth, 2022b).&lt;/p&gt;

&lt;p&gt;Donc, les sujets g&amp;eacute;n&amp;eacute;raux suivants ont &amp;eacute;t&amp;eacute; d&amp;eacute;finis et document&amp;eacute;s par l&amp;rsquo;acquisition et la pr&amp;eacute;servation de ressources web pertinentes (tableau 1) :&lt;/p&gt;

&lt;div style=&quot;page-break-after: always&quot;&gt;&lt;span style=&quot;display: none;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;

&lt;table border=&quot;1&quot; cellpadding=&quot;3&quot; cellspacing=&quot;3&quot; style=&quot;height:250px;width:800px;&quot;&gt;
	&lt;caption&gt;Tableau 1. R&amp;eacute;sum&amp;eacute; des th&amp;egrave;mes document&amp;eacute;s dans la collection d&amp;rsquo;archives web de BAC sur la COVID-19&lt;/caption&gt;
	&lt;thead&gt;
		&lt;tr&gt;
			&lt;th scope=&quot;col&quot;&gt;&lt;strong&gt;Grands sous-th&amp;egrave;mes de la collection de la pand&amp;eacute;mie :&lt;/strong&gt;&lt;/th&gt;
			&lt;th scope=&quot;col&quot;&gt;&lt;strong&gt;# Ressources &lt;/strong&gt;:&lt;/th&gt;
		&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td&gt;Sciences de la sant&amp;eacute;&lt;/td&gt;
			&lt;td&gt;587&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Arts et culture&lt;/td&gt;
			&lt;td&gt;302&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Gouvernement f&amp;eacute;d&amp;eacute;ral, provincial et territorial&lt;/td&gt;
			&lt;td&gt;257&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Organismes de bienfaisance&lt;/td&gt;
			&lt;td&gt;209&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Affaires et &amp;eacute;conomie&lt;/td&gt;
			&lt;td&gt;195&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Protestations et autres points de vue (p. ex., convois de camionneurs)&lt;/td&gt;
			&lt;td&gt;141&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Sant&amp;eacute; publique r&amp;eacute;gionale&lt;/td&gt;
			&lt;td&gt;119&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Familles et &amp;eacute;ducation&lt;/td&gt;
			&lt;td&gt;115&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Religion&lt;/td&gt;
			&lt;td&gt;88&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Perspectives autochthones&lt;/td&gt;
			&lt;td&gt;35&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Total&lt;/td&gt;
			&lt;td&gt;2048&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;p&gt;En ce qui concerne les progr&amp;egrave;s et les r&amp;eacute;sultats &amp;agrave; ce jour, et au moment de la r&amp;eacute;daction, notre collection comprend actuellement (tableau 2 et figure 1) :&lt;/p&gt;

&lt;table border=&quot;1&quot; cellpadding=&quot;3&quot; cellspacing=&quot;3&quot; style=&quot;height:250px;width:800px;&quot;&gt;
	&lt;caption&gt;Tableau 2. Statistiques d&amp;rsquo;acquisition pour la collection d&amp;rsquo;archives web de BAC sur la COVID-19&lt;/caption&gt;
	&lt;thead&gt;
		&lt;tr&gt;
			&lt;th scope=&quot;col&quot; style=&quot;text-align: left;&quot;&gt;&lt;strong&gt;Activit&amp;eacute;s d&amp;rsquo;acquisition :&lt;/strong&gt;&lt;/th&gt;
			&lt;th scope=&quot;col&quot; style=&quot;text-align: left;&quot;&gt;&lt;strong&gt;Total :&lt;/strong&gt;&lt;/th&gt;
		&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td&gt;Nombre de sites de m&amp;eacute;dias acquis quotidiennement&lt;/td&gt;
			&lt;td&gt;34&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Total des ressources web s&amp;eacute;lectionn&amp;eacute;es&lt;/td&gt;
			&lt;td&gt;~2,048&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Total des documents num&amp;eacute;riques recueillis&lt;/td&gt;
			&lt;td&gt;~478 millions&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Donn&amp;eacute;es totales recueillies&lt;/td&gt;
			&lt;td&gt;~16 TO&lt;/td&gt;
		&lt;/tr&gt;
		&lt;tr&gt;
			&lt;td&gt;Tweets saisis pour la collecte li&amp;eacute;e &amp;agrave; la COVID-19&lt;/td&gt;
			&lt;td&gt;~3,83 millions&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;

&lt;address&gt;&amp;nbsp;&lt;/address&gt;

&lt;p style=&quot;text-align: center;&quot;&gt;Figure 1. Distribution de ressources d&amp;#39;archives web par documents recueillis pour la collection BAC COVID-19&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;https://www.numerev.com/img/ck_234_1_image-20220929051235-1.png&quot; /&gt;&lt;/p&gt;

&lt;address style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;&lt;/address&gt;

&lt;h2 style=&quot;text-align: justify;&quot;&gt;Aider les chercheurs &amp;agrave; utiliser les archives web : vers un instrument de recherche d&amp;rsquo;archives web pour les collections complexes (comme la COVID-19)&lt;/h2&gt;

&lt;p&gt;&lt;q&gt;A surefire way for a historian to recognize the value of the archival or library profession is to suddenly be confronted with the vast data of a web archive. Many of the problems confronting a web archive researcher result from suddenly not having the professional framework and infrastructure from which historians studying earlier time periods benefitted&lt;/q&gt;&amp;nbsp;(Milligan, 2019, p. 213).&lt;/p&gt;

&lt;p&gt;&amp;Eacute;tant donn&amp;eacute; notre r&amp;ocirc;le historique dans l&amp;rsquo;organisation, la compr&amp;eacute;hension et l&amp;rsquo;utilisation des ressources de recherche, comment les biblioth&amp;eacute;caires et archivistes num&amp;eacute;riques travaillant comme sp&amp;eacute;cialistes de la pr&amp;eacute;servation et conservation num&amp;eacute;rique peuvent-ils aider les chercheurs de la prochaine g&amp;eacute;n&amp;eacute;ration &amp;agrave; acc&amp;eacute;der aux donn&amp;eacute;es brutes et aux archives web, c.-&amp;agrave;-d. aux donn&amp;eacute;es qui deviendront in&amp;eacute;vitablement la principale source pour les historiens des XXe et XXIe si&amp;egrave;cles&amp;nbsp;?&lt;/p&gt;

&lt;p&gt;Comme r&amp;eacute;ponse pr&amp;eacute;liminaire, et comme &amp;eacute;volution de la politique de d&amp;eacute;veloppement de la collection th&amp;eacute;matique web, nous avons voulu transformer ce document interne sur la gestion du projet en un outil de recherche d&amp;rsquo;archives web pour le chercheur, et le publier avec la collection web par l&amp;rsquo;entremise du portail d&amp;rsquo;acc&amp;egrave;s public des Archives web du gouvernement du Canada.&lt;/p&gt;

&lt;p&gt;Ce court document pourrait alors servir de guide &amp;agrave; la collection d&amp;rsquo;archives web et aux donn&amp;eacute;es th&amp;eacute;matiques pour tout chercheur potentiel. Il fournirait une d&amp;eacute;finition des th&amp;egrave;mes que nous essayons de documenter, toutes les m&amp;eacute;tadonn&amp;eacute;es sp&amp;eacute;cialis&amp;eacute;es qui pourraient &amp;ecirc;tre utilis&amp;eacute;es pour faciliter la recherche en texte int&amp;eacute;gral (p. ex., par Library of Congress Subject Headings (LCSH) et&amp;nbsp;par la terminologie descriptive sensible et faisant partie int&amp;eacute;grante des ressources autochtones dans le cas des archives web de la Commission de v&amp;eacute;rit&amp;eacute; et r&amp;eacute;conciliation), un niveau de contr&amp;ocirc;le de la qualit&amp;eacute; attribu&amp;eacute; par th&amp;egrave;me est &amp;agrave; pr&amp;eacute;voir, la liste compl&amp;egrave;te des &amp;laquo; graines d&amp;rsquo;archivage web &amp;raquo; (web archiving seeds, c.-&amp;agrave;-d. les adresses des sites web &amp;agrave; collecter), ainsi que les tableaux de distribution des ressources par langue.&lt;/p&gt;

&lt;p&gt;L&amp;rsquo;instrument de recherche des archives web devrait &amp;eacute;clairer le chercheur en sciences humaines num&amp;eacute;riques et en histoire num&amp;eacute;rique d&amp;rsquo;un coup d&amp;rsquo;&amp;oelig;il et r&amp;eacute;pondre &amp;agrave; la question suivante : &amp;laquo; Cet ensemble de donn&amp;eacute;es ou cette collection d&amp;rsquo;archives Web seront-ils utilis&amp;eacute;s comme principale source historique pour ma question de recherche? &amp;raquo; -- sans avoir &amp;agrave; faire de recherche sur la source pour d&amp;eacute;terminer quels types de ressources ont &amp;eacute;t&amp;eacute; saisies, et/ou pour d&amp;eacute;terminer dans quelle mesure l&amp;rsquo;ensemble de donn&amp;eacute;es est complet ou repr&amp;eacute;sentatif. Nous pourrions ensuite faire &amp;eacute;voluer le projet et ce document au fil du temps, en ajuster la port&amp;eacute;e &amp;agrave; mesure que de nouvelles ressources sont g&amp;eacute;n&amp;eacute;r&amp;eacute;es et que de nouvelles questions pertinentes se posent, et documenter la collection et ce qu&amp;rsquo;elle offre aux chercheurs.&lt;/p&gt;

&lt;p&gt;Il convient &amp;eacute;galement de souligner que cette m&amp;ecirc;me m&amp;eacute;thodologie est actuellement appliqu&amp;eacute;e &amp;agrave; la documentation et aux r&amp;eacute;actions du Canada aux enjeux actuels en Ukraine.&lt;/p&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;h2&gt;Conclusion&lt;/h2&gt;

&lt;p&gt;De nombreux efforts sont en cours pour &amp;eacute;liminer les d&amp;eacute;pendances techniques &amp;agrave; l&amp;rsquo;utilisation informatique des archives web comme donn&amp;eacute;es et comme ressources textuelles pour la recherche.&lt;/p&gt;

&lt;p&gt;Comme premier exemple, l&amp;rsquo;int&amp;eacute;gration des outils logiciels du projet &amp;laquo; Archives Unleashed &amp;raquo; et le partenariat entre ce groupe et Internet Archive, permet d&amp;eacute;sormais d&amp;rsquo;introduire :&lt;/p&gt;

&lt;p&gt;&lt;q&gt;ARCH (Archives Research Compute Hub), the first cloud-based system designed from scratch to meet all of these six key principles [of Archive, Big Data, Concurrent, Distributed, Efficient, Flexible]. ARCH is an interactive interface, closely connected with Archive-It, engineered to provide analytical actions, specifically generating datasets and in-browser visualizations. It efficiently streamlines research workflows while eliminating the burden of computing requirements [for researchers]. Building off past work by both the Internet Archive (Archive-It Research Services) and the Archives Unleashed Project (the Archives Unleashed Cloud), this merged platform achieves a scalable processing pipeline for web archive research&amp;hellip;ARCH&amp;rsquo;s interface consists of four levels. These guide users to interact with their collections by generating datasets for analysis and engaging with in-browser features. The goal of ARCH is to provide an efficient, streamlined workflow without burdening users with computing requirements or actions&amp;hellip;ARCH has been designed as an integrated component of Archive-It&lt;/q&gt;&amp;nbsp;(Holzmann et al., 2022, p. 1; 6-9).&lt;/p&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;p&gt;Ce d&amp;eacute;veloppement passionnant fera &amp;agrave; son tour partie de la prestation de services qui sera d&amp;eacute;sormais disponible pour les institutions qui utilisent la plateforme Archive-IT.&lt;/p&gt;

&lt;p&gt;Bien que les m&amp;eacute;thodologies de &amp;laquo; r&amp;eacute;ponse rapide &amp;raquo; existaient d&amp;eacute;j&amp;agrave;, pendant la pand&amp;eacute;mie de 2019, l&amp;rsquo;archivage Web est devenu une priorit&amp;eacute; strat&amp;eacute;gique et une m&amp;eacute;thodologie pour la saisie, l&amp;rsquo;organisation et la conservation num&amp;eacute;rique, et la d&amp;eacute;couverte et l&amp;rsquo;acc&amp;egrave;s &amp;agrave; des ressources du web qui constituent la principale source et la preuve de l&amp;rsquo;impact historique national de la COVID-19 sur chaque nation. C&amp;rsquo;est devenu une priorit&amp;eacute; d&amp;rsquo;action en reconnaissance du fait que les documents d&amp;rsquo;archives et les publications pourraient autrement prendre un temps ind&amp;eacute;termin&amp;eacute; &amp;agrave; produire et &amp;agrave; devenir accessibles aux chercheurs.&lt;/p&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;h2 style=&quot;text-align: justify;&quot;&gt;Remerciements&lt;/h2&gt;

&lt;p&gt;L&amp;rsquo;auteur tient &amp;agrave; remercier les membres de l&amp;rsquo;&amp;eacute;quipe du Programme de pr&amp;eacute;servation du web et des m&amp;eacute;dias sociaux et la section d&amp;rsquo;Int&amp;eacute;gration num&amp;eacute;rique pour leur professionnalisme, leur d&amp;eacute;vouement et leur travail acharn&amp;eacute; dans l&amp;rsquo;&amp;eacute;laboration du programme d&amp;rsquo;archivage web &amp;agrave; BAC pendant la pand&amp;eacute;mie et depuis 2009.&lt;/p&gt;

&lt;p&gt;&amp;nbsp;&lt;/p&gt;

&lt;h2 style=&quot;text-align: justify;&quot;&gt;R&amp;eacute;f&amp;eacute;rences bibliographiques&lt;/h2&gt;

&lt;p&gt;Holzmann, Helge, Nick Ruest, Jefferson Bailey, Alex Dempsey, Samantha Fritz, Peggy Lee et Ian Milligan (2022). &lt;em&gt;ABCDEF - The 6 key features behind scalable, multi-tenant web archive processing with ARCH: Archive, Big Data, Concurrent, Distributed, Efficient, Flexible. JCDL &amp;rsquo;22: Proceedings of the 22nd ACM/IEEE Joint Conference on Digital Libraries, June 20-24 2022, Cologne, Germany, article no 13.&lt;/em&gt; DOI: &lt;a href=&quot;https://doi.org/10.1145/3529372.3530916&quot;&gt;https://doi.org/10.1145/3529372.3530916&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Justice Canada (2022). &lt;em&gt;Loi sur la Biblioth&amp;egrave;que et les Archives du Canada (L.C. 2004, ch. 11).&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;https://laws-lois.justice.gc.ca/fra/lois/l-7.7/index.html&quot;&gt;https://laws-lois.justice.gc.ca/fra/lois/l-7.7/index.html&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Milligan, Ian (2019). &lt;em&gt;History in the age of abundance? How the Web is transforming historical research.&lt;/em&gt; Montr&amp;eacute;al et Kingston, McGill-Queen&amp;rsquo;s University Press.&lt;/p&gt;

&lt;p&gt;Milligan, Ian et Tom J. Smyth (2019). Studying the web in the shadow of Uncle Sam: The case of the .ca domain. In: Niels Br&amp;uuml;gger et Ditte Laursen (dir.), &lt;em&gt;The historical web and digital humanities: The case of national web domains&lt;/em&gt;. London, Routledge, 45-63.&lt;/p&gt;

&lt;p&gt;Smyth, Tom J. (2022a). &lt;em&gt;Rapid response methodologies and projects: Documenting national historic events at Library and Archives Canada.&lt;/em&gt; International Internet Preservation Consortium Annual Web Archiving Conference 2022.&lt;/p&gt;

&lt;p&gt;Smyth, Tom J. (2022b). &lt;em&gt;Program policy and methodology for the acquisition of social media at Library and Archives Canada&lt;/em&gt;. International Internet Preservation Consortium Workshop: Archiving Social Media 2022.&lt;/p&gt;

&lt;p&gt;Smyth, Tom J. (2021). &lt;em&gt;The black hole of quality control: Toward a framework for managing QC effort to ensure value.&lt;/em&gt; International Internet Preservation Consortium Annual Web Archiving Conference 2021.&lt;/p&gt;

&lt;p&gt;Webster, Peter (2019). Understanding the limitations of the ccTLD as a proxy for the national web: Lessons from cross-border religion in the northern Irish web sphere. In: Niels Br&amp;uuml;gger et Ditte Laursen (dir.), &lt;em&gt;The historical web and digital humanities: The case of national web domains&lt;/em&gt;. London, Routledge, 110-123.&lt;/p&gt;