Leçon sur les fondamentaux et l’archivage du Web pour les historien(ne)s.
Cette leçon enseigne les fondamentaux des technologies du Web aux historiens et historiennes à l’aide d’une étude de cas qui consiste à comparer deux sites, créés en 2000 et en 2009, ayant pour objet l’ensemble d’entretiens menés par le psychologue David Boder. La leçon explore ensuite comment les historien(ne)s utilisent les archives Web et les défis que leur pose ce travail.
Un exposé filmé de dix minutes propose une introduction aux fondamentaux des technologies du Web. Ensuite, une série d’exercices retracent l’histoire du Web, montrent les technologies sur lesquelles il repose et expliquent comment utiliser les archives du Web.
Lars Wieneke about changes in web technology
Dans la vidéo ci-dessus, l’ingénieur Lars Wieneke explique comment, au fil du temps, les technologies du Web ont de plus en plus augmenté la portée et l’échelle des données pouvant être partagées et publiées sur le Web. Afin d’illustrer ces changements, il analyse en profondeur les deux sites Web créés en 2000 et en 2009 et consacrés à la collection d’interviews menées par le psychologue David Boder, cette analyse étant par ailleurs le thème d’une autre leçon sur Ranke.2.
Pour appliquer la critique des sources à un site Web, il est impératif de comprendre les interférences apportées par des logiciels ou des langages comme XML (Extensible Markup Language) et PHP (Hypertext Preprocessor). Toutefois, en tant qu’historien(ne)s, nous devrions d’abord situer le thème dans son contexte historique : comment les sites Web ont-ils commencé à évoluer et quelles technologies étaient requises pour les faire fonctionner ? Ces prochains exercices nous donneront un bref aperçu de l’histoire du Web et des développements technologiques qui le font fonctionner. Ensuite, ils examineront plus en détail les différences entre le Web et Internet, avant de nous faire découvrir l’infrastructure physique qui permet au monde d’être partout connecté.
Nous vous proposons de regarder ce documentaire de 35 minutes réalisé par la Web Foundation sur la façon dont Tim Berners Lee a créé le World Wide Web.
Comme expliqué dans la vidéo de Lars Wieneke, les sites Web qui ont été consacrés à David Boder en 2000 et en 2009 présentent des différences dues aux nouvelles technologies apparues entre ces deux années. La plus vieille version, mise en ligne en 2000, n’existe plus sur le Web « vivant », mais une comparaison entre cette version et la version plus récente, de 2009, est possible grâce au Web archivé. Dans cet exercice, vous apprendrez les bases du Web archivé et vous familiariserez avec l’une des ressources les plus populaires et utiles pour accéder aux pages du Web archivé : la Wayback Machine, mise à disposition par Internet Archive. Vous découvrirez aussi les défis et les limites de l’archivage du Web du point de vue d’un historien.
Voyez ici une version archivée du tout premier site Web, créé en 1991 par Tim Berners-Lee et archivé par le CERN en Suisse :
Heureusement, Internet Archive n’est pas la seule institution qui vise à archiver le Web. Plusieurs autres s’en chargent à plus petite échelle, en général concernant les sites Web considérés comme importants ou pertinents pour le pays en question. Des pays européens tels que la Finlande, la France, l’Irlande, l’Espagne ou la Suède ont même instauré le dépôt légal pour les sites Web de leur domaines nationaux respectifs. Nous pouvons évoquer à cet égard les exemples du Royaume-Uni, du Danemark et de la France.
L’archivage de la totalité du Web n’a cependant rien de facile. La croissance exponentielle des contenus en ligne, surtout depuis les années 2000, rend impossible pour les départements d’archivage et les organisations d’archiver chaque site Web et ses diverses versions apparues au fil du temps. Bien que ces institutions aient accru leur expertise technologique, une diminution de l’activité au niveau national peut être observée, menant à une plus forte dépendance à Internet Archive. Ce n’est heureusement pas le cas au Luxembourg, où la Bibliothèque nationale du Luxembourg (BnL) a été chargée d’archiver le Web luxembourgeois depuis 2016.
L’acte d’archiver n’est pas motivé uniquement par des préoccupations neutres liées à la préservation. Il a sa place parmi les moyens de prolonger et de renforcer l’identité, le statut et la position. Selon Janne Nielsen, qui proposes une distinction claire entre l’archivage macro et micro, il est important de différencier, par exemple, une puissante institution qui élabore une stratégie de préservation pour la postérité avec un large futur public imaginaire en tête (macro), et une scientifique arrivée au terme d’un projet financé et qui réussit à conserver ses données en vue de les utiliser ultérieurement dans sa carrière universitaire (micro). Dans le cas de l’Union européenne (ci-après UE), comme les exemples suivants le montrent, la préservation obéit aussi à des impératifs de transparence sur la façon de prendre les décisions ou sur la façon dont les cadres juridiques conçus pour protéger les citoyens et leur héritage culturel évoluent avec le temps. L’étude de cas présentée ici – comment l’UE gère la préservation de ses archives Web – est un exemple de macroarchivage. Le « niveau » de l’archivage dans ce contexte doit être gardé à l’esprit d’un bout à l’autre de l’exemple.
La création de sites Web est devenue de plus en plus facile pour les personnes sans connaissances technologiques, qui peuvent profiter de solutions faciles à prendre en main ou encore des applications au code source ouvert. C’est pourquoi le nombre de sites Web proposant des contenus historiques se trouve en augmentation constante. Les gens qui montent de tels sites Web sont souvent des amateurs désireux de partager leur passion pour un sujet, ou des parents d’une génération plus ancienne qui veulent préserver la trace d’un évènement ou d’une ère qu’ils jugent importants. Les sujets traités sont souvent de portée locale : le paysage, le village, la ville ou le quartier. Toutefois, les expériences les plus documentées peuvent porter sur des expériences telles que les migrations ou les guerres. La pratique qui consistait jadis à se transmettre des albums de photos de famille d’une génération à l’autre se transforme lorsqu’il s’agit d’un patrimoine familial numérique. Comment faudrait-il préserver pour l’avenir les sites ou pages Web, ayant une pertinence historique potentielle, qui ne sont pas intégrés dans un cadre institutionnel ou encore des contenus publiés sur des plateformes de réseaux sociaux ? À partir de l’étude de cas ci-dessous, nous vous proposons d’explorer quelques stratégies de microarchivage.