
En coulisse
Le scandale des deepfakes pédopornographiques de Grok et ses conséquences
par Florian Bodoky

Archive.today archive des pages web depuis des années, sans compromis, dans l’anonymat et avec une brillance technique remarquable. Le service est considéré par beaucoup comme un contourneur de paywalls, mais son opérateur détourne désormais les navigateurs de ses visiteurs pour mener des attaques DDoS.
Tout commence de manière anodine. Un lien, un clic, et un article normalement protégé par un paywall apparaît, proprement archivé, intégralement lisible, comme si c’était la chose la plus naturelle du monde. À ne pas confondre avec la Wayback Machine d’archive.org : celle-ci respecte les demandes d’exclusion et supprime les contenus sur demande. Archive.today ne propose pas de telles possibilités d’exclusion, en l’état actuel. Le service archive des pages web de manière systématique et à grande échelle depuis 2012. Un inconnu fait vivre cette archive.
Son anonymat reste intact pendant plus d’une décennie avant qu’une ordonnance du FBI fasse surface. Un avertissement rompt le silence. En janvier 2026, il s’avère que l’opérateur ne se contente pas d’archiver, mais qu’il utilise aussi son infrastructure pour mener des cyberattaques, et que les navigateurs de ses visiteurs ont été embrigadés « à leur insu » dans ces attaques.
Archive.today a des airs d’outil venu d’une autre époque. Un lien en entrée, un article complet en sortie, peu importe s’il y a un paywall ou pas. Le service voit le jour sous le nom archive.is en 2012. Il est enregistré au nom d’un certain Denis Petrov. Un nom qui ne permet aucune identification vérifiable. Les recherches mènent à des domaines d’origine incertaine, des forums russes, des schémas linguistiques allemands, des adresses IP berlinoises et une piste OSINT vers un contributeur NixOS utilisant le pseudonyme « volth », autant de traces impossibles à vérifier. Ces liens sont décrits par le développeur et auteur Jani Patokallio dans son analyse de 2023 (en anglais), qui reste à ce jour l’enquête technique la plus détaillée sur archive.today.
Ce que l’on sait avec certitude, c’est que derrière archive.today, il n’y a ni équipe, ni fondation, ni entreprise. C’est le projet d’un seul homme, qui travaille à l’archivage de contenus depuis plus d’une décennie et qui, récemment, est entré en conflit avec un propriétaire de site web et des médias.
Sur le plan technique, archive.today impose le respect. Selon Jani Patokallio, l’opérateur utilise Hadoop, Accumulo et HDFS, des outils de big data qui tournent habituellement dans des entreprises, pas au sein d’un projet porté par une seule personne. L’archive s’appuie sur deux centres de données européens, avec une triple redondance pour le texte et une double pour les images. En 2012, le volume atteint 10 téraoctets ; en 2021, c’est déjà un pétaoctet.
L’étape décisive se joue au niveau du scraping. Depuis 2021, archive.today utiliserait un système distribué composé de nombreuses instances Chrome automatisées, qui chargent les pages comme de simples appels de navigateur, mais à un rythme effréné et depuis des réseaux en rotation permanente. Ces instances changent d’adresse IP, récupèrent les pages de manière automatisée et contournent au passage les paywalls côté client. Jani Patokallio parle d’un botnet, l’opérateur d’archive.today le conteste. Au bout du compte, il s’agit d’un système distribué qui se comporte comme un botnet et qui peut devenir un « problème » tout aussi réel pour les propriétaires de sites web.
L’exploitation coûte cher. L’espace de stockage à cette échelle a un prix, les serveurs ont un prix, la bande passante a un prix. Selon Jani Patokallio, l’opérateur affirmait en 2023 que les dons et la publicité couvraient moins de 20 % des coûts. Il le cite en déclarant qu’il ne pouvait « plus recharger » PayPal, ce qui pourrait indiquer qu’il opère depuis un pays coupé du système de paiement international. Ne restent alors que des services comme Liberapay et BuyMeACoffee. Jani Patokallio soupçonne l’existence d’une autre source de revenus. L’opérateur, lui, garde le silence.
Fin octobre 2025, après un long silence, un unique post, depuis supprimé, apparaît sur le compte X officiel de l’opérateur d’archive.today. Ironie du sort, son bref message reste archivé et accessible sur archive.today. L’opérateur utilise rarement ce canal, et ses publications précédentes semblent liées à des événements ponctuels. Cette fois, il écrit, en référence au canari que l’on envoyait autrefois dans les mines pour détecter les gaz dangereux :
« canary: https://pdflink.to/1e0e0ecd/ »
Le lien mène à une ordonnance judiciaire (archivée et accessible ici) obtenue par le FBI. Elle enjoint le fournisseur canadien Tucows de transmettre des données exhaustives sur le client qui se cache derrière archive.today, notamment les coordonnées et données de connexion, les informations de paiement et les identifiants techniques.
Les raisons pour lesquelles l’opérateur partage ce lien restent obscures. Les « canary posts » sont traditionnellement utilisés lorsque les personnes concernées ne peuvent pas ou ne veulent pas s’exprimer ouvertement sur des enquêtes en cours. Impossible de vérifier si c’est le cas ici. Une chose est sûre, l’opérateur associe cette procédure à une menace. Son anonymat vacille.
Le 28 janvier 2026, il publie un billet sur Tumblr (en anglais) au sujet des médias allemands, des paywalls, du « Teutonic order » et des « hookers ». Dans ce billet, il évoque l’affaire Hunter Biden pour illustrer comment la publication de contenus privés ou embarrassants peut servir à discréditer publiquement des personnes. Il se plaint des demandes de suppression et affirme que les contenus les plus dangereux ne sont pas de nature politique, mais relèvent du scandale personnel.
Un second billet Tumblr suit peu après. L’opérateur y prétend qu’une interview avec la Legal Tribune aurait été « étouffée » et en fournit les raisons. Il se décrit comme quelqu’un dont le point de vue n’est pas entendu et affirme que ce n’est pas archive.today qui menace le modèle économique des médias allemands. Ceux-ci se mettraient eux-mêmes en danger, car chaque article consacré aux paywalls ne ferait qu’attirer l’attention sur la possibilité de les contourner. L’Allemagne disposerait de toute façon d’un système de bibliothèques « supérieur à tout paywall », et quiconque chercherait le problème du côté des archives n’aurait rien compris au principe.
Dans le même billet, il fait dévier le débat sur le terrain personnel. Il affirme que les médias allemands voudraient avant tout supprimer de l’archive les articles qu’ils ont eux-mêmes retirés, des histoires de familles fortunées, de réputations entachées et de « wayward scions ». Le ton devient plus belliqueux.
Durant cette phase, l’opérateur commence également à bloquer des groupes de presse de manière ciblée, notamment Condé Nast et Heise, dont il exclut les réseaux d’entreprise et les serveurs de messagerie de l’accès à archive.today en blocant leurs IP.
Parallèlement à ses prises de position publiques, l’opérateur s’adresse directement à ses détracteurs. Cela commence le 8 janvier 2026, lorsque Jani Patokallio reçoit une demande fondée sur le Règlement général sur la protection des données européen, déposée par une certaine Nora Puchreiner. Deux jours plus tard, un e-mail personnel de l’opérateur lui-même suit, dans lequel il demande que l’article de 2023 soit mis hors ligne « pour quelques mois ».
Lorsque Jani Patokallio répond, le ton bascule. Les messages suivants proviennent à nouveau de Nora Puchreiner. Au même moment, un utilisateur nommé « rabinovich » apparaît sur Hacker News, un pseudonyme que des observateurs associent à archive.today. Depuis la France, l’organisation WAAD se manifeste, proposant son « aide » et mettant en jeu des vérifications d’identité.
Jani Patokallio décrit la chronologie de ces événements en détail dans un billet de blog du 1er février 2026 (en anglais). Il y reconstitue le déroulement des faits, cite les messages reçus et documente l’escalade du conflit.
Un billet Tumblr du 4 février (en anglais) montre à quel point le conflit est devenu personnel. L’opérateur s’en prend directement à Jani Patokallio, fabule sur ses prétendus liens familiaux, lui prête des motivations politiques et économiques et le qualifie de personne qui « doxe pour des clics ». Une attaque qui en dit davantage sur l’escalade du conflit que sur Jani Patokallio lui-même. Les propos se durcissent, les positions deviennent plus contradictoires et la communication de l’opérateur paraît de plus en plus confuse.
En quelques jours se dessine le portrait d’un opérateur dont la communication s’intensifie fortement, entre expéditeurs changeants, rôles différents, déclarations contradictoires et un ton de plus en plus agressif.
Aux alentours du 11 janvier 2026, archive.today commence à enrôler ses visiteurs dans une attaque. Selon les observations actuelles, celle-ci semble désormais terminée. Une page captcha intégrée au site exécute automatiquement un extrait de code JavaScript au chargement. Ce script amène le navigateur à envoyer, à l’insu de l’internaute, des requêtes répétées vers le site de Jani Patokallio, gyrovague.com (en anglais). Chaque requête est assortie d’un paramètre aléatoire afin d’empêcher qu’elle soit traitée à partir du cache. Le script définit un intervalle de 300 millisecondes.
C’est un mécanisme DDoS classique. Un site web n’est pas submergé par un seul coup massif, mais par un flot de petites requêtes qui s’accumulent jusqu’à former une vague. Ici, cette vague ne provient pas de bots, mais de véritables êtres humains dont les navigateurs servent d’amplificateurs à leur insu.
Jani Patokallio analyse le code directement dans le HTML de la page captcha et décrit avec quelle précision l’attaque vise son blog. Il constate que le code a été implémenté de manière délibérée. Dans plusieurs pays européens, une zone grise juridique se forme, car en théorie, les internautes pourraient se retrouver en situation de complicité dès lors qu’ils prennent conscience que leur navigateur participe à une attaque, même si des poursuites pénales sont jugées peu probables.
Peu après, un utilisateur publie (en anglais) sur l’instance Mastodon infosec.exchange une correspondance par e-mail avec l’opérateur d’archive.today. L’opérateur y justifie à nouveau l’attaque en affirmant que le site de Jani Patokallio le « doxe », et déclare qu’il ne veut pas le « DDoSer pour tuer, mais seulement faire grimper la facture d’hébergement ».
Jani Patokallio explique pour sa part que l’attaque ne lui coûte rien financièrement, puisque son hébergement est facturé au forfait et que des bloqueurs de publicité comme uBlock Origin bloquent désormais de toute façon les requêtes en question.
Le baiser quotidien de la muse stimule ma créativité. Si elle m’oublie, j’essaie de retrouver ma créativité en rêvant pour faire en sorte que mes rêves dévorent ma vie afin que la vie ne dévore mes rêves.
Des informations intéressantes sur le monde des produits, un aperçu des coulisses des fabricants et des portraits de personnalités intéressantes.
Tout afficher