Abonnez-vous pour recevoir des notifications sur les nouveaux articles :

Contribuer à la protection des journalistes et de l'actualité locale contre les robots d'indexation IA avec le projet Galileo

2025-09-23

Lecture: 5 min.
Cet article est également disponible en English, en Deutsch, en 日本語, en 한국어, en Español, en Indonesia, en Tiếng Việt, en Nederlands, en ไทย et en 繁體中文.

Nous nous réjouissons d'annoncer que le projet Galileo inclura désormais l'accès aux services de gestion des bots et au service AI Crawl Control proposés par Cloudflare. Les participants au programme, qui réunit approximativement 750 journalistes, organismes de presse indépendants et autres organisations à but non lucratif soutenant la collecte d'informations à travers le monde, disposeront désormais de la capacité de protéger leurs sites web contre les robots d'exploration IA. Gratuitement. 

Le projet Galileo est un programme gratuit conçu par Cloudflare afin de protéger la présence en ligne des voix civiques importantes. Lancé en 2014, il réunit aujourd'hui plus de 3 000 organismes répartis dans 125 pays. Il a également servi de base pour les autres programmes Cloudflare gratuits créés pour contribuer à protéger le processus électoral démocratique, les écoles publiques, les établissements de santé publics et d'autres éléments d'infrastructure essentiels.  

Si nous pensons que tous les participants au projet Galileo tireront à coup sûr un avantage de ces services gratuits supplémentaires, nous considérons ces derniers comme essentiels pour la presse. 

Les organes de presse, notamment ceux qui opèrent au niveau local, font face à des défis considérables lors de la transition vers le web piloté par IA. Plus les utilisateurs s'en remettent aux modèles IA pour obtenir des informations, plus la quantité de trafic vers les sites web sur lesquels ces informations ont été publiées à l'origine diminue. Les secteurs qui dépendent du trafic utilisateur pour générer des revenus, comme les agences de presse, sont ainsi de plus en plus exposés. 

La possibilité de permettre aux organes de presse de surveiller et de contrôler la manière dont les robots d'exploration IA interagissent avec leurs sites web les aidera à mieux protéger leur contenu et à prendre des décisions plus éclairées concernant les interactions avec les entreprises de développement d'IA. En fin de compte, notre objectif consiste à proposer les outils qui permettront aux organismes de presse de négocier une rémunération équitable pour leur travail.  

Le trafic et la presse

L'IA transforme radicalement la manière dont le trafic circule sur Internet. Cloudflare a récemment publié des données qui montrent que depuis l'arrivée d'OpenAI, il est devenu 750 fois plus difficile pour les propriétaires de sites web d'obtenir le même volume de trafic qu'avec le système précédent des recherches Google. Ce chiffre passe à une difficulté 30 000 fois supérieure avec Anthropic. 

Les organes de presse dépendent non seulement du trafic pour entrer et rester en contact avec leurs lecteurs, mais également pour générer des revenus par l'intermédiaire des abonnements, de la publicité, de l'e-commerce et de l'octroi de licences. Le CEO du Financial Times a récemment déclaré que l'IA avait entraîné une baisse « assez soudaine et prolongée » de 25 % à 30 % du trafic vers ses articles en provenance des moteurs de recherche. 

Ces chutes potentielles de trafic utilisateur et de revenus surviennent à un moment déjà précaire pour le secteur de la presse. Il a clairement été démontré que les petits journaux indépendants et les stations de radio d'informations du même format subissent des pressions financières importantes et constantes, notamment aux États-Unis. Selon un récent témoignage du Congrès américain, plus de deux journaux ont fermé chaque semaine en 2024. En outre, il était prévu qu'un tiers des journaux du pays cessent leurs activités avant le début de l'année 2025. Un rapport de 2024 publié par la Northwestern Local News Initiative signalait que plus de 206 comtés américains ne disposaient pas d'une source d'informations locale et que 1 561 n'en avaient qu'une.  

Les récentes réductions concernant le financement de la Corporation for Public Broadcasting et de la National Public Radio (la Corporation de l'audiovisuel public et la Radio publique nationale), qui aidaient les stations d'information publiques à travers les États-Unis sous la forme de subventions, de programmes et d'autres formes de soutien, ont mis ces organismes à rude épreuve et d'autres cessations d'activité sont attendues

Redonner le contrôle aux journalistes

Une première étape cruciale sur la voie de l'adaptation au web piloté par IA consiste à proposer des outils permettant aux journalistes et aux organes de presse de surveiller et de contrôler l'accès des modèles IA à leur contenu. 

« Dans une ère définie par l'IA et la révolution numérique, la fourniture d'outils robustes aux médias indépendants ne constitue pas seulement un soutien, mais une véritable bouée de sauvetage », déclare Meera Selva, CEO d'Internews Europe.

« Les éditeurs indépendants ont besoin d'outils abordables et faciles à utiliser afin de pouvoir se concentrer sur le développement de leur activité. LION est reconnaissante à Cloudflare pour la sécurité et la protection qu'elle fournit depuis des années à ses membres par le biais du projet Galileo. Nous sommes ravis de voir que davantage de ressources sont désormais disponibles pour aider les membres à faire face au panorama rapidement changeant de la sécurité numérique. »  — Sarah Gustavus Lim, Membership Director, LION 

La solution de gestion des bots Bot Management et le service AI Crawl Control développés par Cloudflare ont été conçus précisément dans cette optique. Notre outil de sécurité Bot Management fait appel à l'apprentissage automatique (Machine Learning) pour analyser le trafic web et distinguer les bots utiles (comme les robots d'indexation utilisés par les moteurs de recherche) des bots nuisibles, qui s'attaquent aux sites web ou dérobent des identifiants. Il permet ainsi aux propriétaires de sites web d'empêcher les bots malveillants d'accéder à leurs sites, tout en s'assurant que les bots utiles puissent poursuivre leurs tâches.

Le service AI Crawl Control propose des outils similaires permettant d'identifier et de gérer les robots d'exploration IA. Cloudflare s'appuie sur diverses techniques pour identifier et catégoriser les robots d'exploration (en-tête HTTP, heuristique et autres études du comportement) afin de permettre aux propriétaires de sites web d'analyser leur activité en fonction du type de bot (p. ex. bot de recherche IA, extracteur de contenu IA), de leur provenance (Google, OpenAI, Anthropic, etc.), et des contenus auxquels ils accèdent. Voici un exemple des données que l'outil Cloudflare AI Crawl Control peut proposer (nous utilisons ici le domaine radar.cloudflare.com) :

Cloudflare associe ces informations à des mesures de contrôle faciles à utiliser, conçues pour permettre aux propriétaires de sites web de prendre des décisions éclairées quant au choix de mettre ou non leurs données à disposition, en incluant également la possibilité de laisser ou de refuser l'accès à certains types de bots ou à des entreprises de développement d'IA spécifiques. Cette démarche pourrait, par exemple, permettre à un journal local de décider de bloquer l'ensemble des robots d'exploration IA et de maintenir la connexion directe avec ses lecteurs par l'intermédiaire de son propre site web, de ne bloquer que les bots d'extraction utilisés par l'IA, tout en autorisant les robots d'exploration IA qui renvoient du trafic, ou de négocier et de vendre un accès exclusif à son contenu à une entreprise d'IA unique. L'image suivante montre de quelle manière le service AI Crawl Control permet aux utilisateurs d'autoriser ou de bloquer l'accès pour chaque robot :

Nous pensons que la capacité de contrôler et de surveiller l'activité des robots d'exploration IA apportera une aide immédiate aux organes de presse qui cherchent à protéger leur contenu et à mieux comprendre la manière dont les modèles utilisent leurs données. 

Nous pensons également qu'elle proposera des informations à plus long terme qui permettront aux organismes de presse de négocier, au fil du temps, des relations mutuellement profitables avec les entreprises de développement d'IA.  

« La capacité des médias indépendants à remplir leur fonction démocratique en collectant des informations et en diffusant des informations fiables dépend de leur capacité à générer des revenus libres de toute influence politique ou commerciale. « En surveillant et en monétisant l'indexation des sites des éditeurs, les médias peuvent protéger leur propriété intellectuelle, tout en développant de nouvelles sources de revenus permettant de soutenir leur journalisme de qualité. » — Ryan Powell, Head of Innovation and Media Business auprès de l'International Press Institute

Une presse libre, si nous pouvons la conserver

Le journalisme fait partie des constituants fondamentaux d'une société libre et de la gouvernance démocratique. Il permet de demander des comptes aux pouvoirs en place et donne une voix aux populations marginalisées et sous-représentées. Enfin, il protège également l'existence de marchés libres et ouverts, qui permettent aux start-ups de défier les puissants opérateurs historiques déjà établis.  

Les organes de presse locaux contribuent notamment à créer un sentiment d'identité commune. Non seulement en couvrant les événements d'importance pour la collectivité locale, comme les manifestations sportives, les marchés de producteurs et les nouvelles créations d'entreprises, mais également en assurant des fonctions de transparence et de surveillance essentielles à l'égard des agents publics locaux, des commissions scolaires, des événements concernant la sécurité publique et des élections. 

La mission de Cloudflare a toujours intégré la protection des journalistes et des organismes de presse en ligne. Nous considérons cette mission de protection comme une valeur essentielle pour notre entreprise et pour l'avenir d'Internet.  

Inscrivez-vous dès aujourd'hui si le projet Galileo vous intéresse et n'hésitez pas à rejoindre notre communauté si vous souhaitez contribuer à bâtir un Internet meilleur.

Nous protégeons des réseaux d'entreprise entiers, aidons nos clients à développer efficacement des applications à l'échelle d'Internet, accélérons tous les sites web ou applications Internet, repoussons les attaques DDoS, tenons les pirates informatiques à distance et pouvons vous accompagner dans votre parcours d'adoption de l'architecture Zero Trust.

Accédez à 1.1.1.1 depuis n'importe quel appareil pour commencer à utiliser notre application gratuite, qui rend votre navigation Internet plus rapide et plus sûre.

Pour en apprendre davantage sur notre mission, à savoir contribuer à bâtir un Internet meilleur, cliquez ici. Si vous cherchez de nouvelles perspectives professionnelles, consultez nos postes vacants.
Semaine anniversaireProjet GalileoimpactGestion des botsIA

Suivre sur X

Jocelyn Woolbright|@jo_woolbright
Cloudflare|@cloudflare

Publications associées

29 septembre 2025 à 14:00

15 années d'aide à la construction d'un Internet meilleur : retour sur la semaine anniversaire 2025

Systèmes centraux propulsés par Rust, mises à jour post-quantiques, accès développeur pour étudiants, intégration PlanetScale, partenariats open source, programme de stages plus ambitieux que jamais....