L’actualité de la transformation

Chute de 8% du trafic direct de Wikipédia : l’IA générative mise en cause

Wikipedia a modifié les méthodes de mesure de son trafic [Image Oberon Copeland @veryinformed.com]

Les consultations directes de Wikipedia ont reculé de 8 % en un an alors que les chatbots puisent dans ses contenus, selon Marshall Miller, Senior Director of Product, Core Experiences au sein de la Wikimedia Foundation (WMF) dans un billet de blog.

Marshall Miller déclare que depuis le printemps 2025, la Wikimedia Foundation, qui gère Wikipédia, observe une transformation profonde des usages sur Internet. Il annonce que la part de trafic réellement humain sur l’encyclopédie en ligne a reculé d’environ 8 % par rapport à 2024, selon les dernières données corrigées de la Fondation.

Selon Marshall Miller, ce déclin reflète une mutation globale. Les internautes ne se rendent plus directement sur les sites pour chercher des informations. Les moteurs de recherche intègrent désormais des modules d’intelligence artificielle générative qui répondent directement aux requêtes, souvent à partir de contenus issus de Wikipédia. Dans le même temps, les internautes les plus jeunes privilégient TikTok, YouTube ou Instagram pour s’informer.


Des bots toujours plus présents

Tout a été déclenché par une vague de trafic anormalement élevée venue du Brésil en mai 2025 qui a alerté la Fondation. Après enquête de la Fondation, il s’agissait de robots déguisés en visiteurs humains, conçus pour aspirer le contenu de l’encyclopédie et alimenter des services commerciaux ou des modèles de langage. Ces intrusions faussaient les statistiques et surchargeaient l’infrastructure de Wikipédia. L’organisation a renforcé ses systèmes de détection et a reclassé plusieurs mois de données. « Nous pensons que ces baisses reflètent l’impact de l’IA générative et des médias sociaux sur la façon dont les gens recherchent des informations » dit-il.


Si de moins en moins d’utilisateurs cliquent directement sur le site, presque tous les grands modèles de langage sont entraînés sur les ensembles de données de Wikipédia. Les plateformes sociales et les moteurs de recherche s’appuient également sur ses articles pour générer des réponses automatiques. « Autrement dit, le savoir produit par les bénévoles de Wikipédia irrigue l’ensemble du web, même si les internautes n’en voient pas toujours la source » s’irrite Marshall Miller.

Newsletter La Revue du Digital

Vers une adaptation du modèle

Pour préserver son écosystème, la Wikimedia Foundation appelle les acteurs du numérique à attribuer clairement leurs sources et à renvoyer les utilisateurs vers Wikipédia. Elle annonce développer aussi de nouveaux outils via Wikimedia Enterprise, et expérimente des formats adaptés aux jeunes publics sur YouTube, Roblox ou TikTok notamment via des vidéos, des jeux et des chatbots.

« Avec moins de visites sur Wikipédia, moins de bénévoles peuvent développer et enrichir le contenu, et moins de donateurs individuels peuvent soutenir ce travail » alerte Marshall Miller. Il préconise que pour que les gens fassent confiance aux informations partagées sur Internet, les plateformes doivent indiquer clairement d’où proviennent les informations et augmenter les possibilités de visiter et de participer à ces sources.

Et vous, qu’en pensez-vous ?

Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.

Je réagis à cet article

Top lectures en ce moment

L’actualité de la transformation

Dossier

L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz

Dossier exclusif

Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités

Saur, spécialiste de la distribution d’eau potable,  fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…

Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie

Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …

Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA

GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…


Vous, qu’en pensez-vous ?

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter