Les entreprises d’IA sont devenues des entités avides de données, car leurs modèles nécessitent des ensembles de données de plus en plus volumineux pour s’entraîner. Pour répondre à ce besoin, de nombreuses startups d’IA défient les conventions Internet de longue date – comme le respect des fichiers robots.txt, qui signalent aux robots d’exploration automatisés quelles parties d’un site Web sont interdites – et récupèrent les données de manière agressive. Cela a contraint les sites Web à restreindre l’accès à leurs données et, dans certains cas, à conclure des accords de licence avec des sociétés d’IA. L’entreprise de fitness et de course à pied sociale Strava fait un pas dans cette direction en restreignant son site Web et en introduisant des frais pour l’accès des développeurs.
Pour mettre fin au scraping, l’entreprise renforce la sécurité autour de son site Web et autorisera désormais uniquement les utilisateurs authentifiés à consulter certaines données. Auparavant, les utilisateurs pouvaient voir des détails tels que les profils publics et les listes de clubs de fitness sans se connecter. La société met toutes ces données derrière l’authentification pour les protéger contre le grattage non autorisé par l’IA.
Du côté des API, les développeurs pouvaient auparavant commencer à créer des applications sur Strava via un programme d’accès gratuit à plusieurs niveaux – en demandant d’abord un accès de base, puis en en demandant davantage à mesure que leur application se développait. La société ajoute désormais des frais fixes de 11,99 $ par mois pour tous les développeurs, même si elle a noté que le prix peut varier selon la zone géographique.
Strava a déclaré que sa communauté de développeurs est passée de 185 000 membres l’année dernière à 241 000 cette année, et que la société prévoit de continuer à les soutenir. Dans ce cadre, Strava prévoit également d’ajouter la prise en charge du Model Context Protocol (MCP), une norme émergente qui permet aux assistants et aux applications d’IA d’accéder aux données externes de manière structurée, donnant ainsi à Strava plus de contrôle sur exactement ce qui est partagé et comment.
La société prévoit également de supprimer certains points de terminaison d’API – des points d’accès discrets qui permettent aux applications externes d’extraire des données spécifiques, telles que les détails du club – pour protéger les données des utilisateurs. Strava avait déjà renforcé les règles de l’API en 2024, interdisant son utilisation pour la formation à l’IA et limitant l’affichage des données des autres utilisateurs par les applications tierces. Ces changements ont suscité des réactions négatives de la part des développeurs qui ont déclaré que leurs applications seraient gravement affectées.
Bien que certains développeurs puissent accepter de payer des frais d’abonnement, la suppression de certains points de terminaison d’API pourrait toujours avoir un impact sur les applications dépendantes. Strava accorde aux développeurs un délai de grâce de 90 jours avant d’effectuer ces modifications.
Dans une interview avec TechCrunch, Michael Martin, PDG de Strava, a déclaré que le grattage incontrôlé de l’IA pourrait sonner le glas de l’Internet public.
« Les sociétés d’IA suppriment impitoyablement les sites Web publics, étant donné leur besoin infini de données de formation, ce qui dégrade les performances des sites à tous les niveaux », a déclaré Martin. Nous avons eu plusieurs cas au cours des derniers mois où les performances ont été diminuées et, dans certains cas, altérées. Au-delà du scraping des sites publics, ils essaient également d’utiliser notre API pour accéder à nos données, en ignorant les termes de l’API.
Il a noté que Strava avait refusé les propositions des principaux laboratoires d’IA cherchant à obtenir des accords de licence de données. Il a spécifiquement pointé du doigt Perplexity, affirmant que la startup de recherche d’IA acheminait son scraping via des services d’agrégation pour obscurcir son origine malgré son refus. Cela est cohérent avec le fait que Perplexity a été accusé d’un comportement similaire ailleurs dans le passé.
Martin a également signalé une surcharge du serveur causée par des applications codées en ambiance mal construites, dont les appels API sont souvent structurés de manière inefficace et génèrent une charge disproportionnée sur les systèmes Strava. C’est une tendance : lorsque Meta a banni les chatbots tiers de WhatsApp l’année dernière, elle a avancé un argument similaire concernant la surcharge du système.
Le moment n’est probablement pas une coïncidence. Strava a déposé confidentiellement une introduction en bourse plus tôt cette année, et sa décision de protéger ses données pourrait viser à signaler une discipline en matière de données aux investisseurs potentiels. La comparaison avec la répression de l’accès aux API par Reddit en 2024 est une comparaison que Martin n’a pas tardé à aborder. Contrairement à Reddit, qui tarifait l’accès à l’API en fonction du nombre d’appels (ce qui le rendait inabordable pour de nombreux développeurs d’applications), Strava parie qu’un tarif forfaitaire maintient l’écosystème des développeurs intact.
« Nous voulons que les utilisateurs sentent qu’ils sont propriétaires de leurs données et qu’ils se sentent à l’aise avec la façon dont nous les contrôlons et les sécurisons. Mais nous voulons que les développeurs continuent de prospérer et de croître », a déclaré Martin.
Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

