L’infrastructure cloud a longtemps été conçue autour d’humains qui recherchent, cliquent, font défiler et diffusent du contenu de manière stable et prévisible. Les agents IA se comportent différemment. Ils peuvent déclencher une vague d’activité, en créant plusieurs sous-agents qui interrogent des centaines de bases de données, recherchent des documents et appellent des API en quelques secondes, puis disparaissent aussi rapidement qu’ils sont arrivés.
Partant de ce principe, Amazon repense un élément central de son infrastructure cloud. Jeudi, AWS a lancé sa nouvelle génération d’OpenSearch Serverless, une base de données de recherche et de vecteurs entièrement gérée – essentiellement un système de stockage et de récupération d’informations à grande échelle – conçue spécifiquement pour les charges de travail agents. AWS affirme que le nouveau système peut évoluer instantanément lorsque les agents déclenchent des tâches et revenir à zéro lorsqu’ils sont inactifs.
Ce lancement reflète une prise de conscience croissante au sein de l’industrie technologique : les infrastructures conçues à l’origine pour un Internet piloté par l’humain ne fonctionnent pas aussi bien dans un monde de plus en plus peuplé d’agents.
Même si les agents IA ne représentent encore qu’une part relativement faible de l’activité Internet, le trafic généré par les machines est déjà important et est sur le point de croître. Cloudflare affirme que les robots représentaient 31 % du trafic HTTP global au cours des six derniers mois. Les robots d’exploration, les moteurs de recherche et les assistants IA représentaient environ un quart de toutes les demandes de robots au cours de cette période.
« Le trafic non humain dépassera le trafic humain au cours du premier semestre 2027 », a déclaré Li Yi Ohlsen, chef de produit senior chez Cloudflare, à TechCrunch.
Lors de la conférence des développeurs I/O de Google la semaine dernière, la société a déclaré que les utilisateurs pourront commencer à déléguer des tâches aux systèmes d’IA, comme rechercher des achats, réserver des voyages, naviguer sur le Web et interagir avec des applications. Mais la responsabilité ne s’arrête pas aux agents d’IA axés sur le consommateur. Les entreprises déploient de plus en plus d’agents en interne et pour leurs clients, créant ainsi de nouveaux types de trafic généré par des machines en coulisses.
En conséquence, les fournisseurs de cloud et les sociétés d’infrastructure ont réfléchi à la manière d’adapter les systèmes conçus pour les humains à un monde d’agents qui récupèrent des informations en permanence et de manière autonome, invoquent des outils et génèrent du trafic de machine à machine.
C’est là qu’intervient le nouveau OpenSearch Serverless d’AWS.
« Le timing est simple. Les agents passent de l’expérimentation à la production et créent des modèles de trafic pour lesquels l’infrastructure précédente n’était tout simplement pas conçue », a déclaré à TechCrunch Tia White, directrice générale d’Amazon OpenSearch Service. « Ils augmentent sans avertissement, ils restent inactifs sans préavis, et les entreprises ont besoin d’une recherche qui suit le rythme sans payer pour des calculs vides ou inactifs. »
Le principal changement technique apporté par cette nouvelle génération est qu’elle dissocie le calcul du stockage, ce qui permet au calcul d’évoluer en quelques secondes pour s’adapter aux pics de trafic des agents et de diminuer jusqu’à zéro, de sorte que les clients paient 0 $ lorsque les agents sont inactifs.
« Auparavant, même dans notre version précédente sans serveur, vous deviez avoir au moins une instance opérationnelle et en cours d’exécution, car le stockage et le calcul étaient couplés », a déclaré White. « Vous ne pouviez pas simplement démarrer (calculer) automatiquement à la vitesse dont vous aviez besoin, vous disposiez donc toujours d’un calcul inactif réservé à votre charge de travail, que vous l’utilisiez ou non. »
Pensez-y comme si vous payiez toujours pour une place de stationnement, même lorsque vous ne l’utilisez pas. Avec la mise à niveau sans serveur d’AWS, cela revient plus à payer pour une place de parking payante.
Au lancement, OpenSearch Serverless s’intégrera nativement aux plates-formes de développement d’IA telles que Vercel et Kiro, afin que les développeurs puissent déployer des backends de recherche et vectoriels prêts pour la production pour les agents sans gérer l’infrastructure.
Le changement se dessine dans l’ensemble de l’industrie du cloud. Databricks et Snowflake se repositionnent en tant que systèmes de mémoire et de récupération d’IA pour les données d’entreprise. Microsoft a déployé des mises à jour pour Azure conçues pour gérer les rafales d’agents IA et partager la mémoire entre les agents. Cloudflare, dans la même veine qu’Amazon, a introduit le mois dernier une infrastructure visant à offrir aux agents des environnements persistants et une évolutivité instantanée.
Plus les entreprises déploieront d’agents IA, plus il y aura de pression pour repenser l’infrastructure autour des charges de travail générées par les machines, ce qui pourrait rendre les agents moins chers et plus faciles à déployer à plus grande échelle.
Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

