Google transforme ses vastes données publiques en un goldmin pour l’IA avec les débuts du Data Commons Model Context Protocol (MCP), les développeurs en service, les scientifiques des données et les agents d’IA pour accéder aux statistiques du monde réel en utilisant un langage naturel et de meilleurs systèmes d’IA.
Lancé en 2018, les données de Google Commons organisent des ensembles de données publiques à partir d’une gamme de sources, comprenaient la superfia gouvernementale, la locale administrative des données et les statistiques des organismes mondiaux tels que les Nations Unies. Avec la publication du serveur MCP, ces données sont désormais accessibles via le langage naturel, permettant aux développeurs de l’intégrer des agents ou des applications int AI.
Les systèmes d’IA sont souvent formés sur des données Web bruyantes et non vérifiées. Combiné avec leur tendance à «remplir les blancs» lorsque les sources font défaut, cela conduit à des hallucinations. En conséquence, les entreprises qui cherchent à affiner les systèmes d’IA pour des utilisations spécifiques ont souvent besoin d’accéder à de grands ensembles de données de haute qualité. En libérant publiquement le serveur MCP pour ses Data Commons, Google vise à relever les deux défis.
Le nouveau serveur MCP de Data Commons plie les ensembles de données publiques – des chiffres du recensement aux statistiques climatiques – avec un système d’IA qui dépendent de plus en plus de contexte structurel précis. En rendant ces données accessibles via des invites en langage naturel, la version vise à fonder AI dans des informations vérifiables et réelles.
« Le protocole de contexte du modèle permet d’utiliser l’intelligence du modèle de grande langue pour choisir les bonnes données au bon moment, sans avoir à comprendre comment nous modélissons les données, comment notre API fonctionne », a déclaré Google Data Commons Head Prem Ramaswami dans une interview.

Introduit pour la première fois par Anthropic en novembre dernier, MCP est une norme ouverte de l’industrie qui permet à un système d’accéder aux données provenant de diverses sources, comprenait des outils commerciaux, des restaurants de contenu et le développement d’applications, offrant un cadre commun pour comprendre une invite contextuelle. Depuis son lancement, des sociétés telles qu’Openai, Microsoft et Google ont adopté la norme pour intégrer leurs modèles d’IA à diverses sources de données.
Alors que d’autres sociétés technologiques ont exploré comment appliquer la norme à leurs modèles d’IA, Ramaswami et son équipe de Google ont commencé à enquêter sur la façon dont le travail pourrait être utilisé pour rendre la plate-forme Data Commons plus accessible plus tôt cette année.
Événement TechCrunch
San Francisco
|
27-29 octobre 2025
Google a également établi un partenariat avec The One Campaign, une organisation à but non lucratif axé sur l’amélioration des opportunités économiques et la santé publique en Afrique, pour lancer le seul agent de données. Cet outil d’IA utilise le serveur MCP pour faire surface des dizaines de millions de points de données financières et de santé en langage clair.
La seule campagne a abordé l’équipe Data Commons de Google avec une implémentation prototype de MCP sur son propre serveur personnalisé. Cette interaction, a déclaré Ramaswami à TechCrunch, était le point de virage qui a conduit l’équipe à créer un serveur MCP dédié en mai.
Cependant, l’expérience ne se limite pas à la seule campagne. La nature ouverte du serveur Data Commons MCP le rend compatible avec n’importe quel LLM, et Google a fourni plusieurs façons pour les développeurs de commencer. Un exemple d’agent est disponible via le kit de développement d’agent (ADK) dans un ordinateur portable de co-note, et le serveur peut également être accessible directement via le Gemini CL ou tout client compatible MCP à l’aide du package PYPI. Un exemple de code est également fourni sur GitHub Restitory.