Les modèles d’intelligence artificielle se multiplient rapidement et la concurrence est rude. Avec autant de joueurs remplissant l’espace, lequel sera le meilleur – et qui en décide ? Arena, anciennement LM Arena, est devenu le classement public de facto des LLM frontières, influençant le financement, les lancements et les cycles de relations publiques. En seulement sept mois, la startup est passée d’un projet de recherche doctoral à l’UC Berkeley à une valeur de 1,7 milliard de dollars.
Regardez Rebecca Bellan, animatrice d’Equity, discuter avec les cofondateurs d’Arena, Anastasios Angelopoulos et Wei-Lin Chiang, de la façon dont leur plate-forme est devenue le classement incontournable pour les modèles d’IA frontaliers et de la manière dont ils tentent de créer une référence neutre alors même que des entreprises comme OpenAI, Google et Anthropic soutiennent le projet.
Ils expliquent comment Arena fonctionne et pourquoi il est plus difficile de jouer que des benchmarks statiques, ce que signifie réellement la « neutralité structurelle », pourquoi Claude est actuellement en tête des classements d’experts dans les cas d’utilisation juridiques et médicales, et comment l’entreprise s’étend au-delà du chat pour évaluer les agents, le codage et les tâches du monde réel avec un nouveau produit d’entreprise.
Abonnez-vous à Equity sur YouTube, Apple Podcasts, Overcast, Spotify et tous les castings. Vous pouvez également suivre Equity sur X et Threads, sur @EquityPod.

