Vendredi, Google a ajouté un nouveau modèle expérimental «d’incorporation» pour le texte, les gemini intégrés, à son API de développeur Gemini.
Les modèles d’incorporation traduisent des entrées de texte comme des mots et des phrases en représentations numériques, appelées intégres, qui capturent la signification sémantique du texte. Les intégres sont utilisés dans une dégustation d’applications, telles que la récupération de documents et la classification, en partie parce qu’elles peuvent réduire les coûts tout en améliorant la latence.
Les entreprises comprenaient Amazon, Cohere et OpenAI ont proposé des modèles d’intégration via leurs API respectives. Google a déjà proposé des modèles d’intégration, mais l’intégration des Gemini est sa première formée sur la famille des Gémeaux de modèles d’IA.
« Formé sur le modèle Gemini lui-même, ce modèle d’incorporation a hérité de la compréhension des Gémeaux du langage et du contexte nuancé, ce qui le rend applicable à une large gamme », a déclaré Google dans un article de blog. «Nous avons formé notre modèle à être remarquable général, offrant des performances exceptionnelles dans divers domaines, notamment la finance, la science, le juridique, la recherche, etc.
Google affirme que les Gemini Embedding dépassent les performances de son modèle d’intégration de pointe précédent, Text-Edding-004, et obtient des performances concurrentielles sur des références d’intégration populaires. Par rapport à Text-Embedding-004, l’intégration des Gemini peut également accepter des morceaux de texte et de code plus grands à la fois, et il prend en charge deux fois plus de langues (plus de 100).
Google note que l’intégration des Gémeaux est dans une «phase d’expérience» avec une capacité limitée et est susceptible de changer. « (W) travaille à une écurie, généralement disponible dans les mois à venir », a écrit la société dans son article de blog.