JetBrains, la société derrière une gamme d’outils de développement d’applications populaires, a publié son premier modèle d’IA «ouvert» pour le codage.
Mercredi, JetBrains a fait de Mellum, un modèle générateur de code que la société a publié pour ses différentes séquences de développement de logiciels l’année dernière, ouvertement disponibles sur la plate-forme AI de développement étreint. Mellum, formé sur plus de 4 billions de jetons, poids dans 4 milliards de paramètres, et est conçu spécifiquement pour l’achèvement du code (c’est-à-dire des extraits de code en fonction du contexte environnant).
Les paramètres correspondent à peu près aux compétences de résolution de problèmes d’un modèle, tandis que les jetons sont les bits bruts de données qu’un modèle de modèle. Un million de jetons correspond à peu près à 30 000 lignes de code.
«Conçu pour l’intégration dans l’outillage de développeurs professionnels (par exemple, les suggestions de code intelligentes dans le développement intégré autour), les assistants de codage à pow et la recherche sur la compréhension et la génération du code, Mellum est également bien adapté aux applications éducatives et à l’expérience de réglage fin», explique JetBrains dans un rapport technique.
JetBrains dit qu’il a formé Mellum, qui est autorisé par Apache 2.0, nous avons la collecte d’ensembles de données incluent le code de licence avec permis de GitHub et des articles Wikipedia en anglais-Langaage. La formation a pris environ 20 jours en grappe de 256 GPU Nvidia H200.
Mellum prend un peu de travail pour être opérationnel. Le modèle de base ne peut pas être utilisé hors de la boîte; Il a été affiné en premier. Bien que Jetbrians ait reçu quelques modèles de mellum affinés pour Python, les cations de l’entreprise sont destinées à «estimer les capacités potentielles» – pas de déploiement dans la production.
Le code générationnel AI change sans aucun doute la façon dont les logiciels sont construits, mais il s’agit également d’introduction de nouveaux défis de sécurité. Plus de 50% des organisations encouragent les problèmes de sécurité avec le code créé par l’IA, parfois ou fréquemment, selon une enquête de la fin de 2023 par Synk Plateforme de sécurité des développeurs.
Événement TechCrunch
Berkeley, que
|
5 juin
Réserver maintenant
En effet, JetBrains note que Mellum peut «renoncer à la biasse présente dans les codes de code public» (par exemple, un code générique similaire dans les restituties open source), et que ses suggestions de code ne seront pas nécessairement «sécurisées ou exemptes de vulnérabilités».
« Ce n’est que le début », a écrit Jetbrains dans un article de blog. « Nous ne poursuivons pas la généralité – nous construisons la concentration. Si Mellum étimule même un significatif, une contribution ou une collaboration, nous considérerions cela comme une victoire. »