Mistral AI випускає Codestral, першу модель штучного інтелекту для створення коду

Codestral представляє першу модель коду. Codestral – це модель генеративного ШІ з відкритою структурою, спеціально розроблена для задач генерації коду. Вона допомагає розробникам писати та взаємодіяти з кодом за допомогою спільних інструкцій та кінцевої точки API. Оскільки вона опановує код і англійську мову, її можна використовувати для розробки просунутих додатків ШІ для розробників програмного забезпечення.

Модель, яка вільно володіє 80+ мовами програмування

Codestral навчається на різноманітному наборі даних з 80+ мов програмування, включаючи найпопулярніші, такі як Python, Java, C, C++, JavaScript та Bash. Він також добре працює на більш специфічних мовах, таких як Swift та Fortran. Така широка мовна база гарантує, що Codestral може допомогти розробникам у різних середовищах кодування та проєктах.

Codestral економить час і зусилля розробників: він може виконувати функції кодування, писати тести та завершувати будь-який частковий код. Взаємодія з Codestral допоможе вирівняти гру розробника в кодуванні та зменшити ризик помилок і багів.

Встановлення планки продуктивності генерації коду
Продуктивність. Як модель 22B, Codestral встановлює новий стандарт продуктивності/простору затримок для генерації коду в порівнянні з попередніми моделями, що використовувалися для кодування.

Завдяки більшому контекстному вікну 32k (порівняно з 4k, 8k або 16k у конкурентів), Codestral перевершує всі інші моделі в RepoBench, довгостроковій оцінці генерації коду.

Ми порівнюємо Codestral з іншими моделями, що спеціалізуються на коді та мають вищі вимоги до апаратного забезпечення.

Python. Ми використовуємо чотири бенчмарки: HumanEval pass@1, MBPP sanitised pass@1 для оцінки здатності Codestral генерувати код на Python, CruxEval для оцінки прогнозування виводу на Python та RepoBench EM для оцінки довгострокового завершення коду на рівні сховища Codestral.

SQL. Для оцінки продуктивності Codestral в SQL ми використовували бенчмарк Spider SQL.

Додаткові мови. Крім того, ми оцінили продуктивність Codestral у декількох тестах HumanEval pass@1 на шести різних мовах на додаток до Python: C++, bash, Java, PHP, Typescript та C#, і вирахували середнє значення цих оцінок.
Бенчмарки FIM. Продуктивність Codestral Fill-in-the-middle оцінювалася за допомогою HumanEval pass@1 на Python, JavaScript і Java і порівнювалася з DeepSeek Coder 33B, чия здатність заповнювати середину доступна для негайного використання.

Популярні Пости