ШІ-підрозділ китайської корпорації Alibaba випустив нове покоління ШІ-моделей Qwen3.

У сімействі одразу вісім нейромереж: найменша модель містить лише 600 млн параметрів – запуститься на домашньому ПК, а найбільша – 235 млрд параметрів, з яких під час відповіді задіюються 22 млрд. Невеликі моделі (до 32 млрд параметрів) – повністю open-source.
Особливості Qwen3:
➡️ Qwen3-235B у математиці, кодингу та загальних знаннях обходить o1 і o3-mini від OpenAI, DeepSeek-R1 і Grok 3. У деяких тестах на кодинг навіть порівнянна з Gemini 2.5 Pro від Google.
➡️ У рейтингу платформи спортивного програмування Codeforces модель набирає 2056 балів – відповідає приблизно топ-3000 найкращих програмістів планети (o3-mini на 200 позицій нижче).
➡️ Моделі гібридні – вміють працювати як у «міркувальному» режимі, так і у звичайному, як Gemini 2.5 Flash і Claude 3.7 Sonnet.
➡️ Обсяг навчальних даних зріс удвічі порівняно з Qwen2.5 – до 36 трлн токенів (у кілька разів більше за всі тексти в Інтернеті). Синтетичні дані для навчання створювали, зокрема, спеціально заточені під математику і програмування версії Qwen2.5.
➡️ Qwen3 розмовляє 119 мовами. Контекст до 128 тис. токенів. Поки не підтримують роботу з картинками та відео.

📌 Спробувати безкоштовно можна тут.