Gemini 2.5 Flash – це дистилят з Gemini 2.5 Pro розміром трохи менше і швидше. За якістю вона далеко пішла від 2.0 Flash, та навіть від січневого Flash Thinking відрив гігантський. Але порівняно з o4-mini модель тьмяніє – в OpenAI та модель сильніша, і немає дивних обмежень, на кшталт неможливості підрубати та пошук, і виконання коду одночасно. Але в Gemini 2.5 Flash все ж є щось, чого немає в o4-mini – детальний бюджет на роздуми в токенах, прямо як у Sonnet 3.7 (але у 2.5 Pro не додали).

Спробувати модельку можна просто зараз в AI Studio. Якщо ви не ганяєте тисячі запитів по API, то Gemini 2.5 Pro для вас доступна безоплатно, яка, хоч і поступається o3, залишається найкращою безоплатною моделлю. Навіть за швидкістю вона не сильно повільніша за версію Flash – на моїх промптах 2.5 Pro думає лише на 10-20% довше, за значно кращих відповідей. Все одно, поки чекаєш, можна погенерувати щось у Veo 2, яку нещодавно додали та туди.
Ціна – для звичайного не-ризонінгового режиму вона в півтора раза вища, ніж у 2.0. Але головна проблема в ризонінг режимі – за нього просять $3.5 за мільйон токенів, що трохи нижче за $4.4 за o4-mini. Але навіть цю різницю в ціні може легко з’їсти різниця в довжині роздумів моделі, але без тестів тут складно судити. З упевненістю можна сказати одне – якби не було таких драконівських цін на роздуми, модель була б набагато цікавішою. Але все ж для деяких завдань при викликах за API, вона може конкурувати з o4-mini.