На порталі arXive команда дослідників Google анонсувала модель машинного навчання Imagen 3, призначену для генерації зображень за текстовим описом. Вона замінить собою минулу версію і буде доступна в сервісі ImageFX.

Штучний інтелект Imagen 3 за замовчуванням створює зображення з роздільною здатністю 1024×1024 пікселів. При цьому є можливість збільшити роздільну здатність у 2, 4 і 8 разів. У компанії вважають, що Imagen 3 краще за інші моделі на ринку справляється зі створенням фотореалістичних картинок і може обробляти довгі запити з великою кількістю деталей.

Для датасету використовували унікальні зображення, які пройшли через кілька фільтрів. Насамперед із набору даних прибрали небезпечні та жорстокі картинки, а після видалили низькоякісні файли. Крім того, інженери уважно стежили, щоб у датасет не потрапили згенеровані зображення. До кожної картинки додали текстовий опис.
Найближчим часом Imagen 3 з’явиться на платформі ImageFX від Google. Доступ до самої платформи поки є тільки у жителів США. Всім іншим користувачам необхідно зареєструватися в черзі та чекати, коли компанія розширить географію сервісу.