Google анонсувала Imagen 3 – штучний інтелект для генерації зображень за текстовим описом

На порталі arXive команда дослідників Google анонсувала модель машинного навчання Imagen 3, призначену для генерації зображень за текстовим описом. Вона замінить собою минулу версію і буде доступна в сервісі ImageFX.

Зображення з роздільною здатністю 4K (12 МП), створені за допомогою Imagen 3

Штучний інтелект Imagen 3 за замовчуванням створює зображення з роздільною здатністю 1024×1024 пікселів. При цьому є можливість збільшити роздільну здатність у 2, 4 і 8 разів. У компанії вважають, що Imagen 3 краще за інші моделі на ринку справляється зі створенням фотореалістичних картинок і може обробляти довгі запити з великою кількістю деталей.

Приклади робіт Imagen 3

Для датасету використовували унікальні зображення, які пройшли через кілька фільтрів. Насамперед із набору даних прибрали небезпечні та жорстокі картинки, а після видалили низькоякісні файли. Крім того, інженери уважно стежили, щоб у датасет не потрапили згенеровані зображення. До кожної картинки додали текстовий опис.

Найближчим часом Imagen 3 з’явиться на платформі ImageFX від Google. Доступ до самої платформи поки є тільки у жителів США. Всім іншим користувачам необхідно зареєструватися в черзі та чекати, коли компанія розширить географію сервісу.

Популярні Пости