Китайська фірма Kuaishou випустила модель перетворення тексту у відео “Kling”, яка може стати найбільшим конкурентом Sora

Китайська платформа коротких відео Kuaishou представила Kling – модель перетворення тексту у відео. Клінг приєднується до зростаючої області подібних моделей, які можуть створювати відео з текстових описів, як Sora з OpenAI та нещодавно представлений Google Veo.

Kling може створювати відео з роздільною здатністю 1080p зі швидкістю 30 кадрів на секунду і максимальною тривалістю дві хвилини. Модель може створювати зображення фізичного світу, включно з точними рухами та взаємодіями об’єктів.

Клінг використовує 3D-реконструкцію обличчя і тіла для створення реалістичних персонажів з повним спектром виразів і плавними рухами кінцівок. Ось приклад Google Veo.

Наразі Kling доступний у відкритому доступі, а це означає, що користувачі можуть експериментувати з можливостями моделі. Це контрастує з обмеженнями глобального доступу для майбутньої моделі OpenAI “Sora”.

Розробка Клінга є яскравим прикладом досягнень Китаю в галузі штучного інтелекту. Але загалом дивно, наскільки далеко просунувся ШІ менш ніж за два роки. Ось довідкове відео:

Випуск Kling у поєднанні з майбутнім випуском Sora передбачає подальший прогрес у технології перетворення тексту у відео. Хоча довгостроковий вплив і доступність цих моделей ще належить побачити, їхній розвиток означає динамічну картину в галузі створення відео за допомогою штучного інтелекту.

Популярні Пости