Конкурент Sora навчився генерувати відео зі складним монтажем - ForkLog: криптовалюти, ІІ, сингулярність, майбутнє

Туристов предупредили о фишинге с применением ИИ phishing AI# Конкурент Sora навчився генерувати відео зі складним монтажем

Китайський розробник Kuaishou представив третю версію моделі для генерації відео Kling AI.

🚀 Представляємо модель Kling 3.0: кожен — режисер. Час настав.

Все-в-одному креативний двигун, що дозволяє справді нативне мультимодальне створення.

— Відмінна послідовність: ваші персонажі та елементи завжди зафіксовані.
— Гнучке виробництво відео: створюйте 15-секундні кліпи з точністю… pic.twitter.com/CJBILOdMZs

— Kling AI (@Kling_ai) 4 лютого 2026

«Kling 3.0 працює на основі глибоко уніфікованої навчальної платформи, забезпечуючи по-справжньому нативний мультимодальний ввід і вивід. Завдяки безшовній інтеграції аудіо та просунутому контролю узгодженості елементів модель наповнює згенеровану частину більш сильним відчуттям життя і цілісності», — йдеться у анонсі.

Модель об’єднує кілька завдань: перетворення тексту, зображень і референсів у відео, додавання або видалення контенту, модифікація та трансформація роликів.

Тривалість відео збільшилася до 15 секунд. Серед інших покращень — більш гнучке управління кадрами та точне слідування промптам. Покращено загальний реалістичний вигляд: рухи персонажів стали виразнішими та динамічнішими.

Порівняння Kling VIDEO 3.0 з Kling VIDEO 2.6. Джерело: Kling AI. Нова функція Multi-Shot аналізує промпт, визначаючи структуру сцени та типи кадрів. Інструмент автоматично налаштовує ракурси камери та композицію.

Модель підтримує різні монтажні рішення: від класичних діалогів за схемою «кадр-контркадр» до паралельного оповідання та сцен із закадровим голосом.

«Більше не потрібно нудно різати та монтувати відео — однієї генерації достатньо, щоб отримати кінематографічний ролик і зробити складні аудіовізуальні форми доступними для всіх творців», — йдеться у анонсі.

Kling 3.0 справді — «один великий крок для AI-генерації відео»! Перегляньте цей дивовижний мокументарій від Kling AI Creative Partner Simon Meyer! pic.twitter.com/Iyw919s6OJ

— Kling AI (@Kling_ai) 5 лютого 2026

Крім стандартної генерації відео за зображенням, Kling 3.0 підтримує одночасно кілька картинок як референси, а також відео-джерела у ролі елементів сцени.

Модель фіксує характеристики персонажів, предметів і епізоду. Незалежно від руху камери та розвитку сюжету, ключові об’єкти залишаються стабільними та узгодженими протягом усього відео.

Розробники вдосконалили нативне аудіо: система точніше синхронізує мову з мімікою, а у сценах із діалогами дозволяє вручну вказувати конкретного спікера.

Розширено список підтримуваних мов: китайська, англійська, японська, корейська та іспанська. Також покращено передачу діалектів та акцентів.

Крім того, команда оновила мультимодальну модель O1 до Video 3.0 Omni.

Джерело: Kling AI. Є можливість завантажити аудіо з мовленням від трьох секунд і витягти голос або записати відео з персонажем від трьох до восьми секунд для отримання його основних характеристик.

Конкуренти Sora наступають

OpenAI представила модель відеогенерації Sora у лютому 2024 року. Інструмент викликав захоплення у соцмережах, проте публічний реліз відбувся лише у грудні.

Після майже року користувачам відкрили доступ до генерації відео за текстовими описами, «оживлення» зображень і доповнення готових роликів.

iOS-додаток Sora вийшов у вересні і одразу привернув увагу аудиторії: у перший день його встановили понад 100 000 разів. Сервіс подолав позначку у 1 млн завантажень швидше за ChatGPT, незважаючи на доступ за запрошеннями.

Однак незабаром тренд змінився. У грудні кількість завантажень зменшилася на 32% відносно попереднього місяця. У січні спад зберігся — додаток завантажили 1,2 млн разів.

Джерело: Appfigures. Спад обумовлений низкою факторів. По-перше, конкуренцію посилила модель Nano Banana від Google, яка зміцнила позиції Gemini.

Sora також конкурує з Meta AI та її функцією Vibes. У грудні тиск на ринок посилив стартап Runway, чия модель Gen 4.5 перевищила аналоги у незалежних тестах.

По-друге, продукт OpenAI зіткнувся з проблемою порушення авторських прав. Користувачі створювали відео з популярними персонажами, наприклад «Губка Боб» або «Пікачу», через що компанії довелося посилити обмеження.

У грудні ситуація стабілізувалася після укладення угоди з Disney, що дозволило користувачам генерувати відео з персонажами студії. Однак це не спричинило зростання завантажень.

Нагадаємо, в жовтні дипфейки із Сэмом Альтманом заполонили Sora.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити