Soraの競合他社は、複雑な編集を伴う動画を生成できるようになりました - ForkLog:暗号通貨、人工知能、シンギュラリティ、未来

Туристов предупредили о фишинге с применением ИИ phishing AI# Конкурент Sora научился генерировать видео со сложным монтажом

中国の開発者Kuaishouは、動画生成モデルKling AIの第3版を発表しました。

🚀 Kling 3.0モデルの紹介:誰もがディレクター。今こそその時です。

真のネイティブマルチモーダル制作を可能にするオールインワンのクリエイティブエンジン。

— 優れた一貫性:キャラクターや要素が常に固定される。
— 柔軟な動画制作:正確な… pic.twitter.com/CJBILOdMZs

— Kling AI (@Kling_ai) 2026年2月4日

「Kling 3.0は、深く統一された学習プラットフォーム上で動作し、真にネイティブなマルチモーダル入力と出力を実現します。音声と高度な要素の整合性制御をシームレスに統合することで、生成された部分により強い生命感と一体感をもたらします」とアナウンスで述べられています。

このモデルは、テキスト、画像、リファレンスを動画に変換し、コンテンツの追加・削除、動画の修正・変換を行う複数のタスクを統合しています。

動画の長さは15秒に延長されました。その他の改善点には、フレームの管理の柔軟性向上やプロンプトへの正確な追従があります。全体的なリアリズムも向上し、キャラクターの動きがより表現豊かでダイナミックになっています。

Kling VIDEO 3.0とKling VIDEO 2.6の比較。出典:Kling AI。新機能のマルチショットは、プロンプトを分析し、シーンの構造やフレームのタイプを特定します。ツールは自動的にカメラアングルや構図を調整します。

このモデルは、従来の「フレーム・コントラフレーム」対話型編集から、並列ストーリーテリングやナレーション付きシーンまで、さまざまな編集ソリューションをサポートします。

「もう面倒な動画のカットや編集は不要です — 一度の生成だけで映画のような動画を作り出し、複雑な映像・音声形式をすべてのクリエイターに手軽に提供します」とアナウンスで述べられています。

Kling 3.0はまさに「AI動画生成における一大飛躍」! Kling AIクリエイティブパートナーのSimon Meyerによる素晴らしいモキュメンタリーをチェック! pic.twitter.com/Iyw919s6OJ

— Kling AI (@Kling_ai) 2026年2月5日

標準的な画像からの動画生成に加え、Kling 3.0は複数の画像をリファレンスとして使用できるほか、動画ソースをシーンの要素として利用することも可能です。

このモデルは、キャラクター、アイテム、エピソードの特徴を固定します。カメラの動きやストーリーの展開に関係なく、主要なオブジェクトは動画全体を通じて安定し、一貫性を保ちます。

開発者は、ネイティブな音声を改良し、話し言葉と表情の同期をより正確に行えるようにしました。また、対話シーンでは特定のスピーカーを手動で指定できる機能も追加されました。

対応言語も拡大され、中国語、英語、日本語、韓国語、スペイン語に対応。方言やアクセントの伝達も改善されています。

さらに、チームはマルチモーダルモデルO1をVideo 3.0 Omniにアップデートしました。

出典:Kling AI。音声を3秒からアップロードし、声を抽出したり、キャラクターの動画を3秒から8秒で録画して基本的な特徴を取得することも可能です。

Soraの競合他社が台頭

OpenAIは2024年2月に動画生成モデルSoraを発表しました。このツールはSNSで絶賛されましたが、公開リリースは12月に行われました。

ほぼ1年後、ユーザーはテキスト説明からの動画生成、画像の「生き返らせ」、完成した動画の補完が可能になりました。

iOSアプリのSoraは9月にリリースされ、すぐに注目を集めました:初日に10万回以上のインストールを記録。招待制にもかかわらず、ChatGPTよりも早く100万ダウンロードを突破しました。

しかし、その後トレンドは逆転しました。12月のダウンロード数は前月比で32%減少。1月も下降傾向が続き、アプリは120万回ダウンロードされました。

出典:Appfigures。減少の要因は複数あります。まず、GoogleのNano Bananaモデルが競争を激化させ、Geminiの地位を強化しました。

Soraはまた、Meta AIとそのVibes機能とも競合しています。12月には、スタートアップのRunwayが市場に圧力をかけ、Gen 4.5モデルは独立したテストで他のモデルを凌駕しました。

二つ目は、OpenAIの製品が著作権侵害の問題に直面したことです。ユーザーは「スポンジ・ボブ」や「ピカチュウ」などの人気キャラクターを使った動画を作成し、企業は制限を強化せざるを得ませんでした。

12月には、Disneyとの契約締結により状況は安定し、ユーザーはスタジオのキャラクターを使った動画を生成できるようになりましたが、ダウンロード数の増加にはつながりませんでした。

ちなみに、10月にはサム・アルトマンのディープフェイクがSoraを席巻しました。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン