Sora的競爭對手已經學會生成具有複雜剪輯的視頻 - ForkLog:加密貨幣、人工智能、奇點、未來

旅客被警告使用含有AI釣魚的釣魚網站# 競爭對手 Sora 學會生成具有複雜剪輯的影片

中國開發商 Kuaishou 推出了第三版影片生成模型 Kling AI。

🚀 介紹 Kling 3.0 模型:人人皆導演。是時候了。

一個全方位創意引擎,實現真正的本地多模態創作。

— 卓越的一致性:您的角色和元素,始終鎖定。
— 靈活的影片製作:創建15秒短片,精確控制… pic.twitter.com/CJBILOdMZs

— Kling AI (@Kling_ai) 2026年2月4日

「Kling 3.0 基於深度統一的訓練平台,提供真正的本地多模態輸入與輸出。通過無縫整合音頻和先進的元素一致性控制,模型賦予生成部分更強的生命感與完整性」,官方公告中如此表示。

該模型結合多項任務:將文本、圖像和參考資料轉換為影片,添加或刪除內容,修改與轉換影片。

影片長度已增至15秒。其他改進包括更靈活的畫面控制與精確追蹤提示。整體逼真度提升:角色動作更具表現力與動態。

Kling VIDEO 3.0 與 Kling VIDEO 2.6 比較。資料來源:Kling AI。新功能 Multi-Shot 會分析提示,判定場景結構與畫面類型。工具會自動調整攝影角度與構圖。

模型支持多種剪輯方案:從傳統的「畫面-切換」對話,到平行敘事與配音場景。

「不再需要繁瑣的剪輯與合成——只需一次生成,即可獲得電影級影片,並讓複雜的視聽形式變得人人可及」,官方公告如此表示。

Kling 3.0 真正是「AI影片生成的巨大飛躍」!來看看 Kling AI 創意合作夥伴 Simon Meyer 的精彩模擬紀錄片!pic.twitter.com/Iyw919s6OJ

— Kling AI (@Kling_ai) 2026年2月5日

除了標準的圖像生成影片外,Kling 3.0 還支持多張圖片作為參考,以及影片素材作為場景元素。

模型能捕捉角色、物品與場景的特徵。無論攝影角度或劇情發展,關鍵物件始終保持穩定與一致。

開發者優化了本地音頻:系統能更準確同步語音與表情,並在對話場景中手動指定說話人。

支持語言範圍擴展:包括中文、英文、日文、韓文與西班牙文。方言與口音的傳達也有所提升。

此外,團隊將多模態模型 O1 升級為 Video 3.0 Omni。

資料來源:Kling AI。有能力上傳長度三秒的語音,提取聲音或錄製角色影片(長度三至八秒)以獲取其主要特徵。

Sora 競爭對手來襲

OpenAI 於2024年2月推出了影片生成模型 Sora。該工具在社交媒體引發熱議,但正式公開版直到12月才推出。

經過近一年的時間,用戶已能根據文字描述生成影片、讓圖像「活起來」以及補充完成的影片。

Sora 的 iOS 應用於九月推出,立即吸引大量關注:首日下載超過10萬次。儘管需邀請碼,但服務下載量突破100萬,比 ChatGPT 更快。

然而,趨勢很快逆轉。12月下載量較前一月下降32%。一月仍呈下降趨勢,應用下載次數達120萬。

資料來源:Appfigures。下降原因包括多方面。首先,Google 的 Nano Banana 模型加劇競爭,鞏固了 Gemini 的地位。

Sora 也與 Meta AI 及其 Vibes 功能競爭。12月,初創公司 Runway 推出 Gen 4.5 模型,在獨立測試中超越了同類產品。

其次,OpenAI 的產品遇到版權問題。用戶曾用熱門角色如「海綿寶寶」或「皮卡丘」製作影片,導致公司不得不加強限制。

12月,與迪士尼達成協議後,情況趨於穩定,允許用戶生成迪士尼角色影片,但未能促使下載量回升。

提醒一下,十月時,帶有山姆·奧特曼(Sam Altman)臉的深偽影片充斥 Sora。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)