竞争对手Sora学会了生成具有复杂剪辑的视频 - ForkLog:加密货币、人工智能、奇点、未来

游客被AI钓鱼提醒# 竞争对手Sora学会了生成复杂剪辑的视频

中国开发商快手推出了第三版视频生成模型Kling AI。

🚀 介绍Kling 3.0模型:人人都是导演。是时候了。

一体化创意引擎,真正实现本地多模态创作。

— 极佳的一致性:你的角色和元素,始终锁定。
— 灵活的视频制作:创建15秒的片段,精准控制… pic.twitter.com/CJBILOdMZs

— Kling AI (@Kling_ai) 2026年2月4日

«Kling 3.0基于高度统一的训练平台,提供真正的本地多模态输入和输出。通过无缝集成音频和先进的元素一致性控制,模型赋予生成内容更强的生命感和完整性»,官方公告中如此表示。

该模型结合了多项任务:将文本、图片和参考资料转化为视频,添加或删除内容,修改和变换短片。

视频时长增加到15秒。其他改进包括更灵活的镜头控制和精准的提示跟随。整体逼真度提升:角色动作更具表现力和动态感。

Kling VIDEO 3.0与Kling VIDEO 2.6的对比。来源:Kling AI。新功能Multi-Shot分析提示,识别场景结构和镜头类型。工具自动调整摄像机角度和构图。

模型支持多种剪辑方案:从经典的“画面对画”对话,到平行叙事和配音场景。

«无需再费力剪辑视频——只需一次生成,即可获得电影级短片,让复杂的视听形式变得对所有创作者都可及»,官方公告中如此表示。

Kling 3.0真正实现了“AI视频生成的巨大飞跃”!快来看看Kling AI创意伙伴Simon Meyer带来的精彩伪纪录片!pic.twitter.com/Iyw919s6OJ

— Kling AI (@Kling_ai) 2026年2月5日

除了标准的图片生成视频外,Kling 3.0还支持多张图片作为参考,以及视频素材作为场景元素。

模型能固定角色、物品和场景的特征。无论摄像机运动和剧情发展如何,关键对象始终保持稳定和一致。

开发者优化了本地音频:系统更精准地同步语音与表情,还能在对话场景中手动指定发言人。

支持的语言范围扩大:包括中文、英文、日语、韩语和西班牙语。方言和口音的传达也得到了改善。

此外,团队还将多模态模型O1升级为Video 3.0 Omni。

来源:Kling AI。用户可以上传三秒的语音,提取声音或录制三到八秒的角色视频,以获取其主要特征。

Sora的竞争对手崭露头角

OpenAI于2024年2月推出了视频生成模型Sora。该工具在社交媒体上引发热议,但正式公开发布直到12月。

经过近一年的时间,用户可以通过文本描述生成视频、赋活图片以及补充现有短片。

Sora的iOS应用于九月上线,立即吸引了大量关注:首日下载量超过10万次。尽管需要邀请才能使用,服务下载总量突破了100万,比ChatGPT更快。

但很快趋势发生逆转。12月下载量比前一个月下降了32%。一月,下降趋势持续,应用总下载量达120万次。

来源:Appfigures。下降原因多方面。首先,Google的Nano Banana模型增强了竞争力,巩固了Gemini的地位。

Sora还与Meta AI及其Vibes功能竞争。12月,创业公司Runway的Gen 4.5模型在独立测试中优于其他同类产品,进一步加剧市场压力。

其次,OpenAI的产品遇到版权问题。用户制作了“海绵宝宝”或“皮卡丘”等热门角色的视频,导致公司不得不加强限制。

12月,情况趋于稳定,与迪士尼达成协议后,用户可以生成迪士尼角色的视频,但这并未带来下载量的增长。

提醒一下,十月时,带有Sam Altman的深度伪造内容充斥Sora。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)