微软开源创新音频模型VibeVoice-1.5B

2025-08-25 22:02:40

金十数据8月26日讯，今天凌晨，微软研究院开源了创新音频模型VibeVoice-1.5B。VibeVoice-1.5B开创了语音界多个重大技术突破：一次性可连续合成90分钟超长逼真语音，之前多数模型只能合成60分钟以内语音，并且30分钟后会出现音色漂移、语义断裂等难题。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

0/400

暂无评论