近日,Soul AI Lab 宣布正式开源业内首个拥有14亿参数的实时数字人生成模型 ——SoulXFlashTalk。这个模型的特别之处在于,它能够实现亚秒级延迟和每秒32帧的高帧率,为行业提供了一套完整的实时交互解决方案。

SoulXFlashTalk 的开源意味着开发者将可以轻松访问相关的项目页面、技术报告、源代码和模型权重,形成一个全面开放的体系。这一举措不仅能有效降低行业内的研发门槛,也将为更多的创新项目提供基础支持。值得一提的是,早在去年10月,Soul 便已经开源了语音合成模型 SoulXPodcast,此次的开源标志着 Soul 在 “语音 + 视觉” 双模态开源矩阵的布局上又迈出了重要一步。

image.png

Soul 的开源战略并不仅限于技术的共享,更是希望通过开放的方式,促进 AI 生态的共同发展。公司表示,未来将继续坚持开源路线,开放更多 AI 技术成果,从而推动 AI 与社交领域的创新与融合。

随着 Soul 在多模态 AI 生态布局的不断完善,业内专家预测,这将为社交网络、在线教育、虚拟现实等多个行业带来颠覆性的变化。可以预见,Soul 的努力将为未来的数字交互体验设定新的标杆,让我们拭目以待。

划重点:

🌟 Soul AI Lab 推出14B 参数的实时数字人生成模型 SoulXFlashTalk,具备快速响应能力和高帧率。  

🚀 开源带来项目页面、技术报告、源代码及模型权重,降低研发门槛,鼓励更多创新。  

🤝 Soul 将继续推进开源战略,推动 AI 与社交创新发展,构建多模态 AI 生态。