​Soul 开源实时数字人生成模型SoulXFlashTalk 实现亚秒级延迟

近日，Soul AI Lab 宣布正式开源业内首个拥有14亿参数的实时数字人生成模型 ——SoulXFlashTalk。这个模型的特别之处在于，它能够实现亚秒级延迟和每秒32帧的高帧率，为行业提供了一套完整的实时交互解决方案。

SoulXFlashTalk 的开源意味着开发者将可以轻松访问相关的项目页面、技术报告、源代码和模型权重，形成一个全面开放的体系。这一举措不仅能有效降低行业内的研发门槛，也将为更多的创新项目提供基础支持。值得一提的是，早在去年10月，Soul 便已经开源了语音合成模型 SoulXPodcast，此次的开源标志着 Soul 在 “语音 + 视觉” 双模态开源矩阵的布局上又迈出了重要一步。

Soul 的开源战略并不仅限于技术的共享，更是希望通过开放的方式，促进 AI 生态的共同发展。公司表示，未来将继续坚持开源路线，开放更多 AI 技术成果，从而推动 AI 与社交领域的创新与融合。

随着 Soul 在多模态 AI 生态布局的不断完善，业内专家预测，这将为社交网络、在线教育、虚拟现实等多个行业带来颠覆性的变化。可以预见，Soul 的努力将为未来的数字交互体验设定新的标杆，让我们拭目以待。

划重点:

🌟 Soul AI Lab 推出14B 参数的实时数字人生成模型 SoulXFlashTalk，具备快速响应能力和高帧率。

🚀 开源带来项目页面、技术报告、源代码及模型权重，降低研发门槛，鼓励更多创新。

🤝 Soul 将继续推进开源战略，推动 AI 与社交创新发展，构建多模态 AI 生态。