谷歌于当地时间 6 月 10 日正式推出了一款名为DiffusionGemma的实验性开源模型。这款模型的一大亮点在于其采用了文本扩散架构(Text-to-text diffusion),旨在通过全新的路径提升人工智能的生成效率。
在性能测试中,DiffusionGemma展现出了独特的技术优势。得益于其架构设计,该模型在专用GPU上的文本生成速度,相比传统的自回归大语言模型最高提升了 4 倍。不过,谷歌官方对此保持了客观的评价,明确指出DiffusionGemma目前定位为面向研究者与开发者的实验性产品。在模型输出质量方面,它尚无法与标准的Gemma4 相比,因此现阶段仍建议在生产环境中使用标准版本。
从应用场景来看,该模型的速度红利有着明确的边界。其性能提升主要集中在本地设备运行及低并发的推理场景中。而在面对高并发的云端部署需求时,这种架构带来的速度优势则相对有限。
为了鼓励技术社区的探索与共创,谷歌将该模型以Apache 2. 0 许可证向公众开放。此举为开发者提供了更低门槛的技术验证空间,也为AI领域探索非自回归架构的推理潜力提供了新的实验样本。尽管当前仍处于早期探索阶段,但DiffusionGemma无疑为未来提升大模型推理效率,提供了一个值得关注的技术思路。