谷歌发布DiffusionGemma：尝试用文本扩散架构提速AI推理

谷歌于当地时间 6 月 10 日正式推出了一款名为DiffusionGemma的实验性开源模型。这款模型的一大亮点在于其采用了文本扩散架构（Text-to-text diffusion），旨在通过全新的路径提升人工智能的生成效率。

在性能测试中，DiffusionGemma展现出了独特的技术优势。得益于其架构设计，该模型在专用GPU上的文本生成速度，相比传统的自回归大语言模型最高提升了 4 倍。不过，谷歌官方对此保持了客观的评价，明确指出DiffusionGemma目前定位为面向研究者与开发者的实验性产品。在模型输出质量方面，它尚无法与标准的Gemma4 相比，因此现阶段仍建议在生产环境中使用标准版本。

从应用场景来看，该模型的速度红利有着明确的边界。其性能提升主要集中在本地设备运行及低并发的推理场景中。而在面对高并发的云端部署需求时，这种架构带来的速度优势则相对有限。

为了鼓励技术社区的探索与共创，谷歌将该模型以Apache 2. 0 许可证向公众开放。此举为开发者提供了更低门槛的技术验证空间，也为AI领域探索非自回归架构的推理潜力提供了新的实验样本。尽管当前仍处于早期探索阶段，但DiffusionGemma无疑为未来提升大模型推理效率，提供了一个值得关注的技术思路。