每秒1000token,谷歌新模型给AI推理换引擎谷歌DeepMind又出手了。这次不是Gemma 4的迭代,而是一个全新的方向,文本扩散模型DiffusionGemma。260亿参数,单卡H100每秒狂吐1000个token,速度是自回归模型的4倍...24小时AI快讯# AI资讯# DiffusionGemma# 扩散模型10小时前01550