Вышла экспериментальная модель DiffusionGemm от Google — она генерирует текст через диффузию
Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.