Google DeepMind показал, как уйти от пословной генерации текста — в 4 раза быстрее

DiffusionGemma рисует сразу блоки текста, как картинки, и выдаёт 1000+ токенов в секунду на одной H100.

Aravana·2026-06-10·1 мин

🔴 Google DeepMind показал, как уйти от пословной генерации текста — в 4 раза быстрее

Обычные языковые модели печатают слово за словом, как ребёнок учится читать. Google DeepMind показал другой путь: модель стартует с холста из случайных токенов и за несколько проходов «проявляет» осмысленный текст — так же, как из шума рождаются картинки в Midjourney.

DiffusionGemma — это 26 миллиардов параметров в архитектуре «смесь экспертов» (Mixture of Experts), из которых на запуске работают только 3,8 миллиарда. За один проход модель параллельно генерирует 256 токенов и выдаёт более 1000 токенов в секунду на одной NVIDIA H100 и 700+ на бытовой видеокарте RTX 5090 — в 4 раза быстрее обычной авторегрессивной генерации. Модель открытая, лицензия Apache 2.0, уже встроена в vLLM и Hugging Face. Сама команда честно предупреждает: для максимального качества всё ещё нужна стандартная Gemma 4.

Для бизнеса это сигнал: скорость отклика AI-агентов перестаёт быть проблемой инфраструктуры. То, что вчера требовало стойки дорогих ускорителей, завтра уместится на одной карте. Если у вас есть продукт, где задержка убивает опыт — голосовые ассистенты, поиск, кодогенерация — пора пересматривать юнит-экономику.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #Google #Gemini #NVIDIA #GPU #чипы #BigTech #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:Telegram X LinkedIn

Как вам материал?

Daily Digest - 25 июля 2026

Anthropic перехватила темп у OpenAI, Meta развернула ассистента в исполнителя, а Пентагон уже делит рынок тел - гонка расщепилась на три оси.

2026-07-25·6 мин

AI·Ежедневный обзор

Daily Digest - 24 июля 2026

Пока рынок спорит, чья модель умнее, ИИ тихо перестаёт жить на экране: сегодня он берёт на себя работу, встраивается в чипы и собирает лекарства за год вместо пяти.

2026-07-24·6 мин

AI·Ежедневный обзор

Daily Digest — 23 июля 2026

Alphabet отчитался о рекордных $112 млрд прибыли, AMD впервые всерьёз потеснил NVIDIA, Microsoft присматривается к китайской модели, а AI-агент OpenAI сам взломал реальную компанию.

2026-07-23·6 мин