Google DeepMind выпустил Gemma 4 12B — мультимодальная модель, которая работает на ноутбуке
12 миллиардов параметров, нативный звук, видео и картинки — и всё это запускается локально на MacBook с 16 ГБ памяти.
🔴 Google DeepMind выпустил Gemma 4 12B — мультимодальная модель, которая работает на ноутбуке
Сегодня Google DeepMind выложил Gemma 4 12B в открытый доступ на Hugging Face и Kaggle под Apache 2.0 — то есть бесплатно и для коммерческого использования. Главное: модель на 12 миллиардов параметров одновременно понимает текст, картинки, видео и звук — и запускается локально на ноутбуке с 16 ГБ памяти, включая Apple Silicon. Никакого OpenAI API, никакой подписки, никаких токенов в облаке.
Архитектура необычная: вместо отдельных «переводчиков» для звука и изображений (так делали раньше) DeepMind встроил все типы данных прямо в одну модель. Звук на частоте 16 кГц нарезается на кадры по 40 миллисекунд и подаётся напрямую — без 12 промежуточных слоёв, которые использовались в предыдущих версиях. Картинки разбиваются на патчи 48×48 пикселей через крошечный embedder на 35 миллионов параметров. Google заявляет, что модель работает почти на уровне 26-миллиардной MoE-версии при вдвое меньшей памяти и распознаёт речь, различает голоса собеседников и понимает 5-минутные видео.
Для российского предпринимателя это конкретная возможность: транскрипция звонков, анализ видео-встреч, голосовые ассистенты для клиентов — всё без отправки данных в США. Если у вас есть MacBook Pro M-серии или любой ноутбук с 16 ГБ — у вас на руках инфраструктура, за которую год назад брали $20 в месяц за пользователя. Качество свободных моделей перешло черту, после которой строить продукт на чужом API всё чаще становится дороже, чем на своём железе.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
#нейросети #LLM #модели #агентыИИ #мультимодальность #Google #Gemini #GPU #ИИ #технологии #AravanaAI
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.