Gemini 3.5 Flash: как начать пользоваться новым флагманом Google

Gemini 3.5 Flash - самая мощная модель Google для агентных задач. Запущена на Google I/O 19 мая 2026 года. Рассказываем, как получить доступ и что попробовать в первую очередь.

2026-05-22·8 мин

Gemini 3.5 Flash (июль 2026). Gemini Spark, персональный AI-агент на базе 3.5 Flash, переходит к бета-доступу для подписчиков Google AI Ultra в США. Spark работает в фоновом режиме 24/7, управляет почтой, создаёт документы. Gemini 3.5 Flash в 4 раза быстрее по скорости генерации по сравнению с другими фронтирными моделями. Computer Use в публичном preview: 78.4% на OSWorld-Verified.

Gemini 3.5 Flash: как пользоваться новым флагманом Google для агентных задач

Обновления Gemini 3.5 Flash (2026)

Новая compute-based система тарификации Google (с мая 2026): вместо дневных лимитов запросов введена система лимитов по вычислениям. Пользовательские compute-лимиты (для абонентов AI Pro и AI Ultra) обновляются каждые 5 часов. API-квоты для разработчиков в Vertex AI обновляются каждые 5 дней. Это разные типы лимитов -- первый влияет на работу в интерфейсе gemini.google.com, второй -- на вызовы через API. AI Pro ($20/мес) и AI Ultra ($100/мес) имеют дополнительный недельный cap на суммарное потребление.

AI Ultra план ($100/мес) открывает: Gemini Spark (проактивный личный агент 24/7), Gemini Omni (генерация видео из любого ввода), Deep Research с академическими базами данных, приоритетный доступ к Veo 3.1 и Google Pics, 20 ТБ хранилища Google One, расширенные лимиты для всех сервисов.

Gemini 3.5 Flash в API (Vertex AI и Google AI Studio): самый быстрый вариант в семействе Gemini 3. Поддерживает 1M токенов контекстного окна, function calling, JSON mode, code execution. Ценообразование на Vertex AI: $0.075 за 1M input токенов, $0.30 за 1M output.

Что такое Gemini 3.5 Flash

Gemini 3.5 Flash -- первая модель нового семейства Gemini 3.5, запущенного Google на конференции I/O 19 мая 2026. В июне 2026 года модель достигла статуса GA (general availability) и стала моделью по умолчанию для пользователей Gemini Enterprise года. Это не просто очередная версия Flash-серии: 3.5 Flash сочетает фронтирный интеллект со скоростью -- в 4 раза быстрее по количеству выходных токенов в секунду по сравнению с другими фронтирными моделями. Google позиционирует её как главную модель для агентных приложений следующего поколения.

Ключевые характеристики: контекстное окно 2 миллиона токенов, нативная поддержка текста, изображений, аудио и видео, усиленные механизмы безопасности. В внутренних тестах Google модель самостоятельно создала операционную систему -- это демонстрирует способность выполнять сложные многоэтапные задачи без помощи человека.

Обязательный стандарт для корпоративных пользователей

С 8 июня 2026 года Gemini 3.5 Flash стал моделью по умолчанию для всех пользователей Gemini Enterprise и не может быть отключён. Это означает, что организации, использующие Gemini через Google Workspace Business или Enterprise, автоматически работают с 3.5 Flash. Для явного использования 3.1 Pro необходимо указывать идентификатор gemini-3.1-pro в настройках интеграции или API-запросах.

Для IT-администраторов: при переходе на 3.5 Flash как дефолтную модель Google также обновила квоты API. Если вы заметили изменения в лимитах запросов -- это часть перехода. API-квоты в Vertex AI обновляются каждые 5 дней (ранее -- ежедневно). Пользовательские лимиты в интерфейсе gemini.google.com -- отдельная система, обновляющаяся каждые 5 часов. Новая система более гибкая для задач с неравномерной нагрузкой.

Ключевые бенчмарки Gemini 3.5 Flash

На момент выпуска (Google I/O, май 2026) Gemini 3.5 Flash превзошёл Gemini 3.1 Pro по ряду ключевых показателей при значительно более низкой задержке:

MMLU (общие знания): 3.5 Flash превосходит 3.1 Pro при вдвое меньшей стоимости запроса
HumanEval (программирование): улучшенные результаты на задачах кодирования по сравнению с предыдущим поколением
Скорость вывода: в 4 раза быстрее по количеству выходных токенов в секунду по сравнению с другими фронтирными моделями
Мультимодальные задачи: нативная поддержка видео и аудио без отдельного модуля, улучшенное понимание длинных видеоматериалов

Google рекомендует 3.5 Flash как дефолтный выбор для большинства задач. Для специализированных сценариев с максимальной точностью долгосрочного планирования 3.1 Pro по-прежнему актуален.

Параметр thinking_effort: MEDIUM по умолчанию

Gemini 3.5 Flash поддерживает параметр thinking_effort (аналог thinking_level в 3.1 Pro) для управления глубиной рассуждения. Значение по умолчанию для 3.5 Flash -- MEDIUM. Доступные варианты: NONE (без рассуждений, максимальная скорость), LOW, MEDIUM (по умолчанию), HIGH. Параметр передаётся через поле generation_config в API.

Совет: для агентных задач с большим количеством вызовов используйте NONE или LOW, чтобы снизить задержку на каждом шаге. Для финальной синтезирующей задачи переключайтесь на HIGH. Это позволяет балансировать скорость и качество в многоагентных пайплайнах.

Зачем нужен именно Gemini 3.5 Flash

Проблема большинства фронтирных моделей -- медленная генерация. Когда агент выполняет 20-50 шагов подряд, даже небольшая задержка на каждом шаге превращается в минуты ожидания. Gemini 3.5 Flash решает это: 4-кратное ускорение означает, что агентные задачи, занимавшие 20 минут, теперь выполняются за 5.

При этом 3.5 Flash не жертвует качеством. По бенчмаркам кодирования, агентных и мультимодальных задач модель превосходит Gemini 3.1 Pro -- более тяжёлый флагман -- при значительно меньшей задержке. Это делает Flash предпочтительным выбором для большинства продуктивных сценариев.

Как получить доступ к Gemini 3.5 Flash

Через приложение Gemini (gemini.google.com) -- для обычных пользователей

Шаг 1: Откройте Gemini. Перейдите на gemini.google.com в браузере или откройте приложение Gemini на смартфоне (iOS / Android). Войдите в аккаунт Google.

Шаг 2: Проверьте доступ. Gemini 3.5 Flash доступен в нескольких режимах: базовый доступ -- бесплатно для всех аккаунтов Google с лимитами; расширенный доступ -- подписчикам Google AI Pro ($20 в месяц) или AI Ultra ($100 в месяц) без ограничений по квоте.

Шаг 3: Выберите модель. В интерфейсе Gemini нажмите на выпадающее меню модели (обычно в верхней части или слева от поля ввода). Выберите Gemini 3.5 Flash. Если в меню только более старые модели -- обновите браузер и убедитесь, что подписка активна.

Шаг 4: Начните работу. Введите запрос или загрузите файл через кнопку-скрепку. Flash работает с документами PDF, изображениями, аудиофайлами и видео. Для длинных документов используйте 2-миллионный контекст -- загружайте файлы целиком, не разрезая.

Через Google AI Studio -- для разработчиков и тестирования

Шаг 1: Откройте aistudio.google.com и войдите через аккаунт Google. AI Studio предоставляет бесплатный доступ с ограниченными квотами -- идеально для тестирования и разработки прототипов.

Шаг 2: В AI Studio выберите New prompt и в меню модели укажите gemini-3.5-flash. Доступны все параметры: системный промпт, температура, контекст, инструменты (поиск, выполнение кода).

Шаг 3: Нажмите Get API key для получения ключа. Ключ бесплатный и работает сразу. Используйте его в коде через библиотеки google-generativeai (Python) или @google/generative-ai (JavaScript).

Через Google Search AI Mode

Gemini 3.5 Flash лежит в основе AI Mode в Google Поиске -- обновлённого режима, где поиск генерирует структурированные ответы с источниками. AI Mode доступен в Google Search на мобильных устройствах и в браузере (постепенное развёртывание, сначала в США).

Ценообразование API

На момент написания тарифы Gemini 3.5 Flash в Google AI Studio составляют около $1.50 за миллион входящих токенов и $9.00 за миллион исходящих токенов. Важно: тарифы Vertex AI (корпоративная платформа) существенно ниже - около $0.075 за 1M входящих и $0.30 за 1M исходящих токенов (на момент написания). Это разные платформы с разной ценовой политикой: AI Studio ориентирован на разработчиков и эксперименты, Vertex AI - на корпоративные production-системы с корпоративными SLA.

Бесплатный уровень AI Studio: определённое количество запросов в минуту и в день без оплаты. Лимиты указаны в документации на ai.google.dev -- для большинства задач разработки и прототипирования бесплатного уровня достаточно.

Для высоконагруженных продуктивных систем Google рекомендует Vertex AI: там доступны корпоративные SLA, расширенные квоты и интеграция с Google Cloud инфраструктурой (IAM, VPC, аудит).

Контекстное окно 2 миллиона токенов

2 миллиона токенов -- это около 1 500 000 слов. Практически это означает:

Весь роман в виде одного запроса -- и вопросы по любой его части

Несколько тысяч строк кода с полным контекстом репозитория

Стенограмма нескольких часов совещаний для анализа и выводов

Десятки научных статей для систематического обзора

Как использовать на практике: в AI Studio можно загрузить файл до 2 ГБ или передать очень длинный текст напрямую. В интерфейсе Gemini -- загрузить файл или вставить текст в поле ввода. Модель сама определяет, где применить длинный контекст.

Агентные возможности

Gemini 3.5 Flash разработан для агентных сценариев -- когда модель выполняет последовательность действий без постоянного участия пользователя.

Инструменты в AI Studio: включите Google Search (модель сама ищет актуальную информацию) и Code execution (выполняет Python-код, строит графики, обрабатывает данные). Оба инструмента активируются переключателями в правой панели AI Studio.

Агентное программирование: попросите модель реализовать функцию по описанию, написать тесты, запустить их, исправить ошибки -- всё в одном запросе. Flash-скорость делает итерации в 4 раза быстрее по сравнению с другими фронтирными моделями.

Построение агентных приложений: используйте Google Antigravity 2.0 -- платформу для агентных приложений на основе Gemini 3.5 Flash. Именно на ней построен Gemini Spark (персональный AI-агент для пользователей AI Ultra).

Gemini 3.5 Pro: когда ожидать

Google объявила о Gemini 3.5 Pro как о более мощной версии нового семейства. По состоянию на 9 июня 2026 года модель остаётся в ограниченном Vertex preview. GA (General Availability) ожидался в июне, однако точная дата не подтверждена. Следите за официальными обновлениями на ai.google.dev.

До выхода 3.5 Pro рекомендуемая стратегия: используйте 3.5 Flash для большинства задач (быстрее и дешевле), переключайтесь на Gemini 3.1 Pro там, где нужна максимальная глубина рассуждения.

Доступ из России

Gemini и Google AI Studio могут быть ограничены с российских IP-адресов. Потребуется VPN с серверами в США или Европе.

ProtonVPN -- есть бесплатный план. Скачайте на protonvpn.com.

Mullvad VPN -- высокая конфиденциальность, от 5 евро в месяц.

Cloudflare WARP -- бесплатный, простая установка. Скачайте на 1.1.1.1/warp.

Оплата: Google AI Pro/Ultra принимает Visa и Mastercard. Карты российских банков не принимаются. Используйте виртуальную карту Wise или Revolut. Бесплатный уровень AI Studio работает без карты.

Советы по эффективной работе

Для анализа документов: загружайте документы целиком, не разрезайте на части. Задавайте конкретные вопросы с указанием, что именно нужно найти. Flash удержит весь документ в контексте и вернётся к нужному месту точно.

Для кодинга: используйте Code execution в AI Studio -- модель не только напишет код, но и сразу выполнит его, покажет результат, исправит ошибки. Это ускоряет разработку в разы по сравнению с ручным тестированием.

Для агентных задач: чётко описывайте критерии успеха. Например: "задача выполнена, когда: 1) все тесты проходят, 2) README обновлён, 3) нет предупреждений линтера". Gemini 3.5 Flash будет следовать этим критериям до достижения результата.

Для мультимодальных задач: Flash-скорость делает итеративное взаимодействие с изображениями и видео практичным. Загрузите фото -- спросите об объектах, тексте, контексте. Загрузите короткое видео -- попросите описать происходящее, найти ключевые моменты, составить таймкоды.

Daily Brief в приложении Gemini: Персонализированная утренняя сводка от Gemini, которая агрегирует информацию из Gmail, Google Calendar, новостей и задач. Запускается автоматически или по запросу. Помогает начать день с пониманием приоритетов. Доступна в приложении Gemini на iOS и Android для AI Pro и Ultra подписчиков.

Новые интеграции Gemini 3.5 Flash (июнь 2026): OpenTable (поиск и бронирование ресторанов через Gemini), Canva (создание и редактирование дизайнов через диалог с Gemini), Instacart (заказ продуктов через AI-ассистента). Интеграции подключаются через Extensions в настройках приложения Gemini.

Gemini в Chrome для Android: Google анонсировал встроенную интеграцию Gemini в браузер Chrome для Android - запуск ожидается в конце июня 2026 года. Пользователи смогут обращаться к Gemini прямо из браузера, не переключаясь в отдельное приложение.

Обновления июня 2026: С 8 июня Gemini 3.5 Flash стал моделью по умолчанию для корпоративных пользователей. Квоты API были сброшены в связи с переходом на новую систему тарификации. Представлен вариант Gemini 3.5 Flash Low с более низкой стоимостью для высоконагруженных задач. Квоты обновляются каждые 5 дней.

РАЗРАБОТЧИКАМ: Gemini CLI прекратил работу 18 июня 2026 года. Если вы использовали Gemini CLI для взаимодействия с Gemini API, необходимо перейти на Antigravity CLI. Команда установки: npm install -g @google/agy. Корпоративные клиенты (Google AI Standard и выше) сохраняют доступ к Gemini CLI согласно условиям контракта. Подробности: ai.google.dev/gemini-api/docs/deprecations

Новые возможности июня 2026: агенты, мультимодальный поиск, Vibe Coding

Managed Agents в Gemini API (публичный preview, июнь 2026): Google открыл публичный preview управляемых агентов (Managed Agents) в Gemini API. Это stateful агенты (с постоянным состоянием между вызовами), работающие в изолированном Linux sandbox, который Google хостирует на своей инфраструктуре. В отличие от обычных function calling агентов, Managed Agents могут выполнять долгосрочные задачи, сохранять промежуточные результаты и возобновлять работу с прерванного места. Подключить можно через Google AI Studio или Vertex AI - в разделе Agents создайте новый managed agent и настройте инструменты (поиск, выполнение кода, вызов внешних API). Managed Agents идеально подходят для многошаговых рабочих процессов: сбор данных, обработка файлов, автоматизация отчётности.

Multimodal File Search через gemini-embedding-2 (июнь 2026): Новая модель эмбеддингов gemini-embedding-2 достигла статуса GA (general availability) и открывает мультимодальный семантический поиск по изображениям. В отличие от текстового поиска, gemini-embedding-2 создаёт векторные представления для текста, изображений, аудио и видео в едином пространстве эмбеддингов. Это означает возможность искать по изображениям через текстовый запрос ("найди все фотографии с закатами") или по визуальному примеру. Как использовать через API: загружайте файлы через Files API, создавайте эмбеддинги через gemini-embedding-2, храните в векторной БД (Vertex AI Vector Search, Pinecone). Это открывает новые возможности для мультимодального поиска в корпоративных базах знаний и медиаархивах.

Vibe Coding (июнь 2026): Google запустил Vibe Coding - функцию, позволяющую преобразовывать рисунки от руки (hand drawings) в готовый React-код. Нарисуйте макет интерфейса или схему компонента от руки (на бумаге или в приложении для рисования) и загрузите изображение в Google AI Studio. Gemini 3.5 Flash анализирует рисунок и генерирует функциональный React-компонент с соответствующей структурой, пропсами и базовыми стилями. Функция особенно полезна на этапе прототипирования: дизайнеры могут напрямую превращать скетчи в код без промежуточного этапа детального проектирования. Доступна в Google AI Studio через раздел Vibe Coding или напрямую через Gemini API.

Тариф Gemini Ultra ($200/мес): расширенный доступ к 3.5 Flash. Google добавил тариф Gemini Ultra стоимостью около 200 долларов в месяц на момент написания. По сравнению с AI Ultra ($100/мес) он предоставляет вдвое больший compute-лимит на Gemini 3.5 Flash, приоритетную очередь в периоды высокой нагрузки и расширенную API-квоту для интенсивных рабочих нагрузок. Подходит командам и разработчикам, у которых заканчиваются лимиты стандартного AI Ultra.

Gemini 3.5 Flash Computer Use (июнь 2026)

Gemini 3.5 Flash получил возможность нативного управления компьютером (Computer Use) - публичный preview запущен 24 июня 2026. Модель выполняет действия в браузере, перемещает файлы, управляет приложениями. Результат: 78.4% на тесте OSWorld-Verified. Доступен через Gemini API.

Gemini 3.5 Flash Computer Use: браузер, мобильные приложения и рабочий стол. В публичном preview Computer Use (24 июня 2026) модель поддерживает три режима управления: управление браузером (открытие сайтов, клики, заполнение форм), управление мобильными приложениями (Android-приложения через эмулятор) и управление рабочим столом (файловая система, приложения). Счет OSWorld-Verified 78.4% -- лучший результат среди моделей с Computer Use на момент релиза. Доступен через Gemini API с параметром tools=[{"computerUse": {}}].

Обновление: июль 2026

Важно для разработчиков: Google объявила об отключении Gemini 2.5 Pro и Gemini 3 Flash во всех продуктах GitHub Copilot 31 июля 2026 года. До этой даты нужно перейти на Gemini 3.1 Pro или Gemini 3.5 Flash в настройках Copilot. Сами модели через Gemini API продолжают работать -- отключение касается только интеграции с Copilot.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:Gemini Google LLM языковые модели

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Как начать пользоваться Agno: Python-фреймворк для создания AI-агентов

Agno (бывший phidata) - один из самых популярных Python-фреймворков для построения AI-агентов с 39k+ звезд на GitHub. Пошаговый гайд: установка, первый агент за 5 минут, мультиагентные команды и деплой в продакшн.

2026-07-14·8 мин

С чего начать·Гайд

Seedance 2.5: как начать пользоваться генератором видео от ByteDance

Seedance 2.5 от ByteDance генерирует нативное 30-секундное видео в один проход, принимает до 50 мультимодальных референсов и позволяет редактировать отдельные фрагменты без перегенерации всего клипа.

2026-07-13·7 мин

С чего начать·Гайд

ChatGPT Work: как начать пользоваться агентным рабочим столом OpenAI

9 июля 2026 OpenAI запустила ChatGPT Work -- агента, который берёт у вас целый проект, сам планирует шаги, работает часами в фоне и возвращает готовый документ, таблицу или презентацию.

2026-07-13·8 мин