Как начать пользоваться Gemini 3.5 Pro -- флагман Google с 2M-токенным контекстом
Подробный гайд по самой мощной модели Google 2026 года: контекст 2 миллиона токенов, режим Deep Think и мультимодальность для разработчиков, исследователей и продвинутых пользователей.
Что это и для кого
Gemini 3.5 Pro -- флагманская языковая модель Google DeepMind, анонсированная на Google I/O в мае 2026 года. По состоянию на конец июня 2026 года модель находится в ограниченном корпоративном preview -- общая доступность (GA) перенесена на июль 2026 года. Это не просто обновление предыдущих версий -- это принципиально новый уровень возможностей для самых сложных задач: юридического анализа многотомных дел, разбора гигантских кодовых баз, глубокого научного исследования и расширенного мультимодального понимания одновременно.
Главное, чем Gemini 3.5 Pro отличается от предшественников -- контекстное окно в 2 миллиона токенов. Для понимания масштаба: средний роман Льва Толстого занимает около 580 000 токенов, а «Война и мир» -- примерно 1,2 миллиона. Это значит, что в одном разговоре вы можете загрузить весь корпус русской классики, полный исходный код крупного проекта или несколько лет корпоративной переписки -- и модель будет удерживать всё это в рабочей памяти, не теряя контекст между вопросами.
Второй ключевой элемент -- режим Deep Think. Это отдельный режим рассуждения, в котором модель намеренно замедляет темп ответа, чтобы выстроить многоуровневую цепочку мыслей перед финальным ответом. Эффект особенно заметен на математических задачах уровня Олимпиады, сложных стратегических вопросах и задачах программирования с нетривиальными зависимостями между модулями.
Gemini 3.5 Pro занимает место выше Gemini 3.1 Pro и Gemini 3.5 Flash в иерархии Google. Если Flash -- это скорость и доступность, то Pro -- это максимальная глубина анализа при работе с большими объёмами данных. На Arena Leaderboard (lmarena.ai) модель входит в тройку лидеров по общей производительности наравне с Claude Fable 5 и GPT-5.5 Pro.
Кому нужен Gemini 3.5 Pro: разработчикам, которым нужно разобраться в большом легаси-коде; юристам и аналитикам, работающим с объёмными документами; исследователям, загружающим научные статьи для перекрёстного анализа; специалистам по данным, обрабатывающим длинные таблицы и CSV-файлы; и всем, кто уже использует Gemini 3.5 Flash или Gemini 3.1 Pro, но сталкивается с ограничениями контекста.
Тем, кто только начинает работать с AI-моделями, лучше стартовать с Gemini 3.5 Flash -- он быстрее, дешевле и покрывает большинство повседневных задач. Gemini 3.5 Pro имеет смысл, когда вы чётко понимаете, зачем вам нужны именно 2 миллиона токенов или режим глубокого рассуждения.
Как зарегистрироваться и получить доступ
Для доступа к Gemini 3.5 Pro существует несколько путей в зависимости от того, для чего вы собираетесь использовать модель -- как обычный пользователь или как разработчик.
Путь 1: Через приложение Gemini (для пользователей)
Перейдите на сайт gemini.google.com или установите приложение Gemini на смартфон через App Store или Google Play. Войдите через существующий аккаунт Google или создайте новый. Базовый уровень даёт доступ к Gemini 3.5 Flash бесплатно. Для переключения на Gemini 3.5 Pro нажмите на название модели в левом верхнем углу диалогового окна -- откроется выпадающий список. Выберите «Gemini 3.5 Pro» и подтвердите переход к платной подписке.
Google One AI Premium в тарифе Pro стоит около 20 долларов в месяц и включает Gemini 3.5 Pro с 2M-контекстом, но без режима Deep Think. Тариф Ultra стоит около 250 долларов в месяц и открывает Deep Think, а также более высокие лимиты использования. Оба тарифа включают 2 ТБ хранилища Google Drive и другие преимущества экосистемы Google.
Путь 2: Через Google AI Studio (для разработчиков)
Google AI Studio по адресу aistudio.google.com -- это бесплатный инструмент для тестирования и прототипирования. После входа через аккаунт Google выберите в разделе «Model» пункт gemini-3.5-pro. Бесплатный уровень предоставляет 50 запросов в сутки к этой модели, что достаточно для экспериментов. Для создания API-ключа нажмите «Get API key» в левом меню -- ключ понадобится для интеграции в код.
Если вам нужны более высокие лимиты, активируйте платный API через Google Cloud Console: создайте проект, привяжите платёжный метод и выберите тарифный план. После активации биллинга AI Studio автоматически переключится на платные квоты.
Путь 3: Через корпоративные платформы
Gemini 3.5 Pro доступен через Google Cloud Vertex AI, Amazon Bedrock и Microsoft Azure AI Foundry. Эти каналы предназначены для корпоративных клиентов, которым нужны гарантии SLA, соответствие требованиям HIPAA, SOC-2 и GDPR, а также выделенные квоты без ограничений по скорости. Если ваша компания уже работает с одним из облачных провайдеров, обратитесь к своему аккаунт-менеджеру для подключения модели через существующий контракт.
Первый запуск -- что попробовать
После входа убедитесь, что в интерфейсе активна именно модель Gemini 3.5 Pro, а не Flash или более ранняя версия. В веб-приложении это отображается в заголовке чата. Если нужная модель не выбрана -- смените её через выпадающее меню.
Тест 1: Большой документ
Загрузите PDF-файл объёмом 200 и более страниц через иконку вложения в поле ввода. Подойдёт годовой отчёт публичной компании, техническая документация или художественная книга в открытом доступе. Задайте вопрос: «Составь структурированное резюме этого документа на трёх уровнях: краткое (3 предложения), среднее (один абзац на каждую главу) и подробное (ключевые тезисы с цитатами и номерами страниц).» Модель обработает весь документ целиком, не теряя детали из середины -- это главное практическое преимущество 2M-контекста.
Тест 2: Режим Deep Think
Если у вас подписка Ultra, в нижней части поля ввода появится переключатель Deep Think. Активируйте его и задайте сложную задачу -- математическую, логическую или архитектурную. Например: «Найди все архитектурные проблемы в следующем Python-коде и предложи рефакторинг с детальным обоснованием каждого изменения.» Ответ займёт больше времени, но вы увидите промежуточные шаги рассуждения, которые помогут понять логику решения.
Тест 3: Мультимодальный запрос
Загрузите изображение -- скриншот интерфейса приложения, архитектурную схему или инфографику. Спросите: «Опиши что изображено, выяви потенциальные проблемы с точки зрения UX/архитектуры и предложи конкретные улучшения с обоснованием.» Gemini 3.5 Pro анализирует текст и визуальную часть в единой сессии, что особенно полезно для дизайнеров и технических аналитиков.
Тест 4: Работа с кодовой базой
Вставьте несколько файлов исходного кода прямо в чат (через вложения или копирование). Задайте вопрос: «Как эти модули взаимодействуют между собой? Где могут быть проблемы с производительностью или утечки памяти?» При больших кодовых базах 2M-контекст позволяет держать весь проект в памяти без разбиения на части.
Ключевые фишки
2 миллиона токенов контекста
Это крупнейшее контекстное окно среди коммерчески доступных моделей на момент выхода этого гайда. Практически это означает: можно загрузить несколько часов транскриптов переговоров, полный исходный код монорепозитория или несколько лет корпоративной переписки -- и задавать вопросы по всему массиву одновременно. Это меняет рабочий процесс: вместо ручного разбиения документов на части и многократного обращения к модели -- один непрерывный разговор с полным контекстом. Качество ответов на вопросы о взаимосвязях внутри документа значительно выше, когда модель видит картину целиком.
Deep Think: режим расширенного рассуждения
Режим Deep Think -- это реализация многоуровневого рассуждения, встроенная непосредственно в интерфейс. Когда он активирован, модель перед финальным ответом строит внутреннюю цепочку логических шагов и показывает её пользователю в виде развёрнутого «черновика мышления». Это полезно в трёх основных сценариях: математические и логические задачи (олимпиады, инженерные расчёты, финансовое моделирование); многошаговое планирование (бизнес-стратегии, архитектура систем, составление роадмапов); отладка кода с нетривиальными зависимостями между модулями. В тестах на GPQA Diamond (аспирантские вопросы по физике, химии, биологии) Gemini 3.5 Pro с Deep Think показал результаты, сопоставимые с Claude Fable 5.
Мультимодальное понимание
Gemini 3.5 Pro обрабатывает текст, изображения, аудио, видео и код в рамках единой сессии. Можно загрузить видеозапись совещания длиной до одного часа, и модель одновременно: транскрибирует речь, выделит ключевые решения, свяжет сказанное с приложенными документами и сгенерирует структурированный протокол. Для исследователей и аналитиков это позволяет заменить несколько специализированных инструментов одним разговором с моделью.
Нативные интеграции Google
Через корпоративный тариф Gemini 3.5 Pro встраивается в Google Workspace: в Gmail модель читает всю переписку с контрагентом и помогает формулировать ответы с учётом истории диалога; в Google Docs генерирует разделы документов на основе черновых заметок; в Google Sheets анализирует данные и строит формулы по описанию задачи на русском языке. Этот уровень интеграции делает модель особенно полезной для тех, кто уже работает в экосистеме Google.
API и экосистема разработчиков
Gemini 3.5 Pro поддерживает REST API, Python SDK (библиотека google-genai), JavaScript SDK, а также подключение через LangChain и LlamaIndex. Модель поддерживает function calling (вызов внешних функций из ответа), JSON mode (структурированный вывод) и grounding -- привязку ответов к актуальным данным через Google Search. Это делает модель пригодной для построения агентных систем, которые не просто отвечают на вопросы, но и предпринимают действия во внешних сервисах.
Цены и ограничения
Стоимость доступа к Gemini 3.5 Pro зависит от способа использования. Ниже приведены ориентировочные цены на момент написания гайда -- актуальные тарифы всегда проверяйте на официальном сайте Google, так как они могут меняться.
Потребительские подписки: Google One AI Premium (Pro-уровень) обходится примерно в 20 долларов в месяц и включает Gemini 3.5 Pro с 2M-контекстом без Deep Think. Тариф Ultra стоит около 250 долларов в месяц и открывает режим Deep Think и приоритетный доступ к ресурсам. Оба тарифа включают 2 ТБ хранилища Google Drive и ряд других преимуществ экосистемы Google.
API-тарифы: Бесплатный уровень в Google AI Studio даёт 50 запросов в сутки к Gemini 3.5 Pro -- достаточно для прототипирования. Платный API стоит примерно 15 долларов за миллион входных токенов и 60 долларов за миллион выходных. Для сравнения, Gemini 3.5 Flash обходится примерно в 10 раз дешевле, поэтому для большинства повседневных задач, где не требуется 2M-контекст или Deep Think, Flash экономичнее.
Технические ограничения: Несмотря на заявленный лимит в 2 миллиона токенов, стоимость обработки растёт пропорционально длине контекста. При длинных промптах через бесплатный уровень возможны ошибки превышения квоты. В этом случае переключитесь на платный API или уменьшите объём передаваемых данных. Ограничения на скорость: 2 запроса в минуту и 50 в сутки на бесплатном уровне; на платном -- определяется квотой вашего Google Cloud-проекта и может быть расширена по заявке.
Нужен ли VPN из России
Да, VPN необходим. Google Gemini недоступен из России без дополнительных инструментов -- это касается как веб-версии gemini.google.com, так и мобильного приложения и прямых API-запросов с российских IP-адресов. Google ограничил доступ к своим AI-сервисам для российских пользователей, и Gemini 3.5 Pro не является исключением.
Для работы понадобится VPN-сервис с серверами в США, Европе или других разрешённых регионах. Среди проверенных вариантов с хорошей скоростью: Mullvad, ProtonVPN, ExpressVPN, Windscribe. Бесплатные VPN обычно имеют ограничения по скорости и трафику, что неудобно при загрузке больших документов.
При регистрации аккаунта Google и подключении платной подписки также используйте VPN -- российские карты международных платёжных систем не принимаются сервисами Google с 2022 года. Для оплаты подойдут виртуальные карты зарубежных финансовых сервисов или оплата через иностранный Google-аккаунт с зарубежным платёжным методом.
Для API-доступа через Google AI Studio первоначальную регистрацию и создание ключа проводите через VPN. После получения ключа часть разработчиков сообщает о возможности делать API-запросы без VPN напрямую, однако это зависит от конкретного интернет-провайдера и не гарантировано. Серверы в Финляндии, Нидерландах или Германии обычно дают меньшую задержку из России, чем американские, что важно при интерактивной работе с моделью в реальном времени.
ВАЖНО: статус доступности Gemini 3.5 Pro (по состоянию на 28 июня 2026). Несмотря на анонс на Google I/O в мае 2026, Gemini 3.5 Pro по-прежнему не находится в общем доступе (GA). Модель доступна только в ограниченном корпоративном Vertex AI preview. GA ожидается в июле 2026 года. До выхода GA рекомендуется использовать Gemini 3.5 Flash для большинства задач или Gemini 3.1 Pro для максимального качества рассуждений.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Как начать пользоваться Claude Opus 4.8: флагман Anthropic и лидер Arena
Claude Opus 4.8 вышел 28 мая 2026 и занял первое место в рейтинге Arena с ~1510 ELO. Разбираем, что нового в этой версии и как её использовать.
Как начать пользоваться GLM-5.2: лучшая open-source модель для кода от Z.ai
GLM-5.2 от Z.ai вышел 13 июня 2026 и занял первое место среди open-source моделей на Terminal-Bench и SWE-bench Pro. MIT-лицензия, 1M токенов контекст, бесплатный API.
Как начать пользоваться Niteshift: облачная платформа для AI coding-агентов
Niteshift запустился в июне 2026 и решает главную проблему AI-агентов для кода: даёт им полноценную облачную среду разработки. Claude Code, Codex и OpenCode работают в изолированных облачных окружениях.