Экономика AI-моделей: цены упали в 10 раз за год, и падение продолжается
GPT-4 Turbo стоил $30 за миллион токенов в 2024, GPT-5 — $3. Конкуренция и оптимизация обрушивают цены.
Тип материала: research
Экономика AI-моделей переживает дефляцию, которая напоминает ранний интернет. Стоимость инференса (обработки запросов) падает на 10x каждые 12-18 месяцев. GPT-4 Turbo стоил $30/млн токенов на входе в 2024. GPT-5 предлагает сопоставимое качество за $3.
Причины: конкуренция (OpenAI, Anthropic, Google, Meta, Mistral, десятки китайских компаний), оптимизация (квантизация, дистилляция, speculative decoding), и масштаб (чем больше пользователей, тем ниже стоимость на запрос).
Для бизнеса это меняет уравнение: задачи, которые год назад были нерентабельны с AI, теперь окупаются. Анализ каждого email (не только VIP-клиентов). Персонализация для каждого пользователя (не только premium). AI-ассистент для каждого сотрудника (не только менеджеров).
Прогноз: к 2028 году стоимость AI-инференса будет настолько низкой, что AI-обработка станет встроена в каждое приложение по умолчанию — как сегодня встроен SSL-шифрование. Не premium-функция, а базовая инфраструктура.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro: кто лучший в 2026 году
Три флагмана, десятки бенчмарков, ноль однозначных ответов. Разбираемся, какая модель реально лидирует — и почему ответ зависит от задачи.
AI для программистов: Claude Code vs Cursor vs Copilot vs Devin
Четыре подхода к AI-ассистированному кодингу: от автокомплита до полностью автономного агента. Разбираемся, кто для чего.
Карта цен AI-моделей: от $0.08 до $75 за миллион токенов
Разница в цене между моделями — 900 раз. Полная карта цен, советы по оптимизации и секреты кеширования, которые экономят до 90%.