Промпты для анализа данных и таблиц
Как использовать AI для работы с CSV, Excel и базами данных: поиск паттернов, генерация формул, SQL-запросы из естественного языка, финансовый анализ.
Тип материала: research
AI как аналитик данных: что он может и чего не может
Современные языковые модели способны анализировать таблицы, находить паттерны, генерировать формулы Excel, писать SQL-запросы и создавать отчёты. Но у них есть ограничения: они не могут напрямую открывать ваши файлы (за исключением ChatGPT с Code Interpreter и Claude с функцией Analysis), они работают с текстовым представлением данных, и на очень больших таблицах могут ошибаться в подсчётах.
Оптимальный подход: используйте AI не как калькулятор, а как аналитика — просите интерпретировать данные, находить аномалии, генерировать формулы и запросы, которые вы затем проверяете. Это статья с конкретными промптами для каждого типа задач.
Работа с CSV и табличными данными
Загрузка данных в модель
Если ваша таблица не слишком большая (до 500 строк), вы можете вставить её прямо в промпт. Для CSV-данных просто скопируйте содержимое файла. Для Excel — экспортируйте в CSV или скопируйте нужный диапазон.
Вот данные о продажах за Q1 2026 (CSV):
date,product,region,amount,quantity
2026-01-05,Widget A,Москва,45000,150
2026-01-05,Widget B,СПб,32000,80
2026-01-12,Widget A,Москва,52000,175
...
Проанализируй эти данные. Меня интересует:
1. Какой продукт продаётся лучше всего по выручке и по количеству?
2. Есть ли тренд (рост/падение) по неделям?
3. Как различаются регионы?
4. Есть ли аномалии (необычные выбросы)?
Представь результат в виде структурированного отчёта с таблицами.Для больших таблиц (более 500 строк) лучше использовать Code Interpreter в ChatGPT или загружать файл в Claude. Альтернатива: вставьте первые 50 строк и попросите модель написать код для анализа полного набора данных.
Поиск паттернов и инсайтов
Вот данные: [вставьте данные].
Проведи разведочный анализ данных (EDA). Определи:
1. Базовую статистику по каждому числовому столбцу (среднее, медиана, мин, макс, стандартное отклонение)
2. Распределение категориальных переменных
3. Корреляции между числовыми переменными
4. Выбросы и аномалии
5. Пропущенные значения и их паттерн
Для каждого найденного паттерна объясни, что он может означать для бизнеса.Сравнение периодов
Вот данные за два периода:
Период 1 (январь 2026): [данные]
Период 2 (февраль 2026): [данные]
Сравни периоды по следующим метрикам: [перечислите]. Для каждой метрики покажи: значение в периоде 1, значение в периоде 2, абсолютное изменение, процентное изменение. Выдели метрики, которые изменились более чем на 10% — это требует внимания. Предложи возможные причины изменений.Генерация формул Excel
Базовые формулы
Мне нужна формула Excel для следующей задачи: [описание задачи на естественном языке].
Структура таблицы:
- Столбец A: [что содержит]
- Столбец B: [что содержит]
- Столбец C: [что содержит]
- Данные начинаются со строки 2 (строка 1 — заголовки)
Дай формулу, объясни каждую часть и приведи пример результата. Если задача решается несколькими формулами, покажи самый простой и самый гибкий вариант.Сложные формулы и массивы
У меня таблица с данными о сотрудниках:
A: Имя, B: Отдел, C: Дата найма, D: Зарплата, E: Регион.
Данные: строки 2-200.
Мне нужны формулы для:
1. Средняя зарплата по каждому отделу (для дашборда на отдельном листе)
2. Количество сотрудников, нанятых в 2025 году, по отделам
3. Топ-5 самых высокооплачиваемых сотрудников
4. Сотрудники, работающие дольше 3 лет, с зарплатой ниже средней по отделу
Для каждой задачи: формула + краткое объяснение логики. Используй современные функции Excel (FILTER, SORT, UNIQUE, XLOOKUP), если они упрощают решение.Создание сводных таблиц
У меня таблица продаж: дата, менеджер, клиент, продукт, сумма, количество.
Опиши пошагово, как создать сводную таблицу (Pivot Table) в Excel, чтобы увидеть:
- Продажи по менеджерам за каждый месяц
- С промежуточными итогами по кварталам
- С процентом от общей суммы
- С условным форматированием (зелёный если выше плана, красный если ниже)
План менеджера: [сумма] в месяц. Скриншоты не нужны — просто пошаговая текстовая инструкция.SQL-запросы из естественного языка
Базовые запросы
У меня база данных со следующими таблицами:
users (id, name, email, created_at, plan_type)
orders (id, user_id, amount, status, created_at)
products (id, name, category, price)
order_items (id, order_id, product_id, quantity)
Напиши SQL-запрос: [описание на естественном языке].
Диалект SQL: [PostgreSQL / MySQL / SQLite].
Требования: используй читаемые псевдонимы (aliases), добавь комментарии к сложным частям, оптимизируй для производительности (индексы, избегай подзапросов где возможно).Примеры запросов на естественном языке, которые модель превратит в SQL: «Покажи топ-10 клиентов по общей сумме заказов за последние 3 месяца», «Найди пользователей, которые зарегистрировались, но ни разу не сделали заказ», «Средний чек по категориям товаров, с разбивкой по месяцам».
Сложные аналитические запросы
Используя схему базы данных выше, напиши SQL-запрос для когортного анализа:
1. Определи когорту пользователя по месяцу регистрации
2. Для каждой когорты посчитай количество активных пользователей (сделавших хотя бы 1 заказ) в каждый последующий месяц
3. Рассчитай retention rate (процент удержания) для каждой когорты
4. Результат — таблица: когорта (месяц) × месяц после регистрации × retention rate
Диалект: PostgreSQL. Используй оконные функции где уместно.Финансовый анализ
Анализ P&L
Вот данные отчёта о прибылях и убытках:
[вставьте данные: выручка, себестоимость, валовая прибыль, операционные расходы по категориям, EBITDA, чистая прибыль — за 2-3 периода]
Проведи анализ:
1. Динамика ключевых показателей (выручка, маржинальность, чистая прибыль)
2. Структура расходов и её изменение
3. Основные драйверы роста или падения
4. Тревожные сигналы (красные флаги)
5. Рекомендации: на что обратить внимание руководству
Формат: структурированный отчёт с таблицами, не длиннее 2 страниц.Расчёт unit-экономики
Помоги рассчитать unit-экономику для моего бизнеса.
Исходные данные:
- Стоимость привлечения клиента (CAC): [сумма]
- Средний чек: [сумма]
- Маржинальность: [процент]
- Среднее количество покупок за [период]: [число]
- Churn rate (месячный): [процент]
Рассчитай:
1. LTV (lifetime value) — двумя методами
2. LTV/CAC ratio
3. Payback period
4. Сценарии: что будет, если CAC вырастет на 20%? Если churn снизится на 2%?
Покажи формулы и расчёты пошагово.Визуализация данных
Вот мои данные: [вставьте или опишите данные].
Мне нужно подготовить визуализацию для [презентация руководству / дашборд / отчёт клиенту].
Для каждой ключевой метрики порекомендуй:
1. Тип графика (и почему именно этот)
2. Что на осях / в легенде
3. Какие цвета использовать
4. На что обратить внимание аудитории
Если возможно, напиши код для построения графика в [Python matplotlib / Plotly / Google Sheets / Excel].Код для визуализации на Python
Напиши Python-скрипт (pandas + matplotlib) для анализа CSV-файла.
Файл: sales_2026.csv
Столбцы: date, product, region, revenue, quantity
Скрипт должен:
1. Загрузить данные
2. Показать базовую статистику (describe)
3. Построить 4 графика:
- Выручка по месяцам (линейный)
- Распределение выручки по продуктам (pie chart)
- Выручка по регионам (bar chart)
- Scatter plot: количество vs выручка
4. Сохранить графики в PNG-файлы
Код должен быть чистым, с комментариями, и работать без ошибок.Построение отчётов
Вот сырые данные за [период]: [вставьте данные].
Преобразуй их в аналитический отчёт для [руководства / инвесторов / команды].
Структура отчёта:
1. Executive Summary (3-5 предложений: главный вывод, ключевые цифры, рекомендация)
2. Ключевые метрики (таблица с показателями, динамикой, сравнением с планом)
3. Детальный анализ по направлениям
4. Проблемные зоны и риски
5. Рекомендации (конкретные действия с ожидаемым эффектом)
Тон: фактологический, без «воды». Каждый вывод подкреплён цифрой из данных.Работа с большими данными: стратегия
Когда данных слишком много для контекстного окна модели (больше 1000 строк), используйте многошаговый подход. Сначала попросите модель написать код для анализа — на Python с pandas. Затем выполните код локально и вставьте результат (агрегированные данные, саммари) в следующий промпт для интерпретации.
У меня CSV-файл с 50 000 строк. Столбцы: [перечислите].
Вот первые 20 строк для понимания структуры:
[вставьте 20 строк]
Напиши Python-скрипт (pandas), который:
1. Загрузит полный файл
2. Проведёт разведочный анализ
3. Выведет ключевые метрики и агрегаты
4. Найдёт топ-10 по [критерий]
5. Выявит аномалии (значения за пределами 2 стандартных отклонений)
Результат скрипта я вставлю в следующий промпт для интерпретации.Проверка данных и очистка
Вот данные: [вставьте или опишите].
Проверь качество данных:
1. Есть ли пропущенные значения? В каких столбцах и строках?
2. Есть ли дубликаты?
3. Есть ли некорректные значения (отрицательные суммы, даты в будущем, нулевые количества)?
4. Согласованы ли данные между собой (суммы сходятся, связи между таблицами корректны)?
5. Какие данные выглядят подозрительно?
Для каждой проблемы: что нашёл, почему это проблема, как исправить (формула или код).Практические советы
При работе с данными через AI важно помнить несколько правил. Проверяйте расчёты: модель может ошибаться в арифметике, особенно с большими числами. Всегда пересчитывайте ключевые цифры. Описывайте контекст: одни и те же цифры могут значить разное в разных контекстах. «Отток 5%» — это нормально для мобильного приложения и катастрофа для банка. Формат имеет значение: CSV с заголовками работает лучше, чем «таблица» скопированная из Excel с нарушенным форматированием. Разбивайте большие задачи: вместо «проанализируй все данные» — конкретные вопросы по одному.
Главное
AI — мощный инструмент для анализа данных, но он работает лучше всего как помощник аналитика, а не замена. Используйте его для генерации формул, SQL-запросов, кода для визуализации и интерпретации результатов. Всегда проверяйте ключевые вычисления вручную. И помните: качество анализа зависит от качества данных и точности вашего промпта.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Как начать пользоваться Midjourney: генерация картинок AI
Midjourney — самый популярный AI-генератор изображений. Фотореализм, арт, иллюстрации, логотипы. Показываем, как начать — от регистрации до первой картинки.
Как установить Ollama: запуск AI-моделей на своём компьютере
Ollama — самый простой способ запустить AI-модели локально. Llama, Mistral, Qwen, DeepSeek — всё работает на вашем компьютере, без интернета, бесплатно и приватно.
Как начать пользоваться ChatGPT: пошаговая инструкция для Mac, Windows, iPhone и Android
Регистрация, установка, первый запрос — всё, что нужно, чтобы начать общаться с самой популярной нейросетью в мире. Без технических знаний, за 5 минут.