Все Insights

Промпты для анализа данных и таблиц

Как использовать AI для работы с CSV, Excel и базами данных: поиск паттернов, генерация формул, SQL-запросы из естественного языка, финансовый анализ.

Aravana··16 мин

Тип материала: research

Поделиться:TelegramXLinkedIn
Как вам материал?

AI как аналитик данных: что он может и чего не может

Современные языковые модели способны анализировать таблицы, находить паттерны, генерировать формулы Excel, писать SQL-запросы и создавать отчёты. Но у них есть ограничения: они не могут напрямую открывать ваши файлы (за исключением ChatGPT с Code Interpreter и Claude с функцией Analysis), они работают с текстовым представлением данных, и на очень больших таблицах могут ошибаться в подсчётах.

Оптимальный подход: используйте AI не как калькулятор, а как аналитика — просите интерпретировать данные, находить аномалии, генерировать формулы и запросы, которые вы затем проверяете. Это статья с конкретными промптами для каждого типа задач.

Работа с CSV и табличными данными

Загрузка данных в модель

Если ваша таблица не слишком большая (до 500 строк), вы можете вставить её прямо в промпт. Для CSV-данных просто скопируйте содержимое файла. Для Excel — экспортируйте в CSV или скопируйте нужный диапазон.

Вот данные о продажах за Q1 2026 (CSV):

date,product,region,amount,quantity
2026-01-05,Widget A,Москва,45000,150
2026-01-05,Widget B,СПб,32000,80
2026-01-12,Widget A,Москва,52000,175
...

Проанализируй эти данные. Меня интересует:
1. Какой продукт продаётся лучше всего по выручке и по количеству?
2. Есть ли тренд (рост/падение) по неделям?
3. Как различаются регионы?
4. Есть ли аномалии (необычные выбросы)?

Представь результат в виде структурированного отчёта с таблицами.

Для больших таблиц (более 500 строк) лучше использовать Code Interpreter в ChatGPT или загружать файл в Claude. Альтернатива: вставьте первые 50 строк и попросите модель написать код для анализа полного набора данных.

Поиск паттернов и инсайтов

Вот данные: [вставьте данные].

Проведи разведочный анализ данных (EDA). Определи:
1. Базовую статистику по каждому числовому столбцу (среднее, медиана, мин, макс, стандартное отклонение)
2. Распределение категориальных переменных
3. Корреляции между числовыми переменными
4. Выбросы и аномалии
5. Пропущенные значения и их паттерн

Для каждого найденного паттерна объясни, что он может означать для бизнеса.

Сравнение периодов

Вот данные за два периода:

Период 1 (январь 2026): [данные]
Период 2 (февраль 2026): [данные]

Сравни периоды по следующим метрикам: [перечислите]. Для каждой метрики покажи: значение в периоде 1, значение в периоде 2, абсолютное изменение, процентное изменение. Выдели метрики, которые изменились более чем на 10% — это требует внимания. Предложи возможные причины изменений.

Генерация формул Excel

Базовые формулы

Мне нужна формула Excel для следующей задачи: [описание задачи на естественном языке].

Структура таблицы:
- Столбец A: [что содержит]
- Столбец B: [что содержит]
- Столбец C: [что содержит]
- Данные начинаются со строки 2 (строка 1 — заголовки)

Дай формулу, объясни каждую часть и приведи пример результата. Если задача решается несколькими формулами, покажи самый простой и самый гибкий вариант.

Сложные формулы и массивы

У меня таблица с данными о сотрудниках:
A: Имя, B: Отдел, C: Дата найма, D: Зарплата, E: Регион.
Данные: строки 2-200.

Мне нужны формулы для:
1. Средняя зарплата по каждому отделу (для дашборда на отдельном листе)
2. Количество сотрудников, нанятых в 2025 году, по отделам
3. Топ-5 самых высокооплачиваемых сотрудников
4. Сотрудники, работающие дольше 3 лет, с зарплатой ниже средней по отделу

Для каждой задачи: формула + краткое объяснение логики. Используй современные функции Excel (FILTER, SORT, UNIQUE, XLOOKUP), если они упрощают решение.

Создание сводных таблиц

У меня таблица продаж: дата, менеджер, клиент, продукт, сумма, количество.

Опиши пошагово, как создать сводную таблицу (Pivot Table) в Excel, чтобы увидеть:
- Продажи по менеджерам за каждый месяц
- С промежуточными итогами по кварталам
- С процентом от общей суммы
- С условным форматированием (зелёный если выше плана, красный если ниже)

План менеджера: [сумма] в месяц. Скриншоты не нужны — просто пошаговая текстовая инструкция.

SQL-запросы из естественного языка

Базовые запросы

У меня база данных со следующими таблицами:

users (id, name, email, created_at, plan_type)
orders (id, user_id, amount, status, created_at)
products (id, name, category, price)
order_items (id, order_id, product_id, quantity)

Напиши SQL-запрос: [описание на естественном языке].

Диалект SQL: [PostgreSQL / MySQL / SQLite].

Требования: используй читаемые псевдонимы (aliases), добавь комментарии к сложным частям, оптимизируй для производительности (индексы, избегай подзапросов где возможно).

Примеры запросов на естественном языке, которые модель превратит в SQL: «Покажи топ-10 клиентов по общей сумме заказов за последние 3 месяца», «Найди пользователей, которые зарегистрировались, но ни разу не сделали заказ», «Средний чек по категориям товаров, с разбивкой по месяцам».

Сложные аналитические запросы

Используя схему базы данных выше, напиши SQL-запрос для когортного анализа:

1. Определи когорту пользователя по месяцу регистрации
2. Для каждой когорты посчитай количество активных пользователей (сделавших хотя бы 1 заказ) в каждый последующий месяц
3. Рассчитай retention rate (процент удержания) для каждой когорты
4. Результат — таблица: когорта (месяц) × месяц после регистрации × retention rate

Диалект: PostgreSQL. Используй оконные функции где уместно.

Финансовый анализ

Анализ P&L

Вот данные отчёта о прибылях и убытках:

[вставьте данные: выручка, себестоимость, валовая прибыль, операционные расходы по категориям, EBITDA, чистая прибыль — за 2-3 периода]

Проведи анализ:
1. Динамика ключевых показателей (выручка, маржинальность, чистая прибыль)
2. Структура расходов и её изменение
3. Основные драйверы роста или падения
4. Тревожные сигналы (красные флаги)
5. Рекомендации: на что обратить внимание руководству

Формат: структурированный отчёт с таблицами, не длиннее 2 страниц.

Расчёт unit-экономики

Помоги рассчитать unit-экономику для моего бизнеса.

Исходные данные:
- Стоимость привлечения клиента (CAC): [сумма]
- Средний чек: [сумма]
- Маржинальность: [процент]
- Среднее количество покупок за [период]: [число]
- Churn rate (месячный): [процент]

Рассчитай:
1. LTV (lifetime value) — двумя методами
2. LTV/CAC ratio
3. Payback period
4. Сценарии: что будет, если CAC вырастет на 20%? Если churn снизится на 2%?

Покажи формулы и расчёты пошагово.

Визуализация данных

Вот мои данные: [вставьте или опишите данные].

Мне нужно подготовить визуализацию для [презентация руководству / дашборд / отчёт клиенту].

Для каждой ключевой метрики порекомендуй:
1. Тип графика (и почему именно этот)
2. Что на осях / в легенде
3. Какие цвета использовать
4. На что обратить внимание аудитории

Если возможно, напиши код для построения графика в [Python matplotlib / Plotly / Google Sheets / Excel].

Код для визуализации на Python

Напиши Python-скрипт (pandas + matplotlib) для анализа CSV-файла.

Файл: sales_2026.csv
Столбцы: date, product, region, revenue, quantity

Скрипт должен:
1. Загрузить данные
2. Показать базовую статистику (describe)
3. Построить 4 графика:
   - Выручка по месяцам (линейный)
   - Распределение выручки по продуктам (pie chart)
   - Выручка по регионам (bar chart)
   - Scatter plot: количество vs выручка
4. Сохранить графики в PNG-файлы

Код должен быть чистым, с комментариями, и работать без ошибок.

Построение отчётов

Вот сырые данные за [период]: [вставьте данные].

Преобразуй их в аналитический отчёт для [руководства / инвесторов / команды].

Структура отчёта:
1. Executive Summary (3-5 предложений: главный вывод, ключевые цифры, рекомендация)
2. Ключевые метрики (таблица с показателями, динамикой, сравнением с планом)
3. Детальный анализ по направлениям
4. Проблемные зоны и риски
5. Рекомендации (конкретные действия с ожидаемым эффектом)

Тон: фактологический, без «воды». Каждый вывод подкреплён цифрой из данных.

Работа с большими данными: стратегия

Когда данных слишком много для контекстного окна модели (больше 1000 строк), используйте многошаговый подход. Сначала попросите модель написать код для анализа — на Python с pandas. Затем выполните код локально и вставьте результат (агрегированные данные, саммари) в следующий промпт для интерпретации.

У меня CSV-файл с 50 000 строк. Столбцы: [перечислите].

Вот первые 20 строк для понимания структуры:
[вставьте 20 строк]

Напиши Python-скрипт (pandas), который:
1. Загрузит полный файл
2. Проведёт разведочный анализ
3. Выведет ключевые метрики и агрегаты
4. Найдёт топ-10 по [критерий]
5. Выявит аномалии (значения за пределами 2 стандартных отклонений)

Результат скрипта я вставлю в следующий промпт для интерпретации.

Проверка данных и очистка

Вот данные: [вставьте или опишите].

Проверь качество данных:
1. Есть ли пропущенные значения? В каких столбцах и строках?
2. Есть ли дубликаты?
3. Есть ли некорректные значения (отрицательные суммы, даты в будущем, нулевые количества)?
4. Согласованы ли данные между собой (суммы сходятся, связи между таблицами корректны)?
5. Какие данные выглядят подозрительно?

Для каждой проблемы: что нашёл, почему это проблема, как исправить (формула или код).

Практические советы

При работе с данными через AI важно помнить несколько правил. Проверяйте расчёты: модель может ошибаться в арифметике, особенно с большими числами. Всегда пересчитывайте ключевые цифры. Описывайте контекст: одни и те же цифры могут значить разное в разных контекстах. «Отток 5%» — это нормально для мобильного приложения и катастрофа для банка. Формат имеет значение: CSV с заголовками работает лучше, чем «таблица» скопированная из Excel с нарушенным форматированием. Разбивайте большие задачи: вместо «проанализируй все данные» — конкретные вопросы по одному.

Главное

AI — мощный инструмент для анализа данных, но он работает лучше всего как помощник аналитика, а не замена. Используйте его для генерации формул, SQL-запросов, кода для визуализации и интерпретации результатов. Всегда проверяйте ключевые вычисления вручную. И помните: качество анализа зависит от качества данных и точности вашего промпта.

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Как начать пользоваться Midjourney: генерация картинок AI

Midjourney — самый популярный AI-генератор изображений. Фотореализм, арт, иллюстрации, логотипы. Показываем, как начать — от регистрации до первой картинки.

·6 мин·Выбор редакции

Как установить Ollama: запуск AI-моделей на своём компьютере

Ollama — самый простой способ запустить AI-модели локально. Llama, Mistral, Qwen, DeepSeek — всё работает на вашем компьютере, без интернета, бесплатно и приватно.

·7 мин·Выбор редакции

Как начать пользоваться ChatGPT: пошаговая инструкция для Mac, Windows, iPhone и Android

Регистрация, установка, первый запрос — всё, что нужно, чтобы начать общаться с самой популярной нейросетью в мире. Без технических знаний, за 5 минут.

·7 мин·Выбор редакции