Описательная статистика (Descriptive Statistics)
Обновлено 17 февраля 2026 Время чтения ≈ 5 мин.
Ответы собраны: 300 респондентов, десятки вопросов. Прежде чем проверять гипотезы или строить модели, нужно понять, как данные «выглядят» в целом: какое типичное значение, как сильно ответы различаются, как распределены по вариантам.
Этим занимается описательная статистика — сводные показатели, которые сжимают выборку в несколько понятных чисел: среднее, медиана, доли, разброс. Без неё трудно интерпретировать и статистическую значимость, и сами цифры в отчёте.
Описательная статистика не делает выводов о генеральной совокупности и не проверяет гипотезы — она только характеризует то, что вы уже собрали. Для обобщений на популяцию нужны доверительные интервалы, тесты и погрешность выборки. Но первый шаг в любом анализе — описать данные.
Что такое описательная статистика простыми словами
Описательная статистика (Descriptive Statistics) — это совокупность методов и показателей, которые суммируют и характеризуют данные выборки: центральную тенденцию (среднее, медиана, мода), разброс (дисперсия, стандартное отклонение, размах), форму распределения, а также частоты и доли по категориям. Цель — компактно представить, «как устроены» собранные данные, без выводов о причинах и без переноса на более широкую совокупность.
Проще говоря: вы считаете по данным «типичное» значение, «разброс» и доли по группам — и уже на основе этой картины решаете, что делать дальше (сравнивать группы, строить регрессию, пересмотреть вопросы).
Какие показатели входят
- Центральная тенденция. Среднее арифметическое, медиана, мода — «вокруг чего» сосредоточены ответы. Для порядковых и шкальных данных часто смотрят и среднее, и медиану: при выбросах медиана устойчивее. Подробнее — в отдельной статье про шкалы и интерпретацию.
- Разброс. Стандартное отклонение, дисперсия, размах (мин–макс), межквартильный размах. Показывают, насколько значения «разъезжаются» вокруг центра. Без разброса одна и та же средняя оценка может означать «все ответили 4» или «половина 1, половина 7».
- Частоты и доли. Сколько человек выбрало каждый вариант (абсолютные частоты), какой процент (доли). Основа для таблиц и диаграмм по категориальным и порядковым переменным.
- Распределение. Гистограммы, доли по интервалам, проверка на нормальность при необходимости. Помогает понять, симметричны ли данные, есть ли выбросы.
В отчётах по опросам чаще всего приводят средние по шкалам, доли «согласен / не согласен», разбивку по сегментам и кросс-таблицы. Это и есть описательная статистика в действии.
Краткий пример. Вопрос «Оцените качество сервиса от 1 до 5»: 200 ответов. Описательная статистика даёт: среднее 3,8, медиана 4, мода 4, стандартное отклонение 0,9. Доли: «1» — 2%, «2» — 5%, «3» — 20%, «4» — 48%, «5» — 25%. По этим цифрам видно, что большинство ближе к положительным оценкам, разброс умеренный; если бы среднее было тоже 3,8, но при 50% «1» и 50% «5», картина была бы совсем другой — и без разброса и долей это не увидеть.
Когда она нужна
Первый этап любого анализа. Перед проверкой гипотез, регрессией или сравнением групп полезно посмотреть средние, разброс и распределение. Выбросы и странные распределения лучше заметить сразу.
Отчёты для заказчика. Руководству и коллегам обычно нужны «цифры в одну строку»: средняя оценка удовлетворённости, доля рекомендующих, разбивка по регионам. Всё это — описательная статистика.
Контроль качества данных. Доли по полу и возрасту, число пропусков, время заполнения — сводки помогают понять, нет ли сбоев в сборе или перекосов в выборке.
Описательная статистика не отвечает на вопросы вроде «отличается ли среднее в группе A от группы B статистически значимо» или «какова оценка по генеральной совокупности с заданной точностью». Для этого нужны методы выводной статистики (тесты, доверительные интервалы).
Описание по сегментам и подгруппам
Часто одних общих сводок мало: нужно понять, как показатели выглядят в разных группах — по полу, возрасту, региону, типу клиента. Считают те же средние, доли и разброс, но отдельно по каждой подгруппе. Так получают кросс-таблицы и профили сегментов. Важно указывать размер каждой подгруппы: среднее по 15 респондентам и по 150 — разная степень доверия. Если подгруппа очень мала, описательные цифры по ней лучше сопровождать оговоркой или не делать по ней жёстких выводов.
Типичные ошибки
Считать только среднее. На порядковых и шкальных данных при асимметрии или выбросах медиана и мода часто информативнее. Дополнительно смотрите разброс: одна и та же «средняя оценка 3,5» может быть и у «все 3–4», и у «половина 1, половина 6».
Путать с выводной статистикой. Описательная статистика характеризует только вашу выборку. Утверждения вроде «среднее по населению равно 4,2» или «разница между группами значима» требуют доверительных интервалов и тестов — это уже следующий уровень.
Игнорировать размер выборки. Среднее по 30 респондентам и по 3000 — разная устойчивость. В отчёте всегда указывайте размер выборки и по возможности разброс (например, стандартное отклонение или доверительный интервал для среднего).
Смешивать шкалы. Среднее по номинальным категориям (тип клиента, регион) бессмысленно. Для категориальных переменных — только частоты и доли; для порядковых и интервальных — среднее, медиана, разброс с учётом типа шкалы.
Сравнивать группы без учёта размера. «В группе A среднее 4,2, в группе B — 3,9» — описательно верно, но без указания N и без проверки значимости разницы это лишь констатация. Для выводов «группы различаются» нужны тесты и доверительные интервалы; описательная статистика подводит к вопросу, но не отвечает на него.
Как это выглядит в WebAsk
В разделе «Отчёты и ответы» по умолчанию выводятся сводки по каждому вопросу: количество ответов, доли по вариантам, для шкал — среднее. Это и есть базовая описательная статистика. Для кросс-таблиц по сегментам, расчёта медианы или стандартного отклонения данные можно выгрузить в CSV/XLSX и посчитать в таблице или в статистическом пакете. При выгрузке удобно использовать фильтры, чтобы описать только нужную подвыборку (например, завершившие опрос или отдельный регион).
Практические рекомендации
Всегда указывайте N. Рядом со средним и долями пишите, по скольким ответам они посчитаны. Для подгрупп — размер подгруппы, иначе читатель не оценит надёжность цифр.
Добавляйте меру разброса. Хотя бы стандартное отклонение для средних или доверительный интервал — так видно и «типичное» значение, и его неопределённость.
Перед сложным анализом — разведка. Гистограммы и сводки по переменным помогают заметить выбросы, пропуски и неожиданные распределения до регрессии или тестов.
Не ограничиваться одной мерой центра. Для симметричных данных среднее и медиана близки; при асимметрии или выбросах медиана устойчивее. Имеет смысл смотреть обе и при необходимости пояснять в отчёте, почему выбрали ту или иную (например, «приведена медиана из‑за выраженной асимметрии распределения»).
Связь с другими видами анализа
Описательная статистика — фундамент. На её основе строят корреляционный и регрессионный анализ (сначала смотрят средние и разброс по переменным), проверяют различия между группами (сравнивают средние и доли с учётом тестов), интерпретируют результаты количественных опросов. Отдельные показатели — среднее, медиана, мода, стандартное отклонение — разбираются в своих статьях глоссария; здесь важно зафиксировать: описание данных всегда идёт первым, а выводы и обобщения — следом.
Описательная статистика — первый шаг анализа: она сжимает данные в понятные показатели (среднее, медиана, доли, разброс) и не делает выводов за пределы выборки. Без неё трудно интерпретировать и отчёт, и последующие проверки гипотез; с ней — картина данных становится ясной до любых обобщений.
Обновлено 17 февраля 2026 Опубликовано 15 февраля 2026
Алексей Логинов