Медиана / Мода / Среднее
16 февраля 2026 Время чтения ≈ 7 мин.
По одному и тому же вопросу «Оцените от 1 до 5» можно сказать «в среднем 3,8», «медиана 4» или «чаще всего выбирали 4». Все три числа описывают «центр» данных, но считаются по-разному и по-разному реагируют на выбросы и перекосы.
В отчётах по опросам чаще всего фигурирует среднее; для шкальных и порядковых данных нередко полезно смотреть и медиану, и моду — иначе картина может быть неполной или искажённой.
Ниже — что такое каждая из мер, когда какую использовать и как не перепутать их при интерпретации.
Что такое среднее, медиана и мода простыми словами
Среднее арифметическое (Mean) — сумма всех значений, делённая на их количество. Чувствительно к выбросам: несколько очень больших или очень малых ответов заметно сдвигают среднее. Медиана (Median) — значение «в середине» упорядоченного ряда: половина наблюдений ниже медианы, половина выше. Выбросы на краях на неё почти не влияют. Мода (Mode) — самое часто встречающееся значение. Для категориальных и порядковых переменных мода показывает «наиболее популярный» вариант ответа.
Проще говоря: среднее — «если поровну размазать» все ответы; медиана — «середина списка по порядку»; мода — «какой вариант выбрали чаще всего». В симметричном распределении без выбросов среднее и медиана близки; при асимметрии или редких крайних значениях они расходятся.
Когда какую меру использовать
Среднее удобно, когда данные примерно симметричны и нет сильных выбросов. Его часто используют для расчёта доверительных интервалов, сравнения групп (t-тест) и регрессии. В отчётах по удовлетворённости «средняя оценка 4,2» понятно заказчику — но при перекосе в сторону «5» или единичных «1» среднее может не отражать типичный ответ.
Медиана устойчивее к выбросам и асимметрии. Имеет смысл считать её для порядковых и шкальных данных (например, по шкале Лайкерта), когда часть респондентов поставила крайние оценки. «Медиана 4» означает: половина ответов не выше 4, половина не ниже. Для заказчика иногда нагляднее формулировка «половина оценила на 4 и выше».
Мода полезна для категориальных переменных (регион, тип клиента) и когда важно подчеркнуть «самый частый» ответ. По шкале 1–5 мода может совпадать с медианой или отличаться; если мода и среднее сильно разнятся — это намёк на асимметрию или два «пика» в данных. У одного распределения может быть две моды (бимодальность) — тогда «типичного» одного значения нет, и лучше описать форму распределения словами или долями.
Пример в цифрах
Вопрос «Оцените сервис от 1 до 5»: 100 ответов. Вариант A: 10% — «1», 20% — «2», 40% — «3», 20% — «4», 10% — «5». Среднее около 3, медиана 3, мода 3 — все три меры в центре. Вариант B: 5% — «1», 10% — «2», 15% — «3», 30% — «4», 40% — «5». Среднее сдвинется вправо (примерно 3,9), медиана будет 4, мода — 5. Одна «пятёрка» от нескольких недовольных сильнее тянет среднее, чем медиану; мода показывает, что чаще всего ставили «5». Для полной картины лучше приводить и среднее, и медиану (и при необходимости разброс).
Третий сценарий — выбросы: 95 человек поставили «4», пятеро — «1». Среднее упадёт (примерно 3,85), медиана останется 4, мода тоже 4. Заказчик, видя только «среднее 3,85», может решить, что оценка «так себе»; на самом деле почти все довольны, а несколько низких оценок сместили среднее. Поэтому при таком раскладе в отчёте обязательно указывают медиану и при желании — доли по вариантам.
Медиана при чётном N. Если наблюдений чётное число, медиану обычно берут как полусумму двух центральных значений упорядоченного ряда. Например, при 100 ответах — среднее между 50-м и 51-м по порядку. В программах и таблицах это считают автоматически; важно помнить, что медиана не обязана совпадать ни с одним реальным ответом (при чётном N и разных центральных значениях она может быть, скажем, 3,5).
Связь с описательной статистикой и распределением
Среднее, медиана и мода входят в описательную статистику как меры центральной тенденции. В нормальном распределении они совпадают; при асимметрии расходятся — по разнице между средним и медианой можно судить о перекосе. Поэтому в отчёте не стоит ограничиваться одним числом: указание медианы рядом со средним (и при необходимости моды) помогает читателю понять форму данных. Подробнее о разбросе и интерпретации — в статьях про шкалы, кросс-таблицы и стандартное отклонение.
Разброс данных описывают отдельно: стандартное отклонение, квартили, минимум и максимум. Меры центра без меры разброса дают неполную картину — «среднее 4» при разбросе от 1 до 5 и при всех ответах «4» это разные ситуации. В сегментации и сравнении групп среднее и медиану считают по каждому сегменту; для проверки различий между группами используют тесты (статистическая значимость).
По сегментам и подгруппам
Среднее, медиану и моду считают не только по всей выборке, но и внутри сегментов: по регионам, типам клиентов, возрасту. В кросс-таблицах и разбивках по группам важно указывать размер каждой подгруппы — иначе «среднее 4,5» по 15 респондентам и по 200 будут восприняты одинаково, хотя устойчивость разная. Для малых подгрупп медиана часто надёжнее среднего как «типичное» значение.
При взвешивании ответов считают взвешенное среднее: каждое значение умножают на вес респондента (обратный вероятности попадания в выборку или калибровочный вес), затем делят на сумму весов. Медиану и моду при взвешивании тоже можно считать по взвешенным частотам — в отчёте при этом указывают, что приведены взвешенные показатели.
Типичные ошибки
Считать только среднее по порядковым данным. На шкалах 1–5 при перекосе или выбросах медиана часто информативнее. Если в отчёте одно «среднее 3,2» при том что 60% поставили «4» или «5», заказчик может сделать неверный вывод.
Путать медиану и среднее при сравнении групп. «В группе A среднее выше» и «в группе A медиана выше» — не одно и то же при разной форме распределения. Для сравнения групп используют тесты (по средним или по рангам); при описании лучше указывать обе меры.
Искать моду у непрерывных данных без группировки. Если переменная по сути непрерывная (время, сумма), «самое частое значение» может быть уникальным у каждого респондента. Моду тогда считают по сгруппированным данным (интервалам).
Забывать про размер выборки. И среднее, и медиана по 20 ответам менее устойчивы, чем по 500. Рядом с мерой центра стоит указывать число наблюдений и при необходимости разброс.
Интерпретировать среднее как «большинство ответило так». Среднее 3,5 может получиться и когда все поставили 3 или 4, и когда половина — 1, половина — 6. «Типичный» ответ лучше описывать медианой или модой; среднее отвечает на вопрос «каково среднее значение», а не «как ответило большинство».
Визуализация
Гистограмма или столбчатая диаграмма распределения ответов сразу показывает, симметричны ли данные, есть ли один пик (мода) или два, смещено ли распределение влево или вправо. По такой картинке легче решить, достаточно ли одного среднего или стоит добавить медиану и пояснение. В отчётах по опросам часто приводят и таблицу с долями по вариантам, и среднее (плюс медиану при перекосе) — так заказчик видит и «центр», и форму распределения.
Как это выглядит в WebAsk
В отчётах по умолчанию по каждому вопросу показываются количество ответов и доли по вариантам; для шкал выводится среднее. Медиану и моду в интерфейсе не считают — их можно получить после выгрузки ответов в CSV/XLSX, посчитав в таблице или в статистическом пакете. При подготовке отчёта для заказчика удобно добавить медиану рядом со средним, если данные по шкале перекошены или есть выбросы.
Практические рекомендации
Для шкальных и порядковых вопросов по возможности приводите и среднее, и медиану. Если они заметно различаются — кратко поясните (например, «перекос в сторону высоких оценок») или покажите распределение.
При выбросах опирайтесь на медиану для «типичного» значения или явно укажите, что среднее может быть смещено единичными крайними ответами.
Для категориальных переменных (пол, регион, тип клиента) уместны только частоты и мода; среднее арифметическое для них не считается.
Когда все три меры близки. Если среднее, медиана и мода почти совпадают (например, все около 4 по шкале 1–5), распределение близко к симметричному и без сильных выбросов. В таких случаях достаточно указывать среднее; при расхождении мер добавьте медиану и при необходимости поясните форму распределения.
Как формулировать в отчёте. Вместо сухого «среднее 3,8» можно написать «средняя оценка 3,8 из 5 (медиана 4)» или «половина респондентов оценила на 4 и выше». Для заказчика часто понятнее «чаще всего выбирали вариант «4»» (мода), чем только среднее. Если среднее и медиана сильно различаются, добавьте короткое пояснение: «перекос в сторону высоких оценок» или «несколько крайних ответов сдвинули среднее».
Кратко
- Среднее — сумма значений, делённая на количество; чувствительно к выбросам.
- Медиана — значение «в середине» ряда; устойчива к выбросам, удобна для порядковых и шкальных данных.
- Мода — самое частое значение; подходит для категориальных переменных и когда важно «самый популярный» ответ.
- В отчёте по опросу лучше приводить и среднее, и медиану при шкальных вопросах; при перекосе или выбросах опираться на медиану и доли.
Среднее, медиана и мода по-разному отвечают на вопрос «где центр данных». В опросах при порядковых и шкальных ответах полезно смотреть не только среднее, но и медиану (и при необходимости моду), чтобы не исказить картину выбросами и перекосом распределения.
Опубликовано 16 февраля 2026
Алексей Логинов