Кросс-табуляция (Cross-tabulation)
Обновлено 19 февраля 2026 Время чтения ≈ 7 мин.
У вас есть ответы на "Пол" и "Оценка сервиса". Отдельно: 60% женщин, 40% мужчин. Отдельно: 70% поставили 4-5. Но как связаны? Женщины довольнее мужчин или наоборот? Кросс-табуляция (cross-tabulation, крест-таблица) - это таблица, где строки - варианты одного вопроса, столбцы - другого. В ячейках - число или доля ответивших. Так видно, как одна переменная ведёт себя в разрезе другой.
Одна переменная даёт плоскую картинку. Две скрещённые - уже объём. Кросс-табуляция - базовый инструмент аналитика опросов. В WebAsk есть встроенные кросс-таблицы в отчётах; для сложных разрезов можно выгрузить данные и строить в Excel или BI.
Определение: кросс-табуляция
Кросс-табуляция (Cross-tabulation, перекрёстная табуляция, крест-таблица) - совместное распределение двух (или более) категориальных переменных в виде таблицы. Строки - категории одной переменной (пол, регион, возраст), столбцы - другой (оценка, выбор варианта). В ячейках - число случаев или проценты. Позволяет увидеть связь: отличаются ли ответы между группами, есть ли паттерны. Используется для сегментации, сравнения аудиторий, проверки гипотез и поддержки решений на основе данных.
Проще: это "вопрос А в разрезе вопроса Б". Положили два вопроса друг на друга - видно, как часто встречается каждая комбинация.
Зачем нужна: сравнение групп, сегментация
Сводка по одному вопросу говорит "в среднем так". Кросс-таблица - "а вот в этой группе иначе". Мужчины и женщины по-разному оценили продукт. Москва и регионы - разный NPS. Молодые чаще выбирают "А", пожилые - "Б". Без кросс-табуляции такие вещи остаются догадками.
Ещё сценарий: вы кодировали открытые ответы и получили категории. Теперь хотите понять, кто чаще жалуется на доставку - новые клиенты или старые. Кросс-таблица "категория жалобы × срок клиентства" даст ответ. То же с кодированием: структурировали текст - дальше режьте его по сегментам.
И третий кейс - описательная статистика. Среднее по шкале - хорошо. Среднее по шкале в разрезе возраста - уже история. Кросс-табуляция помогает не застрять на "в целом" и опуститься до конкретных групп.
Области: социология и психология (опросы, поведение, мнения разных групп), маркетинг (сегменты аудитории, реакция на продукты), образование (обучение анализу данных на наглядных таблицах).
Выявление ошибок в данных
Кросс-таблица помогает ловить странные комбинации. Дети с высшим образованием, мужчины с ответом "беременна", несовместимые коды - такие вещи часто видны только в пересечении переменных. Перед сложным анализом прогоните пару кросс-таблиц по ключевым полям - иногда находит глюки в выгрузке.
Строки, столбцы, ячейки
Строки - первая переменная (пол, регион, возраст). Столбцы - вторая (оценка, вариант выбора). Можно и наоборот - как удобнее читать. Главное - одна ось "группы", вторая - "ответы". В ячейках - частоты или доли. Иногда добавляют итоговые строки и столбцы (сумма по строке, сумма по столбцу) - для проверки и контекста.
Как читать проценты и ячейки
Столбцы и строки - категории. Ячейки - число респондентов или проценты. Проценты бывают по строкам (внутри каждой строки 100%), по столбцам (внутри каждого столбца 100%) или по общей сумме. Выбор зависит от вопроса: "какой % мужчин поставил 5" - проценты по строкам; "какой % пятёрок дали мужчины" - по столбцам.
Сравнивайте не абсолютные числа, а доли. В ячейке "женщины, оценка 5" может быть 80 человек, а "мужчины, оценка 5" - 40. Но если женщин было 200, а мужчин 50 - то мужчины как группа довольнее. Смотрите на проценты внутри группы.
Маленькие ячейки - осторожно. Если в группе "Москва, 18-24" всего 5 человек, 80% там - это 4 из 5. Статистика шатается. В отчёте лучше писать "n=5" или не делать выводов по таким ячейкам.
Проверка на вменяемость: суммы по строкам и столбцам должны сходиться с общим числом ответов. Если нет - где-то ошибка в построении или выгрузке.
Ошибки при интерпретации
Считать проценты от общей базы, когда важны проценты внутри групп. "40% женщин довольны" и "40% довольных - женщины" - разное. Первое - доля среди женщин, второе - доля женщин среди довольных.
Делать выводы по ячейкам с малым n. Три человека в ячейке - не база для "тренда".
Скрещивать переменные, которые логически не связаны. Иногда хочется "посмотреть всё со всем" - но таблица 20x15 нечитаема. Выбирайте пары с гипотезой: что именно хотите проверить?
Путать корреляцию и причину. Кросс-таблица показывает связь (чаще вместе или реже). Но "чаще" не значит "из-за". Мужчины чаще ставят низкую оценку - может, они вообще реже пользуются сервисом или приходят из другого канала. Интерпретировать осторожно.
Пример: пол × время учёбы (с таблицей)
Опрос студентов: предпочитают учиться днём или ночью. Классифицируем ответы по полу. Вот кросс-таблица:
| Пол / Время для учёбы | День | Ночь | Всего по полу |
| Мужчины | 40 | 60 | 100 |
| Женщины | 70 | 30 | 100 |
| Всего по времени | 110 | 90 | 200 |
Сравнение пропорций: 70% женщин предпочитают день (70 из 100), у мужчин только 40%. Различие в предпочтениях по полу налицо.
Выявление тенденций: в целом больше студентов за день (110 из 200), но среди мужчин большинство выбирает ночь. Общая картина скрывает разницу между группами - кросс-таблица это показывает.
Пример: регион × оценка, NPS × канал
Опрос про доставку: 300 ответов. Регион (Москва / Регионы) и оценка скорости (1-5). Кросс: в Москве 45% поставили 4-5, в регионах 62%. В регионах доставку воспринимают быстрее - без кросс-табуляции эта разница теряется в общей доле.
NPS по каналу привлечения: кросс "канал × промо/нейтрал/детрактор" покажет, откуда приходят самые лояльные. Опрос сотрудников: "Удовлетворённость × Подразделение" - какие отделы горят, какие нет. Руководству нужно именно это: не "в среднем 3.8", а "в бухгалтерии 4.2, в продажах 3.1".
Методология: от переменных до выводов
Чётко задайте переменные и категории. Соберите и очистите данные. Разнесите по таблице: строки - одна переменная, столбцы - другая. Добавьте итоги. Интерпретируйте доли внутри групп. При необходимости - тест хи-квадрат для проверки значимости связи. Визуализация (столбчатые диаграммы и т.п.) помогает подать результат заказчику.
Кросс-табуляция в отчётах WebAsk
В отчётах WebAsk есть кросс-табуляция: можно выбрать два вопроса и получить таблицу. Для простых разрезов хватает встроенного. Если нужны нестандартные группировки, скрытые переменные или свои проценты - экспорт данных в Excel и там уже режьте как надо. Подробности - в разделе отчёты и ответы.
Как строить и оформлять таблицу
Перед тем как строить таблицу - сформулируйте вопрос. "Чем отличаются мужчины и женщины по NPS?" - одна таблица. "Как оценка зависит от частоты покупок?" - другая. Без вопроса кросс-таблица превращается в дамп чисел.
Ограничьте число категорий. Если в вопросе 15 вариантов, таблица расползётся. Сгруппируйте (например, "до 30 / 30-45 / 45+") или берите только релевантные категории.
Если категорий всё равно много - сделайте несколько маленьких таблиц вместо одной гигантской. По одной паре вопросов на таблицу.
В отчёте под таблицей укажите базу по строкам и столбцам. Читатель должен понимать, откуда проценты и насколько надёжны ячейки.
Связь с другими инструментами: кросс-табуляция - это ещё не корреляция и не регрессия. Она даёт картину по категориям. Если переменных много и хочется "выжать" вклад каждого фактора - тогда регрессия.
Как улучшить анализ
Очищайте данные от ошибок и пропусков до построения таблицы. Берите только релевантные переменные - лишние раздувают таблицу без пользы. Решите, что в строках, что в столбцах - так, чтобы читалось естественно.
Слоение (slicing): разбейте данные по третьей переменной. Например, таблица "пол × время учёбы" - отдельно для младших курсов и старших. Связь может быть сильнее в одной подгруппе и слабее в другой. Слоение помогает это увидеть.
Веса: если выборка не репрезентативна, можно применить весовые коэффициенты - тогда кросс-таблица лучше отражает структуру популяции. Учитывайте искажающие факторы (например, перекос по возрасту) - веса помогут скорректировать.
Тест хи-квадрат проверит, значима ли связь. Для более сложных связей между категориями - логистическая регрессия. Кросс-таблица - база, регрессия - когда нужно "выжать" вклад нескольких факторов.
Кросс-таблица vs регрессия
Хватает: два вопроса с небольшим числом категорий, нужно сравнить группы. Не хватает: десяток переменных, нужно понять, что на что влияет и с какой силой. Там уже регрессия, корреляционный анализ. Для категориальных связей - логистическая регрессия. Кросс-табуляция - первый шаг, не панацея. Но для большинства опросов этого первого шага достаточно.
В отчёте для заказчика кросс-таблица читается проще, чем регрессионная модель. Если аудитория не статистики - начните с таблиц. Потом при необходимости углубляйтесь.
Резюме: кросс-табуляция - базовый, но мощный инструмент. Два вопроса, таблица, проценты по группам. В WebAsk она встроена в отчёты; для нестандартных разрезов - выгрузка и Excel.
Кросс-табуляция - таблица совместного распределения двух переменных. Показывает, как ответы на один вопрос меняются в группах по другому. В WebAsk есть в отчётах; для сложных разрезов - экспорт и анализ в Excel.
Обновлено 19 февраля 2026 Опубликовано 9 апреля 2024
Дарья Лисовенко