Построение гистограммы в Excel: от данных до анализа распределения
Гистограмма в Excel — это инструмент для визуализации частотного распределения числовых данных. В отличие от обычной столбчатой диаграммы, она показывает, сколько значений попадает в определенные интервалы (бины), что позволяет мгновенно оценить форму распределения: найти пики, выбросы или асимметрию. Чтобы построить гистограмму, выделите числовой диапазон, перейдите на вкладку Вставка и выберите значок гистограммы в группе «Диаграммы». Ниже подробно разберем все этапы создания, настройки интервалов и типичные ошибки.
Подготовка исходных данных
Для корректного построения гистограммы необходим массив однородных числовых данных. Это могут быть результаты тестирования, время обработки заказов, показатели датчиков или финансовые метрики.
- Соберите данные в один столбец без пропусков.
- Убедитесь, что в диапазоне нет текстовых значений или ошибок (например,
#Н/Д). - Для статистически значимого результата желательно иметь не менее 20–30 записей.
Лайфхак: Не выделяйте заголовок столбца при создании простой гистограммы через меню «Вставка», если хотите, чтобы Excel сам определил диапазон. Однако при использовании надстройки «Анализ данных» заголовок лучше включить в выделение для автоматического подписывания осей.
Способ 1: Быстрое создание через ленту меню
Этот метод подходит для большинства задач в современных версиях Excel (2016, 2019, 2021, 365). Программа автоматически рассчитает оптимальное количество интервалов.
- Выделите ячейки с числовыми данными.
- Перейдите на вкладку Вставка.
- В группе «Диаграммы» нажмите на значок Вставить гистограмму или линейчатую диаграмму (столбцы с синим градиентом).
- Выберите первый пункт в разделе «Гистограмма».
Excel мгновенно создаст диаграмму. По умолчанию используется правило Стёрджеса для расчета количества бинов ($k \approx 1 + 3.322 \log_{10} n$), что обычно дает адекватную картину распределения.
Способ 2: Точная настройка через «Анализ данных»
Если вам нужно строго задать границы интервалов (например, 0–10, 10–20, 20–30) или получить таблицу частот для дальнейших расчетов, используйте надстройку «Пакет анализа».
Важно: Если кнопки «Анализ данных» нет на вкладке «Данные», её нужно активировать: Файл > Параметры > Надстройки > внизу «Управление: Надстройки Excel» нажать Перейти > поставить галочку Пакет анализа.
Алгоритм действий:
- Перейдите на вкладку Данные и нажмите Анализ данных.
- Выберите Гистограмма и нажмите ОК.
- Заполните поля:
- Входной интервал: ваш столбец с данными.
- Интервал карманов (опционально): столбец с верхними границами ваших интервалов. Если оставить пустым, Excel посчитает их сам.
- Параметры вывода: выберите место для таблицы и поставьте галочку Интегральный процент (для кумулятивной кривой) и Вывод графика.
- Нажмите ОК.
Вы получите статическую таблицу частот и встроенную диаграмму. Преимущество метода — полный контроль над шириной «карманов».
Настройка внешнего вида и осей
Стандартная гистограмма часто требует доработки для читаемости. Основные проблемы — щели между столбцами и непонятные подписи осей.
Убираем промежутки между столбцами
По умолчанию Excel может оставлять зазоры. Чтобы сделать классическую гистограмму:
- Кликните правой кнопкой мыши по любому столбцу диаграммы.
- Выберите Формат ряда данных.
- В панели справа установите параметр Боковой зазор (Gap Width) в значение 0%. Столбцы сольются в единое полотно.
Ручная настройка интервалов (Бинов)
Если автоматические интервалы неудобны (например, получились дробные числа 12.5–17.3):
- В том же меню Формат оси (клик по горизонтальной оси) найдите раздел Параметры оси.
- В поле Ширина кармана (Bin width) введите нужное значение (например, 10 для шага в 10 единиц).
- Либо задайте Число карманов вручную.
- При необходимости измените Границы (минимум и максимум оси), чтобы отсечь лишнее пространство.
Проверка целостности: сумма значений частот всех столбцов должна точно равняться количеству исходных точек данных. Если сумма меньше, часть данных попала за границы осей.
Частые ошибки при построении
- Спутать с столбчатой диаграммой. Столбчатая диаграмма сравнивает категории (например, продажи по месяцам), а гистограмма показывает плотность распределения одной переменной. Если у вас есть текст в исходных данных, Excel не построит гистограмму.
- Неверный масштаб оси Y. Иногда ось начинается не с нуля, что визуально искажает разницу между интервалами. Всегда проверяйте, чтобы нижняя граница оси значений была 0.
- Мало данных. На выборке из 5–10 чисел гистограмма будет выглядеть хаотично и не покажет реальной закономерности.
- «Рваные» края. Если данные имеют четкие границы (например, оценки от 1 до 5), автоматическое разбиение может создать странные интервалы вроде 0.8–1.6. В таких случаях лучше задать ширину кармана = 1 вручную.
FAQ
Можно ли наложить кривую нормального распределения на гистограмму?
Да. Постройте гистограмму, затем добавьте новый ряд данных с расчетными значениями функции нормального распределения (НОРМ.РАСП) и отобразите его как график поверх столбцов, изменив тип диаграммы для этого ряда на «График».
Почему моя гистограмма выглядит как набор разрозненных столбцов? Скорее всего, у вас включен боковой зазор. Кликните правой кнопкой по столбцам, выберите «Формат ряда данных» и уменьшите «Боковой зазор» до 0%. Также убедитесь, что вы выбрали именно тип диаграммы «Гистограмма», а не «Гистограмма с группировкой».
Как обновить гистограмму при изменении данных? Если вы строили через «Вставку», диаграмма обновляется автоматически при изменении диапазона (если он динамический) или после расширения выделения. Если использовали «Анализ данных», результат статичен — нужно запустить инструмент заново. Для динамических отчетов лучше использовать сводные диаграммы.