Расчет разброса данных в Excel: полное руководство по СКО
Чтобы посчитать среднее квадратичное отклонение (СКО) в Excel, используйте функцию =СТАНДОТКЛОН.В(диапазон) для выборки или =СТАНДОТКЛОН.Г(диапазон) для всей совокупности данных. Эти функции автоматически игнорируют текст и пустые ячейки, выдавая результат, показывающий степень разброса значений относительно среднего арифметического.
Выбор правильной функции: В или Г?
Главная ошибка при расчетах — путаница между типами данных. От правильного выбора функции зависит точность статистического вывода.
- СТАНДОТКЛОН.В (англ. STDEV.S) — используется, когда ваши данные представляют собой выборку из большого массива. Например, вы опросили 100 клиентов из базы в 10 000 человек и хотите оценить разброс их оценок. Буква «В» означает «Выборка».
- СТАНДОТКЛОН.Г (англ. STDEV.P) — применяется, если у вас есть данные по всей генеральной совокупности. Например, вы анализируете зарплаты всех 50 сотрудников конкретного отдела, и других сотрудников в этом отделе не существует. Буква «Г» означает «Генеральная совокупность».
В версиях Excel до 2010 года использовались устаревшие названия функций: СТАНДОТКЛОН (аналог .В) и СТАНДОТКЛОНП (аналог .Г). Они до сих пор работают для совместимости, но в новых файлах рекомендуется использовать современные версии с суффиксами.
Пошаговый расчет на примере
Допустим, в ячейках A2:A11 записаны результаты тестирования 10 сотрудников (это выборка из большого штата компании). Нам нужно узнать стабильность результатов.
- Выделите пустую ячейку для результата.
- Введите формулу для выборки:
=СТАНДОТКЛОН.В(A2:A11) - Нажмите Enter.
Если бы эти 10 человек были единственными сотрудниками в компании (вся совокупность), формула выглядела бы так:
=СТАНДОТКЛОН.Г(A2:A11)
Работа с таблицами и именными диапазонами
Если ваши данные оформлены как «Умная таблица» (Ctrl+T), формулы становятся более читаемыми. Предположим, таблица называется Отчет, а столбец с баллами — Балл.
| Тип данных | Формула |
|---|---|
| Выборка | =СТАНДОТКЛОН.В(Отчет[Балл]) |
| Совокупность | =СТАНДОТКЛОН.Г(Отчет[Балл]) |
При добавлении новых строк в таблицу диапазон формулы расширится автоматически, и пересчет произойдет мгновенно.
Как интерпретировать полученное число
Само по себе число СКО мало о чем говорит без контекста. Вот как его читать:
- Низкое значение: Данные сгруппированы плотно вокруг среднего. Процесс стабилен, предсказуем.
- Высокое значение: Сильный разброс. Есть выбросы или процесс нестабилен.
Для сравнения разброса в разных наборах данных (где средние значения сильно отличаются) используйте коэффициент вариации. Разделите СКО на среднее арифметическое (=СРЗНАЧ) и умножьте на 100%. Результат в процентах позволит сравнивать волатильность продаж дорогого и дешевого товара.
Частые ошибки при расчете
- Включение заголовков в диапазон. Если вы выделили ячейку A1 с названием столбца, а в ней текст, современные функции её проигнорируют. Но если там случайно стоит цифра (например, год "2025"), она исказит результат. Всегда выделяйте только числа.
- Игнорирование логических значений. Функции
СТАНДОТКЛОН.В/Гигнорируют текст и пустоты, но если в диапазоне есть логические ИСТИНА/ЛОЖЬ, они могут быть обработаны как 1 и 0 в некоторых старых функциях или при прямом вводе аргументов. Для чистоты эксперимента лучше использовать фильтры или отдельные столбцы с числами. - Путаница в методах деления. Функция для выборки (.В) делит сумму квадратов отклонений на
(n-1), а для совокупности (.Г) — наn. Использование.Гдля маленькой выборки занизит оценку разброса, что может привести к ошибочным выводам о стабильности процесса.
FAQ
Можно ли посчитать СКО по условию (например, только для отдела "Продажи")?
Прямой функции СТАНДОТКЛОН.ЕСЛИ в стандартном наборе Excel нет. Решение:
- Используйте функцию
ФИЛЬТР(в новых версиях):=СТАНДОТКЛОН.В(ФИЛЬТР(B2:B100; A2:A100="Продажи")). - Или создайте сводную таблицу, поместив поле со значениями в область значений и выбрав настройку «Стандартное отклонение».
Что делать, если результат равен нулю? Это означает, что все числа в выбранном диапазоне абсолютно одинаковы. Разброс отсутствует. Также ноль будет, если в диапазоне меньше двух числовых значений (для выборки расчет невозможен математически).
Как быстро найти выбросы с помощью СКО?
Значения, отклоняющиеся от среднего более чем на 2 или 3 СКО, часто считаются статистическими выбросами. Вы можете создать вспомогательный столбец с формулой проверки: =ЕСЛИ(ABS(A2-СРЗНАЧ($A$2:$A$100)) > 3*СТАНДОТКЛОН.В($A$2:$A$100); "Выброс"; "Норма").