Базовые статистические показатели: как считать и зачем они нужны

Иван Корнев·10.04.2026·4 мин

Чтобы найти среднее арифметическое, сложите все числа и разделите на их количество. Медиана — это число посередине упорядоченного ряда, а дисперсия показывает, насколько сильно данные разбросаны вокруг среднего значения. Эти три показателя являются фундаментом описательной статистики и необходимы для анализа любых наборов данных: от школьных оценок до финансовых отчетов.

Среднее арифметическое: формула и пример

Среднее арифметическое (обозначается как $\bar{x}$) — это наиболее популярная мера центральной тенденции. Оно показывает «типичное» значение в наборе данных.

Формула: $$ \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} $$ Где $x_i$ — каждое отдельное значение, а $n$ — общее количество значений.

Пример расчета: Допустим, у нас есть оценки студента за семестр: 4, 5, 3, 5, 4.

  1. Суммируем значения: $4 + 5 + 3 + 5 + 4 = 21$.
  2. Делим на количество оценок (5): $21 / 5 = 4.2$. Ответ: Средний балл равен 4.2.

Среднее арифметическое чувствительно к выбросам. Если в ряду появится одна оценка «1», средний балл резко упадет, хотя остальные оценки хорошие. В таких случаях лучше смотреть на медиану.

Медиана: поиск середины ряда

Медиана ($Me$) делит упорядоченный набор данных ровно пополам: 50% значений лежат ниже медианы, 50% — выше. Это более устойчивый показатель, если в данных есть аномалии.

Алгоритм поиска:

  1. Упорядочьте данные по возрастанию (от меньшего к большему).
  2. Определите количество элементов ($n$).
    • Если $n$ нечетное, медиана — это число, стоящее ровно посередине.
    • Если $n$ четное, медиана — это среднее арифметическое двух центральных чисел.

Примеры: Ряд А (нечетное количество): 2, 5, 8, 9, 12. Здесь 5 чисел. Третье число — 8. Медиана = 8.

Ряд Б (четное количество): 2, 5, 8, 10, 12, 15. Здесь 6 чисел. Центральных два — 8 и 10. Считаем среднее: $(8 + 10) / 2 = 9$. Медиана = 9.

Дисперсия: оценка разброса данных

Дисперсия ($\sigma^2$ или $S^2$) показывает степень разброса значений относительно среднего арифметического. Чем выше дисперсия, тем больше «разнобой» в данных. Низкая дисперсия означает, что все значения близки к среднему.

Формула выборочной дисперсии: $$ S^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1} $$ Примечание: Для генеральной совокупности делитель равен $n$, но на практике чаще работают с выборкой, поэтому используют $n-1$ (несмещенная оценка).

Пошаговый расчет на примере ряда: 2, 4, 6, 8, 10.

  1. Находим среднее арифметическое: $(2+4+6+8+10) / 5 = 30 / 5 = 6$.

  2. Вычисляем отклонение каждого числа от среднего и возводим в квадрат:

    • $(2 - 6)^2 = (-4)^2 = 16$
    • $(4 - 6)^2 = (-2)^2 = 4$
    • $(6 - 6)^2 = 0^2 = 0$
    • $(8 - 6)^2 = 2^2 = 4$
    • $(10 - 6)^2 = 4^2 = 16$
  3. Суммируем квадраты отклонений: $16 + 4 + 0 + 4 + 16 = 40$.

  4. Делим на $(n - 1)$: $40 / (5 - 1) = 40 / 4 = 10$.

Ответ: Дисперсия равна 10.

Квадратный корень из дисперсии называется стандартным отклонением. В нашем примере $\sqrt{10} \approx 3.16$. Стандартное отклонение удобнее использовать на практике, так как оно измеряется в тех же единицах, что и исходные данные (например, в рублях или баллах), а не в «квадратных единицах».

Сравнение показателей

ПоказательЧто показываетКогда использоватьЧувствительность к выбросам
Среднее арифметическоеЦентральную тенденциюДля нормального распределения без резких скачковВысокая
МедианаСередину ранжированного рядаПри наличии выбросов или асимметричном распределении (зарплаты, цены на жилье)Низкая
ДисперсияРазброс данныхДля оценки рисков, волатильности или стабильности процессаЗависит от метода расчета

Частые ошибки при расчетах

  • Забыли упорядочить ряд перед поиском медианы. Это самая распространенная ошибка. Без сортировки найти середину невозможно.
  • Неверный делитель в дисперсии. Путаница между делением на $n$ (для всей совокупности) и $n-1$ (для выборки). В большинстве учебных и аналитических задач используется $n-1$.
  • Игнорирование единиц измерения. Дисперсия всегда имеет квадратную размерность (если данные в метрах, дисперсия — в квадратных метрах), что часто сбивает с толку при интерпретации.
  • Смешение понятий. Попытка найти медиану как среднее арифметическое крайних значений (минимума и максимума) — это грубая математическая ошибка.

FAQ

В чем разница между дисперсией и стандартным отклонением? Дисперсия — это квадрат отклонений, она нужна для математических выкладок. Стандартное отклонение — это корень из дисперсии, он понятнее человеку, так как показывает разброс в привычных единицах измерения.

Что делать, если в ряду повторяются числа? При поиске медианы повторяющиеся числа просто занимают свои места в отсортированном ряду. При расчете среднего и дисперсии каждое вхождение учитывается отдельно в сумме.

Может ли дисперсия быть отрицательной? Нет. Поскольку отклонения возводятся в квадрат, сумма всегда будет положительной или нулевой (если все числа одинаковы). Отрицательная дисперсия невозможна математически.