Прежде чем поговорить об обозначениях в статистике, давайте напомним, что важные свойства некоторого числового набора можно описать несколькими числами. Как вы уже знаете, в статистике широко используются среднее арифметическое и медиана.
Напомним, что средним арифметическим числового массива называется отношение суммы всех чисел массива к их количеству. Эта центральная мера, которая употребляется чаще всего. Иногда среднее арифметическое называют просто средним, или средним значением.
Медианой числового массива называется такое число М, что хотя бы половина чисел массива не больше числа М и хотя бы половина чисел не меньше числа М.
Сформулированное определение точно говорит, что такое медиана, но использовать его для нахождения медианы не всегда удобно.
Чтобы найти медиану числового массива, нужно упорядочить массив по возрастанию. В результате чего получится вариационный ряд.
Если в массиве нечётное количество чисел, то медианой является число, стоящее посередине вариационного ряда.
Если в массиве чётное количество чисел, то медианой обычно считают среднее арифметическое двух чисел, стоящих посередине.
Обратите внимание, что если в массиве чётное количество чисел, то медиан у такого массива много – два средних числа и все числа, заключённые между ними.
Что лучше выбрать для описания того или иного набора данных (среднее арифметическое или медиану), зависит от природы данных, целей исследования и сложившихся традиций.
Среднее арифметическое хорошо описывает однородные массивы данных, то есть массивы, в которых величины имеют один и тот же смысл, и нет значений, которые сильно отличаются от большинства. А вот если в числовом наборе встречаются выбросы, то есть одно или несколько чисел, которые намного больше или намного меньше всех остальных, то в качестве центральной меры часто используют медиану.
Иногда нужны не только среднее арифметическое и медиана, но и другие значения, характеризующие набор данных, например, наибольшее и наименьшее значения.
Также часто нужно иметь представление о том, как сильно разбросаны (рассеяны) значения. Самой простой характеристикой, описывающей рассеивание данных, является размах.
Размах числового массива – это разность между наибольшим и наименьшим значениями.
Часто в статистических массивах числа приходится обозначать буквами. Очевидно, что использовать отдельную букву для каждого числа невозможно, поэтому для чисел одного массива используют одну и ту же букву с индексами – номерами.
Например, если некоторый набор состоит из 10 чисел, то каждое число в этом наборе можно обозначить буквой с соответствующим индексом (номером). Иногда, чтобы подчеркнуть, что числа образуют один набор, их записывают в фигурных скобках. Такой набор можно обозначить .
Также, например, каждое число в некотором наборе из 7 чисел можно обозначить буквой с соответствующим индексом. Чтобы подчеркнуть, что эти числа образуют один набор, их записывают в фигурных скобках. Весь набор можно обозначить .
Конечно же, могут использоваться и другие буквы.
Давайте рассмотрим пример, в котором дан набор чисел: 17, 19, 51, 41, 47, 13, 14. Обозначим его буквой .
В этом наборе , и так далее до .
Если чисел в наборе много, то вместо слов «и так далее до» используют многоточие. Например, набор, обозначенный буквой , в котором 50 чисел, записывают так…
Среднее арифметическое чисел набора принято обозначать .
Для наименьшего значения набора обычно используют обозначение , а для наибольшего значения – .
Если набор обозначить, например, буквой , то можно записать короче.
Следует отметить, что обозначения не только укорачивают запись, но и делают её ясной, однозначной и строгой. Вот только для некоторых описательных характеристик (например, для медианы) нет общепринятых обозначений.
Выполним несколько заданий.
Задание первое. Дан числовой набор .
Решение. Набор состоит из 8 чисел.
Задание второе. Найдите среднее арифметическое набора .
Решение. Данный набор состоит из 5 чисел.
Мы знаем, что среднее арифметическое – это дробь, в числителе которой стоит сумма чисел, а в знаменателе – их количество.
До встречи на следующих занятиях!