Прежде чем приступить к изучению новой темы, напомним, что средним арифметическим числового массива называется отношение суммы всех чисел массива к их количеству.
Среднее арифметическое хорошо описывает однородные массивы данных, то есть массивы, в которых величины имеют один и тот же смысл, и нет значений, которые сильно отличаются от большинства.
Если в числовом наборе, который мы изучаем, встречаются выбросы, то есть одно или несколько чисел, которые намного больше или намного меньше всех остальных, то в качестве центральной меры часто используют медиану.
Медианой числового массива называется такое число М, что хотя бы половина чисел массива не больше числа М и хотя бы половина чисел массива не меньше числа М.
Чтобы найти медиану числового массива, в первую очередь нужно упорядочить набор чисел по возрастанию. В результате чего получится вариационный ряд.
Если в массиве нечётное количество чисел, то медианой является число, стоящее посередине вариационного ряда.
Если в массиве чётное количество чисел, то медианой обычно считают среднее арифметическое двух чисел, стоящих посередине.
Иногда нужны не только среднее арифметическое или медиана, но и другие значения, характеризующие набор данных, например, наибольшее и наименьшее значения.
Например, нам часто интересно, какова наименьшая цена на нужный нам товар, а увидев новый автомобиль, мы интересуемся, какую наибольшую скорость он может развить.
Рассмотрим пример. Саша и Паша устроили соревнование по прыжкам в длину с места. Каждый из них сделал по 5 попыток. Результаты прыжков в сантиметрах записаны в таблицу. Кроме того, в таблице указаны средние результаты, а также наилучший прыжок и наихудший прыжок каждого мальчика.
Как вы видите, результаты в разных попытках у каждого разные. На это могли повлиять различные факторы. Например, техника прыжка или плохое настроение.
Обратите внимание, что у Саши среднее значение прыжка больше, чем у Паши. Хотя в одной из попыток Паша прыгнул дальше Саши.
Как известно, во многих спортивных дисциплинах принято учитывать только лучший показатель.
Получается, что в этом соревновании Паша был лучшим, но Саша уступает лишь немного, а в среднем он прыгает лучше. Кроме того, худший результат показал тоже Паша. Поэтому вполне возможно, если мальчики устроят соревнование ещё раз, лучше прыгнет Саша.
Во многих случаях наибольшее и наименьшее значения – неудачные характеристики. Они часто не являются типичными.
Например, в 2021 году в России было 15 городов с числом жителей более 1 млн человек. Обратите внимание, что Москва и Санкт-Петербург сильно выбиваются из общего ряда.
Также следует отметить, что наибольшее и наименьшее значения нередко попадают в набор данных по ошибке. Поэтому, начиная работать с данными, полезно обратить внимание на наибольшее и наименьшее значения, чтобы убедиться, что они правдоподобны.
Часто нужно знать не только среднее значение, но и иметь представление о том, насколько числа в наборе отличаются друг от друга или от среднего значения. Самой простой характеристикой, описывающей рассеивание данных, является размах.
Размах числового массива – это разность между наибольшим и наименьшим значениями.
Пример. Перед вами таблица, в которой приведены данные о производстве кукурузы в России с 2016 года по 2020 год.
Самый большой урожай кукурузы за данный период времени был получен в 2016 году, а самый маленький урожай был собран в 2018 году.
Давайте из большего значения вычтем меньшее и получим, что размах производства кукурузы в эти годы составил 3,9 млн т. Это чуть больше, чем 28 % среднего значения.
Размах – это мера рассеивания, которую находят чаще всего. Её считают самой простой. Для вычисления размаха используются только наибольшее и наименьшее значения, которые неустойчивы. Поэтому и размах – неустойчивая мера.
Выполним задание. Найдите наибольшее и наименьшее значения, размах, среднее значение и медиану набора чисел.
Решение.
До встречи на следующих занятиях!