Прежде чем приступить к изучению новой темы, напомним, что средним арифметическим числового массива называется отношение суммы всех чисел массива к их количеству.
Среднее арифметическое хорошо описывает однородные массивы данных, то есть массивы, в которых величины имеют один и тот же смысл, и нет значений, которые сильно отличаются от большинства.
Если в числовом наборе, который мы изучаем, встречаются выбросы, то есть одно или несколько чисел, которые намного больше или намного меньше всех остальных, то в качестве центральной меры часто используют медиану.
Пример. Возьмём набор чисел: 12, 2, 11, 3, 7, 10, 4.
Упорядочим эти числа по возрастанию: 2, 3, 4, 7, 10, 11, 12.
Отметим, что упорядоченный набор называется вариационным рядом.
Посередине вариационного ряда стоит число 7.
Число 7 – медиана данного набора.
Пример. Рассмотрим числовой набор: 12, 2, 11, 3, 7, 10, 4, 15.
Упорядочим числа по возрастанию: 2, 3, 4, 7, 10, 11, 12, 15.
Так как в наборе 8 чисел, то нет числа, стоящего точно посередине. Поэтому возьмём 2 числа, стоящих посередине. Это числа 7 и 10. Любое из них, а также любое число между ними можно взять в качестве медианы. Но всё же чаще всего в качестве медианы берут среднее арифметическое двух центральных чисел. Получается, что в данном случае медиана равна 8,5.
Обобщим рассмотренные примеры.
Чтобы найти медиану числового массива, в первую очередь нужно упорядочить набор чисел по возрастанию. В результате чего получится вариационный ряд.
Если в массиве нечётное количество чисел, то медианой является число, стоящее посередине вариационного ряда.
Если в массиве чётное количество чисел, то медианой обычно считают среднее арифметическое двух чисел, стоящих посередине.
Важно отметить, что если в массиве чётное количество чисел, то медиан у такого массива много – два средних числа и все числа, заключённые между ними.
Теперь сформулируем определение медианы.
Медианой числового массива называется такое число М, что хотя бы половина чисел массива не больше числа М и хотя бы половина чисел массива не меньше числа М.
Давайте в следующем примере покажем с помощью определения, что число 7 является медианой числового набора: 11, 3, 9, 7, 13, 4, 5, 7.
Всего в наборе 8 чисел, поэтому число 7 будет медианой, если в наборе найдутся 4 числа (или больше), которые не больше числа 7, а также найдутся 4 числа (или больше), которые не меньше числа 7.
Не будем упорядочивать числа в данном наборе, а просто подчеркнём все числа, которые не больше числа 7. Над всеми числами, которые не меньше числа 7, поставим черту сверху.
Обратите внимание, что число 7 подчёркнуто и над ним стоит черта сверху, то есть оно входит и в одно, и в другое множество.
Всего мы сделали 5 подчёркиваний. Также над 5 числами мы поставили черту сверху. Получается, что в данном наборе 5 чисел, которые не больше чем 7, и 5 чисел, которые не меньше чем 7. Следовательно, требование определения выполнено, поэтому число 7 является медианой.
Сформулированное определение точно говорит, что такое медиана, но использовать его для нахождения медианы неудобно. Чтобы найти медиану, нужно действовать уже известным нам способом.
Пусть всего в ряду чисел.
Если нечётно, то медианой будет число
с порядковым номером .
Если чётно, то медианой будет любое из чисел с номерами и или любое число между ними.
Чаще всего в качестве медианы берут среднее арифметическое чисел с этими номерами.
В следующем примере приведена таблица данных о производстве кукурузы в России с 2016 года по 2020 год.
Среднее значение производства кукурузы в стране за 5 лет равно 13,62 млн т в год.
Давайте вычислим медиану. Для этого упорядочим числовые данные, приведённые в таблице: 11,4; 13,2; 13,9; 14,3; 15,3.
Видим, что медиана равна 13,9 млн т (урожай 2020 года).
Обратите внимание, что в данном случае медиана совсем немного отличается от среднего значения. Так бывает часто, но не всегда.
Рассмотрим такой пример. В 2021 году в России было 15 городов с числом жителей более 1 млн человек.
Разделим число всех жителей на количество городов, то есть на 15, и получим, что среднее арифметическое приблизительно равно 2239 тыс. человек.
Обратите внимание, что в таблице нет города, население которого было бы близко к получившемуся среднему значению. В большинстве городов население лишь немного превышает 1 млн человек. Исключение составляют Москва и Санкт-Петербург, поэтому данные о населении в этих городах можно рассматривать как выбросы. Из-за этих двух значений среднее арифметическое оказалось намного больше, чем население типичного города-миллионера. А значит, среднее арифметическое не даёт верного представления о населении крупного города России. В данном случае лучше использовать медиану.
Давайте упорядочим значения, приведённые в таблице: 1004, 1049, 1050, 1092, 1125, 1137, 1139, 1144, 1187, 1244, 1257, 1495, 1620, 5384, 12 655.
Медианой является восьмое по порядку значение. Это население города Самары. Следовательно, можно сказать, что Самара – медианный по численности город-миллионер в 2021 году, или медианный представитель данного набора.
Можно сделать вывод, что главное достоинство медианы – устойчивость относительно выбросов, то есть отдельных сильно выделяющихся значений. Ведь если в наборе есть выбросы, то среднее арифметическое может не очень хорошо описывать большинство чисел. В таких случаях медиана лучше описывает набор, чем среднее арифметическое.
Выполним несколько заданий.
Задание первое. Найдите медиану и среднее арифметическое чисел.
Решение. Обратите внимание, что числа в данных наборах уже упорядочены по возрастанию.
Найдём среднее арифметическое первого набора.
Так как данный набор уже упорядочен, сразу найдём медиану, то есть число, которое стоит посередине. Это число 7.
Найдём среднее арифметическое второго набора.
Числа в этом наборе упорядочены. Их 6. Поэтому нет числа, стоящего посередине. А значит, возьмём 2 числа, стоящих посередине. Это числа 5 и 7. Среднее арифметическое этих чисел равно 6. Это и есть медиана данного числового набора.
Задание второе. Найдите медиану набора чисел.
Решение. Найдём медиану первого набора чисел. Для этого сначала упорядочим набор по возрастанию: 2, 3, 7, 10, 11, 12, 15. Теперь найдём число, которое стоит посередине. Это число 10.
Получается, что число 10 – медиана этого набора.
Найдём медиану второго набора чисел. Для этого в первую очередь упорядочим набор по возрастанию: 3, 4, 5, 6, 8, 9, 11, 13. Так как в наборе 8 чисел, то среди них нет числа, стоящего посередине. Тогда возьмём 2 числа, стоящих посередине. Это числа 6 и 8. Среднее арифметическое этих чисел равно 7. Это и есть медиана данного числового набора.
До встречи на следующих занятиях!