Выясним, как закон больших чисел связан с измерением вероятностей.
Когда мы говорим о бросании симметричной монеты, то предполагаем,
что вероятность выпадения орла равна вероятности выпадения решки, то есть равна
0,5. Говоря о бросании симметричного игрального кубика, мы предполагаем, что
вероятность выпадения любой из 6 граней равна
. Мы так делаем, так как монета и кубик
симметричны.
В других случаях тоже иногда делают предположения о вероятностях. Например, считают, что день рождения случайно выбранного человека с равными шансами может приходиться на любой день года. Это не совсем так, но близко к истине.
Конечно же, в большинстве случаев вероятности событий неизвестны. Но их так хотелось бы знать.
Владельцу магазина хотелось бы знать вероятность того, что клиент совершит покупку. Покупателю, который приобретает, например, стиральную машину, хотелось бы знать, насколько она надёжна, то есть вероятность того, что купленная стиральная машина прослужит долго.
Узнать или вычислить вероятности в этих случаях у нас не получится, но мы можем использовать оценку вероятности с помощью частоты, то есть оценку по выборке. Это косвенный способ измерения вероятностей. Он основан на законе больших чисел.
Одно из проявлений закона больших чисел состоит в том, что при многократном повторении одного и того же опыта частоты событий в этом опыте будут близки к их вероятностям.
Так получается потому, что последовательность повторяющихся и независимых опытов можно рассматривать как серию испытаний Бернулли.
Пусть проведена серия из
испытаний, вероятность успеха (то
есть нужного события) равна
, а измеренная частота успеха равна
.
Напомним, что при увеличении числа испытаний в серии испытаний Бернулли
математическое ожидание (или среднее значение) частоты успеха неизменно и равно
, а стандартное отклонение частоты
успеха
приближается
к 0.
Тогда с ростом числа
среднее значение частоты равно
(
), а стандартное отклонение частоты уменьшается, стремясь к 0 (
). Поэтому при достаточно больших значениях
частота
изучаемого
события мало отличается от его вероятности
.
Пример. Крупная почтовая компания заключила договор с IT-компанией на обслуживание компьютерной системы. Компьютерная система обширная, и нередко случаются сбои, которые нужно быстро устранить.
Рассмотрим событие
«сбой устранён менее чем за 8 ч».
Будем считать это событие успехом. Вероятность этого события неизвестна. Оценим
её.
Каждый отдельный отказ оборудования можно рассматривать как испытание Бернулли. Начнём отсчёт с некоторого момента.
Предположим, что 71.2 % сбоев из первых 300 были устранены менее
чем за 8 ч после сообщения о сбое. Это значит, что в серии из 300 испытаний событие
имеет частоту 0,712.
Теперь предположим, что из следующих 300 сбоев только 49 % были устранены
за 8 ч после сообщения о сбое. То есть во второй серии из 300 испытаний событие
имеет частоту 0,49.
Если же объединить две рассмотренные серии в серию из 600 испытаний, то в этой серии частота успеха будет равна 0,601.

Обратите внимание, что частота события
меняется от серии к серии.
Продолжив рассматривать следующие серии из 300 испытаний, мы
заметим, что частота события
в объединённой серии, в которой
накапливаются всё новые и новые наблюдения, постепенно стабилизируется.
Чем больше испытаний, тем меньше изменчивость частоты события
. Если испытаний много, то, скорее
всего, частота события
близка к его вероятности. Начиная
с некоторого момента эту близость можно считать достоверным событием.
Событие «частота далека от вероятности» с ростом числа испытаний становится маловероятным, и его можно не брать в расчёт, пользуясь принципом практической невозможности.
Принцип практической невозможности. К маловероятным событиям при однократном проведении опыта относятся как к невозможным.
Пусть
и
– это число успехов и частота успеха в серии
испытаний Бернулли соответственно.
Теория вероятностей не только утверждает, что при большом числе испытаний
верно приближённое равенство

но и позволяет оценить точность этого приближения.
Если мы собираемся использовать частоту события вместо его вероятности, которая нам неизвестна, то хотим, чтобы отклонение частоты от вероятности было наверняка малым.
Предположим, что нас устроит измерение вероятности с погрешностью
не более 0,05, то есть мы хотим, чтобы выполнялось неравенство
. Это значит, что
нужно выбрать так, чтобы
вероятность выполнения этого неравенства была близка к 1.
Уже при
вероятность выполнения этого
неравенства больше, чем 0,95 Получается, что при данном значении
погрешность измерения с вероятностью 0,95 не превышает 0,05.
Увеличивая число испытаний
, можно достичь меньшей погрешности и
большей достоверности.
При измерении вероятности с помощью частоты следует помнить о двух величинах: допустимой погрешности измерения и вероятности того, что эта погрешность не будет превышена.
Чем меньше допустимая погрешность и чем выше желаемая вероятность безошибочного измерения, тем больше опытов требуется. На практике это очень важно, так как часто большое количество опытов требует много времени и средств.
Поговорим, как закон больших чисел связан с социологическими исследованиями.
В силу закона больших чисел при большом числе испытаний Бернулли частота успеха близка к его вероятности. Это очень важно для социологических исследований.
Пример. Предположим, что нас интересует доля избирателей, которые на выборах готовы поддержать кандидата К. Упомянутая доля – это вероятность того, что наудачу выбранный избиратель окажется сторонником кандидата К.
Опросив всех избирателей, можно было бы попробовать узнать, сколько из них поддерживают кандидата К. Но, к сожалению, это невозможно, так как люди не обязаны отвечать на вопросы о своих политических предпочтениях.
Тогда вместо того, чтобы опрашивать всех, опрашивают небольшую группу людей – выборку. Важно, чтобы выборка правильно представляла всю совокупность избирателей. Самый простой способ этого добиться – это составить выборку случайно.
Давайте численность выборки обозначим
. Результат опроса каждого человека в
выборке (то есть респондента) будем считать успехом, если он высказался в
пользу кандидата К. В противном случае назовём результат неудачей.
Неизвестная вероятность успеха равна
. Можно считать, что она остаётся
неизменной на протяжении всего опроса. В качестве приближённого значения этой
вероятности принимают частоту успеха в выборке.
В отчётах о социологических исследованиях обычно сообщается не только приближённое значение вероятности успеха, но и точность приближения и численность выборки. Конечно, выборки бывают разными, но обычно их численность составляет около 2000 человек. Этого объёма выборки достаточно, чтобы обеспечить высокую точность выводов, независимо от того, насколько велика изучаемая совокупность.
В отчётах часто не говорят о том, что малая погрешность достигается не наверняка, а с большой вероятностью.
Запомните! Численность выборки, обеспечивающей нужную точность выводов, не связана с численностью обследуемой совокупности.
Поговорить о связи выборочного среднего и математического ожидания.
Закон больших чисел позволяет нам вместо неизвестных вероятностей событий использовать их частоты, которые подсчитаны по выборкам от нескольких сотен до нескольких тысяч наблюдений.
Другое проявление закона больших чисел состоит в том, что вместо неизвестного математического ожидания случайной величины можно использовать среднее значение, полученное по выборке.
Если произвести много измерений случайной величины, то получится набор данных, который является случайной выборкой. В силу закона больших чисел среднее арифметическое этого набора (то есть среднее выборочное) окажется близко к неизвестному математическому ожиданию.
Запомните! Среднее значение данных в выборке (то есть среднее выборочное) используется как приближённое значение математического ожидания.
Пример. Рассмотрим случайную величину «диаметр горошины определённого сорта».

Нам хотелось бы узнать, каково истинное среднее значение, то есть математическое ожидание, этой случайной величины.
Мы не можем собрать и измерить все горошины, поэтому распределение, которому подчиняется размер горошин, нам неизвестно. Но мы можем сделать выборку, то есть произвести какое-то большое число измерений и найти среднее арифметическое.
Предположим, что взяли 1000 горошин определённого сорта, измерили диаметр каждой горошины с округлением до одного миллиметра и занесли результаты в таблицу.

Найдём среднее значение.

Полученное среднее значение является оценкой математического ожидания случайной величины «диаметр горошины определённого сорта».
Закон больших чисел даёт нам уверенность, что полученная величина близка к диаметру всех горошин рассматриваемого сорта, которые выращены в одинаковых условиях.
Усреднение измерений увеличивает достигаемую точность.
Закон больших чисел – это мост между вероятностью, которую мы вычисляем, и частотой, которую мы наблюдаем в реальном мире.
До встречи!






