Практическое применение закона больших чисел. Закон больших чисел. Предельные теоремы. Свойства функции распределения

Практика изучения случайных явлений показывает, что хотя результаты отдельных наблюдений, даже проведенных в одинаковых условиях, могут сильно отличаться, в то же время средние результаты для достаточно большого числа наблюдений устойчивы и слабо зависят от результатов отдельных наблюдений.

Теоретическим обоснованием этого замечательного свойства случайных явлений является закон больших чисел . Названием "закон больших чисел" объединена группа теорем, устанавливающих устойчивость средних результатов большого количества случайных явлений и объясняющих причину этой устойчивости.

Простейшая форма закона больших чисел, и исторически первая теорема этого раздела - теорема Бернулли , утверждающая, что если вероятность события одинакова во всех испытаниях, то с увеличением числа испытаний частота события стремится к вероятности события и перестает быть случайной.

Теорема Пуассона утверждает, что частота события в серии независимых испытаний стремится к среднему арифметическому его вероятностей и перестает быть случайной.

Предельные теоремы теории вероятностей, теоремы Муавра-Лапласа объясняют природу устойчивости частоты появлений события. Природа эта состоит в том, что предельным распределением числа появлений события при неограниченном возрастании числа испытаний (если вероятность события во всех испытаниях одинакова) является нормальное распределение.

Центральная предельная теорема объясняет широкое распространение нормального закона распределения. Теорема утверждает, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин с конечными дисперсиями, закон распределения этой случайной величины оказывается практически нормальным законом.

Теорема, приведенная ниже под названием "Закон больших чисел " утверждает, что при определенных, достаточно общих, условиях, с увеличением числа случайных величин их среднее арифметическое стремится к среднему арифметическому математических ожиданий и перестает быть случайным.

Теорема Ляпунова объясняет широкое распространение нормального закона распределения и поясняет механизм его образования. Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин, дисперсии которых малы по сравнению с дисперсией суммы, закон распределения этой случайной величины оказывается практически нормальным законом. А поскольку случайные величины всегда порождаются бесконечным количеством причин и чаще всего ни одна из них не имеет дисперсии, сравнимой с дисперсией самой случайной величины, то большинство встречающихся в практике случайных величин подчинено нормальному закону распределения.

В основе качественных и количественных утверждений закона больших чисел лежит неравенство Чебышева . Оно определяет верхнюю границу вероятности того, что отклонение значения случайной величины от ее математического ожидания больше некоторого заданного числа. Замечательно, что неравенство Чебышева дает оценку вероятности события для случайной величины, распределение которой неизвестно, известны лишь ее математическое ожидание и дисперсия.

Неравенство Чебышева. Если случайная величина x имеет дисперсию, то для любого e > 0 справедливо неравенство , где M x и D x - математическое ожидание и дисперсия случайной величины x .

Теорема Бернулли. Пусть m n - число успехов в n испытаниях Бернулли и p - вероятность успеха в отдельном испытании. Тогда при любом e > 0 справедливо .

Центральная предельная теорема. Если случайные величины x 1 , x 2 , …, x n , … попарно независимы, одинаково распределены и имеют конечную дисперсию, то при n ® равномерно по x (- ,)


В чем секрет успешных продавцов? Если понаблюдать за лучшими продавцами любой компании, вы заметите, что их объединяет одно общее качество. Каждый из них встречается с большим количеством людей и делает больше презентаций, чем менее успешные продавцы. Эти люди понимают, что продажи - игра чисел, и чем большему количеству людей они расскажут о своих продуктах или услугах, тем больше сделок заключат - вот и все. Они понимают, что если будут общаться не только с теми немногими, кто определенно скажет им "да", но и с теми, чей интерес к их предложению не столь велик, то закон средних чисел сработает в их пользу.


Ваши доходы будут зависеть от количества продаж, но в то же время, они будут прямо пропорциональны количеству презентаций, которые вы делаете. Как только вы поймете и начнете применять на практике закон средних чисел, тревога, связанная с началом нового бизнеса или работы в новой сфере, начнет снижаться. А в результате начнет расти чувство контроля и уверенность в своей способности зарабатывать. Если вы просто будете делать презентации и оттачивать в этом процессе свои навыки, появятся и сделки.

Чем думать о количестве сделок, думайте лучше о количестве презентаций. Нет смысла просыпаться утром или приходить домой вечером и приниматься гадать, кто купит у вас продукт. Вместо этого, лучше всего каждый день планировать, сколько звонков вам необходимо сделать. А потом, несмотря ни на что - сделать все эти звонки! Такой подход упростит вам работу - потому что это простая и конкретная цель. Если вы будете знать, что перед вами стоит вполне определенная и достижимая задача, вам будет легче сделать запланированное количество звонков. Если в этом процессе вы пару раз услышите "да" - тем лучше!

А если "нет", то вечером вы будете чувствовать, что честно сделали все, что могли, и вас не станут мучить мысли о том, сколько денег вы заработали, или как много компаньонов приобрели за день.

Предположим, в вашей компании или в вашем бизнесе средний продавец заключает одну сделку на четыре презентации. Теперь представьте себе, что вы вытаскиваете карты из колоды. Каждая карта трех мастей - пики, бубны и трефы - это презентация, на которой вы профессионально представляете продукт, услугу или возможность. Вы делаете это так хорошо, как только можете, но все равно не заключаете сделку. А каждая червовая карта - это сделка, позволяющая вам получить деньги или приобрести нового компаньона.

В такой ситуации, разве вам не захочется вытащить из колоды как можно больше карт? Предположим, вам предлагают вытащить столько карт, сколько вы хотите, и при этом платить вам или предлагать нового компаньона каждый раз, когда вы вытаскиваете червовую карту. Вы начнете увлеченно тянуть карты, едва замечая, какой масти карту только что вытащили.

Вы знаете, что в колоде из пятидесяти двух карт - тринадцать червовых. А в двух колодах - двадцать шесть червовых карт, и так далее. Будете ли вы разочарованы, вытащив пики, бубны или трефы? Нет конечно! Вы будете думать только о том, что каждый такой "промах" приближает вас - к чему? К червовой карте!

Но знаете что? Вам уже сделали такое предложение. Вы находитесь в уникальной ситуации, позволяющей заработать столько, сколько вам захочется, и вытащить столько червовых карт, сколько вы хотите вытащить в своей жизни. И если вы просто добросовестно " тянете карты ", совершенствуете свои навыки и стойко переносите немного пик, бубен и треф, то станете прекрасным продавцом и добьетесь успеха.

Одна из вещей, делающих процесс продаж настолько увлекательным - то, что каждый раз, когда тасуешь колоду, карты перемешиваются по-разному. Иногда все червы оказываются в начале колоды, и после удачной полосы (когда нам уже кажется, что мы никогда не проиграем!) нас ждет длинный ряд карт другой масти. А в другой раз, чтобы добраться до первой червы, придется пройти через бесконечное количество пик, треф и бубен. А иногда карты разной масти выпадают строго по очереди. Но в любом случае, в каждой колоде из пятидесяти двух карт, в каком-то порядке, всегда есть тринадцать червовых карт. Просто вытаскивайте карты до тех пор, пока их не найдете.



От: Leylya,  

Слова о больших числах относятся к числу испытаний – рассматривается большое число значений случайной величины или совокупное действие большого числа случайных величин. Суть этого закона состоит в следующем: хотя невозможно предсказать, какое значение в единичном эксперименте примет отдельная случайная величина, однако, суммарный результат действия большого числа независимых случайных величин утрачивает случайный характер и может быть предсказан практически достоверно (т.е. с большой вероятностью). Например, невозможно предсказать, какой стороной упадет одна монета. Однако если подбросить 2 тонны монет, то с большой уверенностью можно утверждать, что вес монет, упавших гербом вверх, равен 1 тонне.

К закону больших чисел прежде всего относится так называемое неравенство Чебышева, которое оценивает в отдельном испытании вероятность принятия случайной величиной значения, уклоняющееся от среднего значения не более, чем на заданное значение.

Неравенство Чебышева . Пусть Х – произвольная случайная величина, а=М(Х ) , а D (X ) – ее дисперсия. Тогда

Пример . Номинальное (т.е. требуемое) значение диаметра вытачиваемой на станке втулки равно 5мм , а дисперсия не более 0.01 (таков допуск точности станка). Оценить вероятность того, что при изготовлении одной втулки отклонение ее диаметра от номинального окажется менее 0.5мм .

Решение. Пусть с.в. Х – диаметр изготовленной втулки. По условию ее математическое ожидание равно номинальному диаметру (если нет систематического сбоя в настройке станка) : а=М(Х )=5 , а дисперсия D (Х)≤0.01 . Применяя неравенство Чебышева при ε = 0.5 , получим:

Таким образом, вероятность такого отклонения достаточно велика, а потому можно сделать вывод о том, что при единичном изготовлении детали практически наверняка отклонение диаметра от номинального не превзойдет 0.5мм .

По своему смыслу среднее квадратическое отклонение σ характеризует среднее отклонение случайной величины от своего центра (т.е. от своего математического ожидания). Поскольку это среднее отклонение, то при испытании возможны и большие (ударение на о) отклонения. Насколько же большие отклонения практически возможны? При изучении нормально распределенных случайных величин мы вывели правило «трех сигм»: нормально распределенная случайная величина Х при единичном испытании практически не отклоняется от своего среднего далее, чем на , где σ= σ(Х) – среднее квадратическое отклонение с.в. Х . Такое правило мы вывели из того, что получили неравенство

.

Оценим теперь вероятность для произвольной случайной величины Х принять значение, отличающееся от среднего не более чем на утроенное среднее квадратическое отклонение. Применяя неравенство Чебышева при ε = и учитывая, что D (Х)= σ 2 , получаем:

.

Таким образом, в общем случае вероятность отклонения случайной величины от своего среднего не более чем на три средних квадратичных отклонения мы можем оценить числом 0.89 , в то время как для именно нормального распределения можно гарантировать это с вероятностью 0.997 .

Неравенство Чебышева может быть обобщено на систему независимых одинаково распределенных случайных величин.

Обобщенное неравенство Чебышева . Если независимые случайные величины Х 1 , Х 2 , … , Х n M (X i )= a и дисперсиями D (X i )= D , то

При n =1 это неравенство переходит в неравенство Чебышева, сформулированное выше.

Неравенство Чебышева, имея самостоятельное значение для решения соответствующих задач, применяется для доказательства так называемой теоремы Чебышева. Мы с начала расскажем о сути этой теоремы, а затем дадим ее формальную формулировку.

Пусть Х 1 , Х 2 , … , Х n – большое число независимых случайных величин с математическими ожиданиями М(Х 1 )=а 1 , … , М(Х n )=а n . Хотя каждая из них в результате эксперимента может принять значение, далекое от своего среднего (т.е. математического ожидания), однако, случайная величина
, равная их среднему арифметическому, с большой вероятностью примет значение, близкое к фиксированному числу
(это среднее всех математических ожиданий). Это означает следующее. Пусть в результате испытания независимые случайные величиныХ 1 , Х 2 , … , Х n (их много!) приняли значения соответственно х 1 , х 2 , … , х n соответственно. Тогда если сами эти значения могут оказаться далекими от средних значений соответствующих случайных величин, их среднее значение
с большой вероятностью окажется близким к числу
. Таким образом, среднее арифметическое большого числа случайных величин уже теряет случайный характер и может быть предсказано с большой точностью. Это можно объяснить тем, что случайные отклонения значенийХ i от a i могут быть разных знаков, а потому в в сумме эти отклонения с большой вероятностью компенсируются.

Терема Чебышева (закон больших чисел в форме Чебышева). Пусть Х 1 , Х 2 , … , Х n – последовательность попарно независимых случайных величин, дисперсии которых ограничены одним и тем же числом. Тогда, какое бы малое число ε мы ни взяли, вероятность неравенства

будет как угодно близка к единице, если число n случайных величин взять достаточно большим. Формально это означает, что в условиях теоремы

Такой вид сходимости называется сходимостью по вероятности и обозначается:

Таким образом, теорема Чебышева говорит о том, что если есть достаточно большое число независимых случайных величин, то их среднее арифметическое при единичным испытании практически достоверно примет значение, близкое к среднему их математических ожиданий.

Чаще всего теорема Чебышева применяется в ситуации, когда случайные величины Х 1 , Х 2 , … , Х n имеют одинаковое распределение (т.е. один и тот же закон распределения или одну и ту же плотность вероятности). Фактически это просто большое число экземпляров одной и той же случайной величины.

Следствие (обобщенного неравенства Чебышева). Если независимые случайные величины Х 1 , Х 2 , … , Х n имеют одинаковое распределение с математическими ожиданиями M (X i )= a и дисперсиями D (X i )= D , то

, т.е.
.

Доказательство следует из обобщенного неравенства Чебышева переходом к пределу при n →∞ .

Отметим еще раз, что выписанные выше равенства не гарантируют, что значение величины
стремится ка при n →∞. Эта величина по-прежнему остается случайной величиной, а ее отдельные значения могут быть достаточно далекими от а . Но вероятность таких (далеких от а ) значений с ростом n стремится к 0.

Замечание . Заключение следствия, очевидно, справедливо и в более общем случае, когда независимые случайные величины Х 1 , Х 2 , … , Х n имеют различное распределение, но одинаковые математические ожидания (равные а ) и ограниченные в совокупности дисперсии. Это позволяет предсказывать точность измерения некоторой величины, даже если эти измерения выполнены разными приборами.

Рассмотрим подробнее применение этого следствия при измерении величин. Проведем некоторым прибором n измерений одной и той же величины, истинное значение которой равно а и нам неизвестно. Результаты таких измерений х 1 , х 2 , … , х n могут значительно отличаться друг от друга (и от истинного значения а ) в силу различных случайных факторов (перепады давления, температуры, случайная вибрация и т.д.). Рассмотрим с.в. Х – показание прибора при единичном измерении величины, а также набор с.в. Х 1 , Х 2 , … , Х n – показание прибора при первом, втором, …, последнем измерении. Таким образом, каждая из величин Х 1 , Х 2 , … , Х n есть просто один из экземпляров с.в. Х , а потому все они имеют то же самое распределение, что и с.в. Х . Поскольку результаты измерений не зависят друг от друга, то с.в. Х 1 , Х 2 , … , Х n можно считать независимыми. Если прибор не дает систематической ошибки (например, не «сбит» ноль на шкале, не растянута пружина и т.п.), то можно считать, что математическое ожидание М(Х) = а , а потому и М(Х 1 ) = ... = М(Х n ) = а . Таким образом, выполняются условия приведенного выше следствия, а потому в качестве приближенного значения величины а можно взять «реализацию» случайной величины
в нашем эксперименте (заключающемся в проведении серии изn измерений), т.е.

.

При большом числе измерений практически достоверна хорошая точность вычисления по этой формуле. Это является обоснованием того практического принципа, что при большом числе измерений их среднее арифметическое практически почти не отличается от истинного значения измеряемой величины.

На законе больших чисел основан широко применяемый в математической статистике «выборочный» метод, который позволяет по сравнительно небольшой выборке значений случайной величины получать ее объективные характеристики с приемлемой точностью. Но об этом будет рассказано в следующем разделе.

Пример . На измерительном приборе, не делающем систематических искажений, измерена некоторая величина а один раз (получено значение х 1 ), а потом еще 99 раз (получены значения х 2 , … , х 100 ). За истинное значение измерения а сначала взят результат первого измерения
, а затем среднее арифметическое всех измерений
. Точность измерения прибора такова, что среднее квадратическое отклонение измерения σ не более 1 (потому дисперсияD 2 тоже не превосходит 1). Для каждого из способов измерения оценить вероятность, что ошибка измерения не превзойдет 2.

Решение. Пусть с.в. Х – показание прибора при единичном измерении. Тогда по условию М(Х)=а . Для ответа на поставленные вопросы применим обобщенное неравенство Чебышева

при ε=2 сначала для n =1 , а затем для n =100 . В первом случае получим
, а во втором. Таким образом, второй случай практически гарантирует задаваемую точность измерения, тогда как первый оставляет в этом смысле большие сомнения.

Применим приведенные выше утверждения к случайным величинам, возникающим в схеме Бернулли. Напомним суть этой схемы. Пусть производится n независимых испытаний, в каждом из которых некоторое событие А может появиться с одной и той же вероятностью р , а q =1–р (по смыслу это вероятность противоположного события – не появления события А ) . Проведем некоторое число n таких испытаний. Рассмотрим случайные величины: Х 1 – число появлений события А в 1 -ом испытании, …, Х n – число появлений события А в n -ом испытании. Все введенные с.в. могут принимать значения 0 или 1 (событие А в испытании может появиться или нет), причем значение 1 по условию принимается в каждом испытании с вероятностью p (вероятность появления события А в каждом испытании), а значение 0 с вероятностью q = 1 p . Поэтому эти величины имеют одинаковые законы распределения:

Х 1

Х n

Поэтому средние значения этих величин и их дисперсии тоже одинаковы: М(Х 1 )=0 q +1 р= р, …, М(Х n )= р ; D (X 1 )=(0 2 q +1 2 p )− p 2 = p ∙(1− p )= p q, … , D (X n )= p q . Подставляя эти значения в обобщенное неравенство Чебышева, получим

.

Ясно, что с.в. Х =Х 1 +…+Х n – это число появлений события А во всех n испытаниях (как говорят – «число успехов» в n испытаниях). Пусть в проведенных n испытаниях событие А появилось в k из них. Тогда предыдущее неравенство может быть записано в виде

.

Но величина
, равная отношению числа появлений событияА в n независимых испытаниях, к общему числу испытаний, ранее была названа относительной частотой события А в n испытаниях. Поэтому имеет место неравенство

.

Переходя теперь к пределу при n →∞, получим
, т.е.
(по вероятности). Это составляет содержание закона больших чисел в форме Бернулли. Из него следует, что при достаточно большом числе испытанийn сколь угодно малые отклонения относительной частоты
события от его вероятностир − почти достоверные события, а большие отклонения − почти невозможные. Полученный вывод о такой устойчивости относительных частот (о которой мы ранее говорили как об экспериментальном факте) оправдывает введенное ранее статистическое определение вероятности события как числа, около которого колеблется относительная частота события.

Учитывая, что выражение p q = p ∙(1− p )= p p 2 не превосходит на интервале изменения
(в этом легко убедиться, найдя минимум этой функции на этом отрезке), из приведенного выше неравенства
легко получить, что

,

которое применяется при решении соответствующих задач (одна из них будет приведена ниже).

Пример . Монету подбросили 1000 раз. Оценить вероятность того, что отклонение относительной частоты появления герба от его вероятности будет меньше 0.1.

Решение. Применяя неравенство
приp = q =1/2 , n =1000 , ε=0.1 , получим .

Пример . Оценить вероятность того, что в условиях предыдущего примера число k выпавших гербов окажется в пределах от 400 до 600 .

Решение. Условие 400< k <600 означает, что 400/1000< k / n <600/1000 , т.е. 0.4< W n (A )<0.6 или
. Как мы только что убедились из предыдущего примера, вероятность такого события не менее0.975 .

Пример . Для вычисления вероятности некоторого события А проведено 1000 экспериментов, в которых событие А появилось 300 раз. Оценить вероятность того, что относительная частота (равная 300/1000=0.3) отстоит от истиной вероятности р не далее, чем на 0.1 .

Решение. Применяя выписанное выше неравенство
дляn=1000, ε=0.1 , получим .

Обнаруженный на большом и разнообразном материале феномен стабилизации частот появления случайных событий поначалу не имел какого-либо обоснования и воспринимался как чисто эмпирический факт. Первым теоретическим результатом в этой области стала опубликованная в 1713 г. знаменитая теорема Бернулли, положившая начало законам больших чисел.

Теорема Бернулли по своему содержанию является предельной теоремой, т. е. утверждением асимптотического смысла, говорящим, что будет с вероятностными параметрами при большом числе наблюдений. Прародительницей всех современных многочисленных утверждений такого типа является именно теорема Бернулли.

На сегодня представляется, что математический закон больших чисел является отражением некоторого общего свойства многих реальных процессов.

Имея желание придать закону больших чисел возможно больший охват, отвечающий далеко еще не исчерпанным потенциальным возможностям применения этого закона, один из крупнейших математиков нашего столетия А. Н. Колмогоров следующим образом сформулировал его суть: закон больших чисел - «общий принцип, в силу которого совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая».

Таким образом, закон больших чисел имеет как бы две трактовки. Одна - математическая, связанная с конкретными математическими моделями, формулировками, теориями, и вторая - более общая, выходящая за эти рамки. Вторая трактовка связана с нередко отмечаемым на практике феноменом образования в той или иной степени направленного действия на фоне большого числа скрытых либо видимых действующих факторов, внешне такой непрерывности не имеющих. Примерами, связанными со второй трактовкой, является ценообразование на свободном рынке, формирование общественного мнения по тому или иному вопросу.

Отметив эту общую трактовку закона больших чисел, обратимся к конкретным математическим формулировкам этого закона.

Как мы уже сказали выше, первой и принципиально самой важной для теории вероятностей является теорема Бернулли. Содержание этого математического факта, отражающего одну из важнейших закономерностей окружающего мира, сводится к следующему.

Рассмотрим последовательность не связанных между собой (т. е. независимых) испытаний, условия проведения которых воспроизводятся неизменно от испытания к испытанию. Результатом каждого испытания является появление или непоявление интересующего нас события А.

Эту процедуру (схему Бернулли), очевидно, можно признать типичной для многих практических областей: «мальчик - девочка» в последовательности новорожденных, ежедневные метеорологические наблюдения («был дождь - не был»), контроль потока выпускаемых изделий («нормальное - дефектное») и т. д.

Частость появления события А при п испытаниях (т А -

частота появления события А в п испытаниях) имеет с ростом п тенденцию к стабилизации своего значения, это эмпирический факт.

Теорема Бернулли. Выберем любое сколь угодно малое положительное число е. Тогда

Подчеркнем, что математический факт, установленный Бернулли в определенной математической модели (в схеме Бернулли), не следует смешивать с эмпирически установленной закономерностью устойчивости частот. Бернулли не удовольствовался только утверждением формулы (9.1), но, учитывая потребности практики, дал оценку присутствующего в этой формуле неравенства. К такой трактовке мы еще обратимся ниже.

Закон больших чисел Бернулли был предметом исследований большого числа математиков, стремившихся уточнить его. Одно из таких уточнений было получено английским математиком Муавром и в настоящее время носит название теоремы Муавра - Лапласа. В схеме Бернулли рассмотрим последовательность нормированных величин:

Интегральная теорема Муавра - Лапласа. Выберем какие-либо два числа х { и х 2 . При этом х, х 7 , тогда при п -» °°

Если в правой части формулы (9.3) переменную х х устремить к бесконечности, то полученный предел, зависящий только от х 2 (индекс 2 при этом можно убрать), будет представлять собой функцию распределения, она называется стандартным нормальным распределением, или законом Гаусса.

Правая часть формулы (9.3) равна у = F(x 2) - F(x x). F(x 2) -> 1 при х 2 -> °° и F(x ,) -> 0 при х, -> За счет выбора достаточно большого

X] > 0 и достаточно большого по абсолютной величине X] п получим неравенство:

Принимая во внимание формулу (9.2), мы можем извлечь практически достоверные оценки:

Если достоверность у = 0,95 (т. е. вероятность ошибки 0,05) может показаться кому-то недостаточной, можно «перестраховаться» и построить немного более широкий доверительный интервал, используя упоминавшееся выше правило трех сигм:

Этому интервалу соответствует очень высокий уровень доверия у = 0,997 (см. таблицы нормального распределения).

Рассмотрим пример, состоящий в бросании монеты. Пусть мы бросили монету п = 100 раз. Может ли случиться, что частость р будет сильно отличаться от вероятности р = 0,5 (в предположении симметричности монеты), например будет равна нулю? Для этого надо, чтобы герб не выпал ни разу. Такое событие теоретически возможно, однако мы уже рассчитывали подобные вероятности, для данного события она окажется равной Эта величина

чрезвычайно мала, ее порядок - число с 30 нулями после запятой. Событие с такой вероятностью смело можно считать практически невозможным. Какие же отклонения частоты от вероятности при большом числе опытов практически возможны? Используя теорему Муавра - Лапласа, мы отвечаем на этот вопрос так: с вероятностью у = 0,95 частость герба р укладывается в доверительный интервал:

Если ошибка в 0,05 кажется не малой, надо увеличить число опытов (бросаний монеты). При увеличении п ширина доверительного интервала уменьшается (к сожалению, не так быстро, как нам хотелось бы, а обратно пропорционально -Jn). Например, при п = 10 000 получим, что р лежит в доверительном интервале с доверительной вероятностью у = 0,95: 0,5 ±0,01.

Таким образом, мы разобрались количественно в вопросе о приближении частости к вероятности.

Теперь найдем вероятность события по его частости и оценим ошибку этого приближения.

Пусть мы произвели большое число опытов п (бросали монету), нашли частость события А и хотим оценить его вероятность р.

Из закона больших чисел п следует, что:

Теперь оценим практически возможную ошибку приближенного равенства (9.7). Для этого воспользуемся неравенством (9.5) в форме:

Для нахождения р по р надо решить неравенство (9.8), для этого его надо возвести в квадрат и решить соответствующее квадратное уравнение. В результате получим:

где

Для приближенной оценки р по р можно в формуле (9.8) р справа заменить нар или же в формулах (9.10), (9.11) считать, что

Тогда получим:

Пусть в п = 400 опытах получено значение частости р = 0,25, тогда при уровне доверия у = 0,95 найдем:

А если нам нужно знать вероятность точнее, с ошибкой, скажем, не больше 0,01? Для этого надо увеличить число опытов.

Полагая в формуле (9.12) вероятность р = 0,25, приравняем величину ошибки заданной величине 0,01 и получим уравнение относительно п:

Решая это уравнение, получим п ~ 7500.

Рассмотрим теперь еще один вопрос: можно объяснить полученное в опытах отклонение частости от вероятности случайными причинами или же это отклонение показывает, что вероятность не такова, какой мы ее предполагали? Иными словами, подтверждает опыт принятую статистическую гипотезу или, наоборот, требует ее отклонить?

Пусть, например, бросив монету п = 800 раз, мы получим частость появления герба р = 0,52. У нас возникло подозрение, что монета несимметричная. Обоснованно ли такое подозрение? Чтобы ответить на этот вопрос, будем исходить из предположения, что монета симметричная (р = 0,5). Найдем доверительный интервал (при доверительной вероятности у = 0,95) для частости появления герба. Если полученное в опыте значение р = 0,52 укладывается в этот интервал - все в норме, принятая гипотеза о симметрии монеты не противоречит опытным данным. Формула (9.12) при р = 0,5 дает интервал 0,5 ± 0,035; полученное значение р = 0,52 укладывается в этот интервал, значит, придется «очистить» монету от подозрений в несимметрии.

Аналогичными методами пользуются для того, чтобы судить: случайны или «значимы» различные отклонения от математического ожидания, наблюдаемые в случайных явлениях. Например, случайно был получен недовес в нескольких образцах расфасованных товаров или он указывает на систематический обман покупателей? Случайно повысился процент выздоровлений у больных, применявших новый препарат, или это связано с действием препарата?

Нормальный закон играет особенно важную роль в теории вероятностей и ее практических приложениях. Выше мы уже видели, что случайная величина - число появлений некоторого события в схеме Бернулли - при п -» °° сводится к нормальному закону. Однако имеет место гораздо более общий результат.

Центральная предельная теорема. Сумма большого числа независимых (или слабо зависимых) случайных величин, сравнимых между собой по порядку своих дисперсий, распределена по нормальному закону независимо от того, каковы были законы распределения слагаемых. Приведенное утверждение - это грубая качественная формулировка центральной предельной теории. У этой теоремы много форм, различающихся между собой условиями, которым должны удовлетворять случайные величины, чтобы их сумма с увеличением числа слагаемых «нормализовалась».

Плотность нормального распределения Дх) выражается формулой:

где а - математическое ожидание случайной величины Х с = V7) - ее стандартное отклонение.

Для вычисления вероятности попадания х в пределы интервала (х 1? х 2) используется интеграл:

Так как интеграл (9.14) при плотности (9.13) не выражается через элементарные функции («не берется»), то для вычисления (9.14) пользуются таблицами интегральной функции распределения стандартного нормального распределения, когда а = 0, а = 1 (такие таблицы имеются в любом учебнике по теории вероятностей):

Вероятность (9.14) с помощью уравнения (10.15) выражается формулой:

Пример. Найти вероятность того, что случайная величина X, имеющая нормальное распределение с параметрами а , а, отклонится от своего математического ожидания по модулю не более чем на За.

Пользуясь формулой (9.16) и таблицей функции распределения нормального закона, получим:

Пример. В каждом из 700 независимых опытов событие А происходит с постоянной вероятностью р = 0,35. Найти вероятность того, что событие А произойдет:

  • 1) точно 270 раз;
  • 2) меньше чем 270 и больше чем 230 раз;
  • 3) больше чем 270 раз.

Находим математическое ожидание а = пр и стандартное отклонение:

случайной величины - числа появлений события А:

Находим центрированное и нормированное значение X:

По таблицам плотности нормального распределения находим f(x):

Найдем теперь Р ш (х, > 270) = Р 700 (270 F(1,98) = = 1 - 0,97615 = 0,02385.

Серьезный шаг в исследованиях проблематики больших чисел был сделан в 1867 г. П. Л. Чебышевым. Он рассмотрел весьма общий случай, когда от независимых случайных величин не требуется ничего, кроме существования математических ожиданий и дисперсий.

Неравенство Чебышева. Для сколь угодно малого положительного числа е выполняется неравенство:

Теорема Чебышева. Если х х, х 2 , ..., х п - попарно независимые случайные величины, каждая из которых имеет математическое ожидание E(Xj) = ci и дисперсию D(x,) =), причем дисперсии равномерно ограничены, т. е. 1,2 ..., то для сколь угодного малого положительного числа е выполняется соотношение:

Следствие. Если а,= аио, -о 2 , i = 1,2 ..., то

Задача. Сколько раз надо бросить монету, чтобы с вероятностью не меньшей, чем у - 0,997, можно было утверждать, что частость выпадения герба будет находиться в интервале (0,499; 0,501)?

Предположим, что монета симметричная, р - q - 0,5. Применим теорему Чебышева в формуле (9.19) к случайной величине X - частоте появления герба в п бросаниях монеты. Выше мы уже показывали, что X = Х х + Х 2 + ... +Х„, где X t - случайная величина, принимающая значение 1, если выпал герб, и значение 0, если выпала решка. Итак:

Запишем неравенство (9.19) для события, противоположного событию, указанному под знаком вероятности:

В нашем случае [е = 0,001, cj 2 = /?-р)]т - число выпадений герба в п бросаниях. Подставляя эти величины в последнее неравенство и учитывая, что по условию задачи должно выполняться неравенство, получим:

Приведенный пример иллюстрирует возможность использования неравенства Чебышева для оценок вероятностей тех или иных уклонений случайных величин (а также связанных с вычислением этих вероятностей задач типа этого примера). Достоинством неравенства Чебышева является то, что оно не требует знания законов распределений случайных величин. Разумеется, если такой закон известен, то неравенство Чебышева дает слишком грубые оценки.

Рассмотрим этот же пример, но используя тот факт, что бросание монеты является частным случаем схемы Бернулли. Число успехов (в примере - число гербов) подчиняется биномиальному закону, а при большом п этот закон можно в силу интегральной теоремы Муавра - Лапласа представить нормальным законом с математическим ожиданием а = пр = п? 0,5 и со стандартным отклонением а = yfnpq - 25=0,5л/л. Случайная же величина - частость выпадения герба - имеет математическое ожидание = 0,5 и стандартное отклонение

Тогда имеем:

Из последнего неравенства получаем:

Из таблиц нормального распределения находим:

Видим, что нормальное приближение дает число бросаний монеты, обеспечивающее заданную погрешность в оценивании вероятности герба, в 37 раз меньшее в сравнении с оценкой, полученной с использованием неравенства Чебышева (но неравенство Чебышева дает возможность подобных расчетов и в том случае, когда мы не владеем информацией о законе распределения изучаемой случайной величины).

Рассмотрим теперь прикладную задачу, решаемую с помощью формулы (9.16).

Задача о конкуренции. Две конкурирующие железнодорожные компании имеют по одному поезду, курсирующему между Москвой и Санкт-Петербургом. Эти поезда оборудованы примерно одинаково, отправляются и прибывают также примерно в одно и то же время. Предположим, что п = 1000 пассажиров независимо и наугад выбирают себе поезд, поэтому в качестве математической модели выбора поезда пассажирами используем схему Бернулли с п испытаниями и вероятностью успехар = 0,5. Компания должна решить вопрос, сколько мест предусмотреть в поезде с учетом двух взаимно противоречивых условий: с одной стороны, не хочется иметь пустые места, с другой - не хочется, чтобы появились недовольные отсутствием мест (в следующий раз они предпочтут конкурирующие фирмы). Разумеется, можно предусмотреть в поезде п = 1000 мест, но тогда заведомо будут пустые места. Случайная величина - число пассажиров в поезде - в рамках принятой математической модели с использованием интегральной теории Муавра - Лапласа подчиняется нормальному закону с математическим ожиданием а = пр = п /2 и дисперсией а 2 = npq = п/4 последовательно. Вероятность того, что на поезд придет более s пассажиров, определяется соотношением:

Зададим уровень риска а , т. е. вероятность того, что придет более s пассажиров:

Отсюда:

Если а - корень риска последнего уравнения, который находится по таблицам функции распределения нормального закона, то получаем:

Если, например, п = 1000, а = 0,01 (такой уровень риска означает, что число мест s будет достаточным в 99 случаях из 100), то х а ~ 2,33 и s = 537 мест. При этом если обе компании примут одинаковые уровни риска а = 0,01, то два поезда будут иметь в общей сложности 1074 места, 74 из которых будут пустыми. Аналогично можно вычислить, что 514 мест было бы достаточно в 80% всех случаев, а 549 мест - в 999 из 1000 случаев.

Подобные соображения применимы и в других задачах о конкурирующем обслуживании. Например, если т кинотеатров соперничают из-за одних и тех же п зрителей, то следует принять р = -. Получим,

что число мест s в кинотеатре должно определяться соотношением:

Общее число пустых мест при этом равно:

Для а = 0,01, п = 1000 и т = 2, 3, 4 значения этого числа приближенно равны соответственно 74, 126, 147.

Рассмотрим еще один пример. Пусть поезд состоит из п - 100 вагонов. Вес каждого вагона - случайная величина с математическим ожиданием а - 65 т и средним квадратическим ожиданием о = 9 т. Локомотив может везти поезд, если его вес не превышает 6600 т; в противном случае приходится подцеплять второй локомотив. Нужно найти вероятность того, что этого делать не придется.

весов отдельных вагонов: , имеющих одно и то же математическое ожидание а - 65 и одну и ту же дисперсию d - о 2 = 81. По правилу математических ожиданий: Е(х) - 100 * 65 = 6500. По правилу сложения дисперсий: D(x ) = 100 х 81= 8100. Извлекая корень, найдем среднее квадратическое отклонение. Для того чтобы один локомотив мог везти поезд, нужно, чтобы вес поезда X оказался предельным, т. е. попал в пределы интервала (0; 6600). Случайную величину х - сумму 100 слагаемых - можно считать распределенной нормально. По формуле (9.16) получим:

Отсюда следует, что локомотив «справится» с поездом приблизительно с вероятностью 0,864. Уменьшим теперь число вагонов в поезде на два, т. е. возьмем п = 98. Подсчитывая теперь вероятность того, что локомотив «справится» с поездом, получим величину порядка 0,99, т. е. практически достоверное событие, хотя для этого пришлось убрать всего два вагона.

Итак, если мы имеем дело с суммами большого числа случайных величин, то можно использовать нормальный закон. Естественно, при этом возникает вопрос: сколько нужно сложить случайных величин, чтобы закон распределения суммы уже «нормализовался»? Это зависит от того, каковы законы распределения слагаемых. Бывают такие замысловатые законы, что нормализация наступает только при очень большом числе слагаемых. Но эти законы придумывают математики, природа же, как правило, специально не устраивает таких неприятностей. Обычно на практике для того, чтобы можно было пользоваться нормальным законом, бывает достаточно пяти-шести слагаемых.

Быстроту, с которой «нормализуется» закон распределения суммы одинаково распределенных случайных величин, можно проиллюстрировать на примере случайных величин с равномерным распределением на интервале (0, 1). Кривая такого распределения имеет вид прямоугольника, что уже непохоже на нормальный закон. Сложим две такие независимые величины - получим случайную величину, распределенную по так называемому закону Симпсона, графическое изображение которого имеет вид равнобедренного треугольника. Тоже не похоже на нормальный закон, но уже лучше. А если сложить три такие равномерно распределенные случайные величины, получится кривая, состоящая из трех отрезков парабол, весьма похожая на нормальную кривую. Если же сложить шесть таких случайных величин, получится кривая, не отличающаяся от нормальной. На этом основан широко применяемый метод получения нормально распределенной случайной величины, датчиками же равномерно распределенных (0, 1) случайных чисел оснащены все современные ЭВМ.

В качестве одного из практических способов проверки этого рекомендуется следующий способ. Строим доверительный интервал для частоты события с уровнем у = 0,997 по правилу трех сигм:

и если оба его конца не выходят за рамки отрезка (0, 1), то можно пользоваться нормальным законом. Если же какая-нибудь из границ доверительного интервала оказывается за переделами отрезка (0, 1), то нормальным законом пользоваться нельзя. Однако в некоторых условиях биномиальный закон для частоты некоторого случайного события, если он не стремится к нормальному, то может стремиться к другому закону.

Во многих приложениях в качестве математической модели случайного опыта используется схема Бернулли, в которой число испытаний п велико, случайное событие довольно редко, т. е. р = пр не мало, но и не велико (колеблется в интервале О -5- 20). В этом случае имеет место предельное соотношение:

Формула (9.20) называется пуассоновским приближением для биномиального закона, так как вероятностное распределение в ее правой части называется законом Пуассона. Говорят, что пуассоновское распределение является вероятностным распределением для редких событий, так как оно имеет место, когда выполняются пределы: п -»°°, р -»0, но X = пр оо.

Пример. Дни рождения. Какова вероятность Р т (к) того, что в обществе из 500 человек к человек родились в день Нового года? Если эти 500 человек выбраны наугад, то можно применить схему Бернулли с вероятностью успеха Р = 1/365. Тогда

Расчеты вероятностей для различных к дают следующие величины: Р у = 0,3484...; Р 2 = 0,2388...; Р 3 = 0,1089...; Р 4 = 0,0372...; Р 5 = 0,0101...; Р 6 = 0,0023... Соответствующие приближения по формуле Пуассона при X = 500 1/365 = 1,37

дают следующие величины: Ру = 0,3481...; Р 2 = 0,2385...; Р ъ = 0,1089; Р 4 = 0,0373...; Р 5 = 0,0102...; Р 6 = 0,0023... Все ошибки лишь в четвертом десятичном знаке.

Приведем примеры ситуаций, где можно использовать закон редких событий Пуассона.

На телефонной станции неправильное соединение происходит с малой вероятностью р, обычно р ~ 0,005. Тогда формула Пуассона позволяет найти вероятность неправильных соединений при заданном общем числе соединений п ~ 1000, когда Х = пр =1000 0,005 = 5.

При выпечке булочек в тесто кладут изюм. Следует ожидать, что благодаря размешиванию частота булок с изюминками будет приблизительно подчиняться распределению Пуассона Р п (к, X), где X - плотность изюма в тесте.

Радиоактивное вещество испускает я-частицы. Событие, заключающееся в том, что число й-частиц, достигающих в течение времени t заданного участка пространства, принимает фиксированное значение к, подчиняется закону Пуассона.

Число живых клеток с измененными хромосомами под действием рентгеновских лучей следует распределению Пуассона.

Итак, законы больших чисел позволяют решать задачу математической статистики, связанную с оцениванием неизвестных вероятностей элементарных исходов случайного опыта. Благодаря этим знаниям мы делаем методы теории вероятностей практически содержательными и полезными. Законы больших чисел позволяют также решать задачу получения информации о неизвестных элементарных вероятностях и в другой форме - форме проверки статистических гипотез.

Рассмотрим более подробно формулировку и вероятностный механизм решения задач проверки статистических гипотез.

Зако́н больши́х чи́сел в теории вероятностей утверждает, что эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности , и усиленный закон больших чисел, когда имеет место сходимость почти всюду .

Всегда найдётся такое конечное число испытаний, при котором с любой заданной наперёд вероятностью меньше 1 относительная частота появления некоторого события будет сколь угодно мало отличаться от его вероятности.

Общий смысл закона больших чисел: совместное действие большого числа одинаковых и независимых случайных факторов приводит к результату, в пределе не зависящему от случая.

На этом свойстве основаны методы оценки вероятности на основе анализа конечной выборки. Наглядным примером является прогноз результатов выборов на основе опроса выборки избирателей.

Энциклопедичный YouTube

    1 / 5

    ✪ Закон больших чисел

    ✪ 07 - Теория вероятностей. Закон больших чисел

    ✪ 42 Закон больших чисел

    ✪ 1 - Закон больших чисел Чебышёва

    ✪ 11 класс, 25 урок, Гауссова кривая. Закон больших чисел

    Субтитры

    Давайте разберем закон больших чисел, который является, пожалуй, самым интуитивным законом в математике и теории вероятностей. И поскольку он применим ко многим вещам, его иногда используют и понимают неправильно. Давайте я вначале для точности дам ему определение, а потом уже мы поговорим об интуиции. Возьмем случайную величину, например Х. Допустим, мы знаем ее математическое ожидание или среднее для совокупности. Закон больших чисел просто говорит, что, если мы возьмем пример n-ого количества наблюдений случайной величины и выведем среднее число всех этих наблюдений… Давайте возьмем переменную. Назовем ее Х с нижним индексом n и с чертой наверху. Это среднее арифметическое n-ого количества наблюдений нашей случайной величины. Вот мое первое наблюдение. Я провожу эксперимент один раз и делаю это наблюдение, затем я провожу его еще раз и делаю вот это наблюдение, я провожу его снова и получаю вот это. Я провожу этот эксперимент n-ое количество раз, а затем делю на количество моих наблюдений. Вот мое выборочное среднее значение. Вот среднее значение всех наблюдений, которые я сделала. Закон больших чисел говорит нам, что мое выборочное среднее будет приближаться к математическому ожиданию случайной величины. Либо я могу также написать, что мое выборочное среднее будет приближаться к среднему по совокупности для n-ого количества, стремящегося к бесконечности. Я не буду четко разделять понятия «приближение» и «сходимость», но надеюсь, вы интуитивно понимаете, что, если я возьму довольно большую выборку здесь, то я получу математическое ожидание для совокупности в целом. Думаю, большинство из вас интуитивно понимает, что, если я сделаю достаточное количество испытаний с большой выборкой примеров, в конце концов, испытания дадут мне ожидаемые мною значения, принимая во внимание математическое ожидание, вероятность и все такое прочее. Но, я думаю, часто бывает непонятно, почему так происходит. И прежде, чем я начну объяснять, почему это так, давайте я приведу конкретный пример. Закон больших чисел говорит нам, что... Допустим, у нас есть случайная величина Х. Она равна количеству орлов при 100 подбрасываниях правильной монеты. Прежде всего, мы знаем математическое ожидание этой случайной величины. Это количество подбрасываний монеты или испытаний, умноженное на шансы успеха любого испытания. Значит, это равно 50-ти. То есть, закон больших чисел говорит, что, если мы возьмем выборку, или если я приведу к среднему значению эти испытания, я получу... В первый раз, когда я провожу испытание, я подбрасываю монету 100 раз или возьму ящик с сотней монет, тряхну его, а потом сосчитаю, сколько у меня выпадет орлов, и получу, допустим, число 55. Это будет Х1. Затем я снова встряхну ящик и получу число 65. Затем еще раз – и получу 45. И я проделываю это n-ое количество раз, а затем делю это на количество испытаний. Закон больших чисел говорит нам, что это среднее (среднее значение всех моих наблюдений) будет стремиться к 50-ти в то время, как n будет стремиться к бесконечности. Теперь я бы хотела немного поговорить о том, почему так происходит. Многие считают, что если после 100 испытаний, у меня результат выше среднего, то по законам вероятности у меня должно выпасть больше или меньше орлов для того, чтобы, так сказать, компенсировать разницу. Это не совсем то, что произойдет. Это часто называют «заблуждением азартного игрока». Давайте я покажу различие. Я буду использовать следующий пример. Давайте я изображу график. Поменяем цвет. Это n, моя ось Х – это n. Это количество испытаний, которые я проведу. А моя ось Y будет выборочным средним. Мы знаем, что математическое ожидание этой произвольной переменной равно 50-ти. Давайте я это нарисую. Это 50. Вернемся к нашему примеру. Если n равно… Во время моего первого испытания я получила 55, это мое среднее значение. У меня только одна точка ввода данных. Затем, после двух испытаний, я получаю 65. Значит, мое среднее значение будет 65+55, деленное на 2. Это 60. И мое среднее значение немного возросло. Затем я получила 45, что вновь снизило мое среднее арифметическое. Я не буду наносить на графике 45. Теперь мне нужно привести все это к среднему значению. Чему равно 45+65? Давайте я вычислю это значение, чтобы обозначить точку. Это 165 делить на 3. Это 53. Нет, 55. Значит, среднее значение снова опускается до 55-ти. Мы можем продолжить эти испытания. После того, как мы проделали три испытания и получили это среднее, многие люди думают, что боги вероятности сделают так, что у нас выпадет меньше орлов в будущем, что в следующих нескольких испытаниях результаты будут ниже, чтобы уменьшить среднее значение. Но это не всегда так. В дальнейшем вероятность всегда остается такой же. Вероятность того, что у меня выпадет орел, всегда будет 50-ти %. Не то, что у меня изначально выпадает определенное количество орлов, большее, чем я ожидаю, а дальше внезапно должны выпасть решки. Это «заблуждение игрока». Если у вас выпадает несоразмерно большое количество орлов, это не значит, что в определенный момент у вас начнет выпадать несоразмерно большое количество решек. Это не совсем так. Закон больших чисел говорит нам, что это не имеет значения. Допустим, после определенного конечного количества испытаний, ваше среднее... Вероятность этого достаточно мала, но, тем не менее... Допустим, ваше среднее достигло этой отметки – 70-ти. Вы думаете: «Ого, мы основательно отошли от математического ожидания». Но закон больших чисел говорит, что ему все равно, сколько испытаний мы провели. У нас все равно осталось бесконечное количество испытаний впереди. Математическое ожидание этого бесконечного количества испытаний, особенно в подобной ситуации, будет следующим. Когда вы приходите к конечному числу, которое выражает какое-нибудь большое значение, бесконечное число, которое сойдется с ним, снова приведет к математическому ожиданию. Это, конечно, очень свободное толкование, но это то, что говорит нам закон больших чисел. Это важно. Он не говорит нам, что, если у нас выпало много орлов, то каким-то образом вероятность выпадения решки увеличится, чтобы это компенсировать. Этот закон говорит нам, что неважно, каков результат при конечном количестве испытаний, если у вас еще осталось бесконечное количество испытаний впереди. И если вы сделаете достаточное их количество, вы вернетесь снова к математическому ожиданию. Это важный момент. Подумайте о нем. Но это не используется ежедневно на практике с лотереями и в казино, хотя известно, что, если вы сделаете достаточное количество испытаний... Мы даже можем это посчитать... чему равна вероятность того, что мы серьезно отклонимся от нормы? Но казино и лотереи каждый день работают по тому принципу, что если взять достаточное количество людей, естественно, за короткий срок, с небольшой выборкой, то несколько человек сорвут куш. Но за большой срок казино всегда останется в выигрыше из-за параметров игр, в которые они приглашают вас играть. Это важный принцип вероятности, который является интуитивным. Хотя иногда, когда вам его формально объясняют со случайными величинами, все это выглядит немного запутанно. Все, что этот закон говорит, – это что чем больше выборок, тем больше среднее арифметическое этих выборок будет стремиться к истинному среднему. А если быть более конкретной, то среднее арифметическое вашей выборки сойдется с математическим ожиданием случайной величины. Вот и все. До встречи в следующем видео!

Слабый закон больших чисел

Слабый закон больших чисел также называется теоремой Бернулли , в честь Якоба Бернулли , доказавшего его в 1713 году .

Пусть есть бесконечная последовательность (последовательное перечисление) одинаково распределённых и некоррелированных случайных величин . То есть их ковариация c o v (X i , X j) = 0 , ∀ i ≠ j {\displaystyle \mathrm {cov} (X_{i},X_{j})=0,\;\forall i\not =j} . Пусть . Обозначим через выборочное среднее первых n {\displaystyle n} членов:

.

Тогда X ¯ n → P μ {\displaystyle {\bar {X}}_{n}\to ^{\!\!\!\!\!\!\mathbb {P} }\mu } .

То есть для всякого положительного ε {\displaystyle \varepsilon }

lim n → ∞ Pr (| X ¯ n − μ | < ε) = 1. {\displaystyle \lim _{n\to \infty }\Pr \!\left(\,|{\bar {X}}_{n}-\mu |<\varepsilon \,\right)=1.}

Усиленный закон больших чисел

Пусть есть бесконечная последовательность независимых одинаково распределённых случайных величин { X i } i = 1 ∞ {\displaystyle \{X_{i}\}_{i=1}^{\infty }} , определённых на одном вероятностном пространстве (Ω , F , P) {\displaystyle (\Omega ,{\mathcal {F}},\mathbb {P})} . Пусть E X i = μ , ∀ i ∈ N {\displaystyle \mathbb {E} X_{i}=\mu ,\;\forall i\in \mathbb {N} } . Обозначим через X ¯ n {\displaystyle {\bar {X}}_{n}} выборочное среднее первых n {\displaystyle n} членов:

X ¯ n = 1 n ∑ i = 1 n X i , n ∈ N {\displaystyle {\bar {X}}_{n}={\frac {1}{n}}\sum \limits _{i=1}^{n}X_{i},\;n\in \mathbb {N} } .

Тогда X ¯ n → μ {\displaystyle {\bar {X}}_{n}\to \mu } почти всегда.

Pr (lim n → ∞ X ¯ n = μ) = 1. {\displaystyle \Pr \!\left(\lim _{n\to \infty }{\bar {X}}_{n}=\mu \right)=1.} .

Как и любой математический закон, закон больших чисел может быть применим к реальному миру только при известных допущениях, которые могут выполняться лишь с некоторой степенью точности. Так, например, условия последовательных испытаний часто не могут сохраняться бесконечно долго и с абсолютной точностью . Кроме того, закон больших чисел говорит лишь о невероятности значительного отклонения среднего значения от математического ожидания .