Aplicarea practică a legii numerelor mari. Legea numerelor mari. Teoreme limită. Proprietățile funcției de distribuție

Practica studierii fenomenelor aleatorii arată că, deși rezultatele observațiilor individuale, chiar și cele efectuate în aceleași condiții, pot diferi foarte mult, în același timp, rezultatele medii pentru un număr suficient de mare de observații sunt stabile și depind slab de rezultatele observațiilor individuale.

Baza teoretică pentru această proprietate remarcabilă a fenomenelor aleatorii este legea numerelor mari. Numele „legea numerelor mari” combină un grup de teoreme care stabilesc stabilitatea rezultatelor medii ale unui număr mare de fenomene aleatoare și explică motivul acestei stabilități.

Cea mai simplă formă a legii numerelor mari și, din punct de vedere istoric, prima teoremă a acestei secțiuni este teorema lui Bernoulli, care afirmă că dacă probabilitatea unui eveniment este aceeași în toate încercările, atunci pe măsură ce numărul de încercări crește, frecvența evenimentului tinde spre probabilitatea evenimentului și încetează să fie aleatorie.

Teorema lui Poisson afirmă că frecvența unui eveniment într-o serie de încercări independente tinde spre media aritmetică a probabilităților sale și încetează să fie aleatorie.

Teoreme limită ale teoriei probabilităților, teoreme Moivre-Laplace explicați natura stabilității frecvenței de apariție a unui eveniment. Această natură constă în faptul că distribuția limitativă a numărului de apariții ale unui eveniment cu o creștere nelimitată a numărului de încercări (dacă probabilitatea evenimentului este aceeași în toate încercările) este distributie normala.

Teorema limită centrală explică răspândirea legea normală distribuţiile. Teorema afirmă că ori de câte ori se formează o variabilă aleatoare ca urmare a adunării unui număr mare de variabile aleatoare independente cu varianțe finite, legea de distribuție a acestei variabile aleatoare se dovedește a fi practic normal prin lege.

Teorema prezentată mai jos intitulată „ Legea numerelor mari” afirmă că în anumite condiții, destul de generale, cu creșterea numărului de variabile aleatoare, media aritmetică a acestora tinde spre media aritmetică a așteptărilor matematice și încetează să mai fie aleatoare.

Teorema lui Lyapunov explică răspândirea legea normală distribuția și explică mecanismul formării sale. Teorema ne permite să afirmăm că ori de câte ori se formează o variabilă aleatoare ca urmare a adunării unui număr mare de variabile aleatoare independente, ale căror variații sunt mici în comparație cu varianța sumei, legea de distribuție a acestei variabile aleatoare se transformă a fi practic normal prin lege. Și întrucât variabilele aleatoare sunt întotdeauna generate de un număr infinit de cauze și cel mai adesea niciuna dintre ele nu are o dispersie comparabilă cu dispersia variabilei aleatoare în sine, majoritatea variabilelor aleatoare întâlnite în practică sunt supuse legii distribuției normale.

Enunţurile calitative şi cantitative ale legii numerelor mari se bazează pe inegalitatea Cebyshev. Determină limita superioară a probabilității ca abaterea valorii unei variabile aleatoare de la așteptarea sa matematică să fie mai mare decât un anumit număr specificat. Este remarcabil că inegalitatea lui Cebyshev oferă o estimare a probabilității unui eveniment pentru o variabilă aleatoare a cărei distribuție este necunoscută, sunt cunoscute doar așteptarea și varianța sa matematică.

inegalitatea lui Cebyshev. Dacă o variabilă aleatoare x are varianță, atunci pentru orice e > 0 este valabilă următoarea inegalitate: , Unde M x și D x - așteptarea și varianța matematică a variabilei aleatoare x.

teorema lui Bernoulli. Fie m n numărul de succese în n încercări Bernoulli și p probabilitatea de succes într-o încercare individuală. Atunci pentru orice e > 0 este adevărat .

Teorema limitei centrale. Dacă variabilele aleatoare x 1 , x 2 , …, x n , … sunt independente pe perechi, distribuite identic și au varianță finită, atunci pentru n ® uniform în x (- ,)


Care este secretul vânzătorilor de succes? Dacă observați cei mai buni agenți de vânzări din orice companie, veți observa că aceștia au un lucru în comun. Fiecare dintre ei se întâlnește cu mai mulți oameni și face mai multe prezentări decât vânzătorii cu mai puțin succes. Acești oameni înțeleg că vânzările sunt un joc de cifre și cu cât spun mai mulți oameni despre produsele sau serviciile lor, cu atât vor încheia mai multe oferte - atât. Ei înțeleg că dacă vor comunica nu doar cu cei puțini care le vor spune cu siguranță da, ci și cu cei al căror interes pentru oferta lor nu este atât de mare, atunci legea mediilor va lucra în favoarea lor.


Venitul tău va depinde de numărul de vânzări, dar, în același timp, va fi direct proporțional cu numărul de prezentări pe care le faci. Odată ce înțelegi și exersezi legea mediilor, anxietatea asociată cu începerea unei noi afaceri sau munca într-un domeniu nou va începe să scadă. Ca rezultat, un sentiment de control și încredere în capacitatea ta de a câștiga bani va începe să crească. Dacă faci doar prezentări și îți perfecționezi abilitățile în acest proces, vor veni oferte.

În loc să vă gândiți la numărul de oferte, gândiți-vă mai bine la numărul de prezentări. Nu are rost să te trezești dimineața sau să te întorci seara acasă și să te întrebi cine îți va cumpăra produsul. În schimb, cel mai bine este să planificați câte apeluri trebuie să efectuați în fiecare zi. Și apoi, indiferent de ce - fă toate aceste apeluri! Această abordare vă va ușura munca – deoarece este un obiectiv simplu și specific. Dacă știți că aveți un obiectiv specific și realizabil, vă va fi mai ușor să efectuați numărul planificat de apeluri. Dacă auziți „da” de câteva ori în timpul acestui proces, cu atât mai bine!

Și dacă „nu”, atunci seara vei simți că ai făcut cu sinceritate tot ce ai putut și nu vei fi chinuit de gânduri la câți bani ai câștigat sau câți însoțitori ai dobândit într-o zi.

În compania sau afacerea dvs., să presupunem că agentul de vânzări obișnuit încheie o afacere la fiecare patru prezentări. Acum imaginați-vă că trageți cărți dintr-un pachet. Fiecare carte din cele trei costume - pică, diamante și crose - este o prezentare în care prezentați profesional un produs, serviciu sau oportunitate. O faci cât de bine poți, dar tot nu închei afacerea. Și fiecare card de inimă este o ofertă care vă permite să obțineți bani sau să obțineți un nou însoțitor.

Într-o astfel de situație, nu ai vrea să trageți cât mai multe cărți din pachet? Să presupunem că vi se oferă să trageți câte cărți doriți, în timp ce vă plătiți sau vă oferiți un nou însoțitor de fiecare dată când trageți o carte inimă. Veți începe să desenați cărți cu entuziasm, abia observând ce culoare este cartea pe care tocmai ați scos-o.

Știi că într-un pachet de cincizeci și două de cărți sunt treisprezece inimi. Și în două pachete sunt douăzeci și șase de cărți de inimă și așa mai departe. Vei fi dezamăgit când vei trage pică, diamante sau crose? Desigur că nu! Veți crede doar că fiecare astfel de „doare” vă aduce mai aproape de ce? La cardul inimii!

Dar tu stii ce? Ți s-a făcut deja o astfel de ofertă. Ești într-o poziție unică de a câștiga cât vrei și de a atrage câte inimi vrei să atragi în viața ta. Și dacă pur și simplu „trageți cărți” în mod conștiincios, vă îmbunătățiți abilitățile și îndurați puțin pică, diamante și crose, veți deveni un vânzător excelent și veți obține succesul.

Unul dintre lucrurile care fac vânzările atât de distractive este că de fiecare dată când amestecați pachetul, cărțile sunt amestecate diferit. Uneori, toate inimile ajung la începutul pachetului, iar după o serie norocoasă (când ni se pare că nu vom pierde niciodată!) ne așteaptă un lung șir de cărți de un alt costum. Și alteori, pentru a ajunge la prima inimă, trebuie să treci printr-un număr nesfârșit de pică, crose și diamante. Și uneori cărți de culori diferite apar strict în ordine. Dar, în orice caz, în fiecare pachet de cincizeci și două de cărți, într-o anumită ordine, există întotdeauna treisprezece inimi. Doar scoateți cărțile până le găsiți.



De la: Leylya,  

Cuvintele despre numere mari se referă la numărul de teste - se ia în considerare un număr mare de valori ale unei variabile aleatoare sau efectul cumulativ al unui număr mare de variabile aleatoare. Esența acestei legi este următoarea: deși este imposibil de prezis ce valoare va lua o variabilă aleatoare individuală într-un singur experiment, totuși, rezultatul total al acțiunii unui număr mare de variabile aleatoare independente își pierde natura aleatoare și poate să fie prezis aproape în mod fiabil (adică cu mare probabilitate). De exemplu, este imposibil de prezis în ce direcție va ateriza o monedă. Totuși, dacă arunci 2 tone de monede, atunci cu mare încredere putem spune că greutatea monedelor care au căzut cu stema în sus este egală cu 1 tonă.

Legea numerelor mari se referă în primul rând la așa-numita inegalitate Chebyshev, care estimează într-un singur test probabilitatea ca o variabilă aleatorie să accepte o valoare care se abate de la valoarea medie cu cel mult o valoare dată.

inegalitatea lui Cebyshev. Lăsa X– variabilă aleatoare arbitrară, a=M(X) , A D(X) – variația sa. Apoi

Exemplu. Valoarea nominală (adică necesară) a diametrului manșonului întors pe mașină este egală cu 5 mm, iar dispersia nu mai este 0.01 (aceasta este toleranța de precizie a mașinii). Estimați probabilitatea ca, în timpul fabricării unei bucșe, abaterea diametrului său față de cel nominal să fie mai mică decât 0,5 mm .

Soluţie. Lasă r.v. X– diametrul bucsei fabricate. În funcție de condiție, așteptarea sa matematică este egală cu diametrul nominal (dacă nu există o defecțiune sistematică în setările mașinii): a=M(X)=5 , și dispersia D(X)≤0,01. Aplicând inegalitatea lui Cebyshev la ε = 0,5, primim:

Astfel, probabilitatea unei astfel de abateri este destul de mare și, prin urmare, putem concluziona că într-o singură producție a unei piese, este aproape sigur că abaterea diametrului față de cel nominal nu va depăși 0,5 mm .

În sensul său, abaterea standard σ caracterizează in medie abaterea unei variabile aleatoare de la centrul ei (adică de la așteptarea ei matematică). Pentru că asta in medie abatere, apoi în timpul testării sunt posibile abateri mari (accent pe o). Cât de mari abateri sunt practic posibile? Când studiem variabile aleatoare distribuite normal, am derivat regula „trei sigma”: o variabilă aleatoare distribuită normal X într-un singur test practic nu se abate de la media sa mai mult decât , Unde σ= σ(X)– abaterea standard a r.v. X. Am derivat această regulă din faptul că am obținut inegalitatea

.

Să estimăm acum probabilitatea pentru arbitrar variabilă aleatorie X acceptați o valoare care diferă de medie cu cel mult triplu abaterea standard. Aplicând inegalitatea lui Cebyshev la ε = și având în vedere că D(Х)= σ 2 , primim:

.

Prin urmare, în general putem estima probabilitatea ca o variabilă aleatorie să se abate de la medie cu cel mult trei abateri standard cu numărul 0.89 , în timp ce pentru o distribuție normală acest lucru poate fi garantat cu probabilitate 0.997 .

Inegalitatea lui Chebyshev poate fi generalizată la un sistem de variabile aleatoare independente distribuite identic.

Inegalitatea generalizată de la Cebyshev. Dacă variabile aleatoare independente X 1 , X 2 , … , X n M(X i )= Ași variații D(X i )= D, Acea

La n=1 această inegalitate se transformă în inegalitatea Cebîşev formulată mai sus.

Inegalitatea lui Cebyshev, având o semnificație independentă pentru rezolvarea problemelor corespunzătoare, este folosită pentru a demonstra așa-numita teoremă a lui Cebyshev. Vom vorbi mai întâi despre esența acestei teoreme, apoi vom oferi formularea formală a acesteia.

Lăsa X 1 , X 2 , … , X n– un număr mare de variabile aleatoare independente cu așteptări matematice M(X 1 )=a 1 , … , M(X n )=a n. Deși fiecare dintre ele, ca urmare a unui experiment, poate lua o valoare departe de medie (adică așteptările matematice), totuși, o variabilă aleatorie
, egală cu media lor aritmetică, va lua cel mai probabil o valoare apropiată de un număr fix
(aceasta este media tuturor așteptărilor matematice). Aceasta înseamnă următoarele. Fie ca rezultat al testului variabile aleatoare independente X 1 , X 2 , … , X n(sunt multe!) au luat valori în consecință X 1 , X 2 , … , X n respectiv. Atunci, dacă aceste valori însele se pot dovedi a fi departe de valorile medii ale variabilelor aleatoare corespunzătoare, valoarea lor medie
cel mai probabil va fi aproape de număr
. Astfel, media aritmetică a unui număr mare de variabile aleatoare își pierde deja caracterul aleatoriu și poate fi prezisă cu mare precizie. Acest lucru poate fi explicat prin faptul că abaterile aleatorii ale valorilor X i din A i pot fi de semne diferite și, prin urmare, în total, aceste abateri sunt cel mai probabil compensate.

Terema Cebişev (legea numerelor mariîn forma Cebyshev). Lăsa X 1 , X 2 , … , X n – o secvență de variabile aleatoare independente pe perechi ale căror varianțe sunt limitate la același număr. Apoi, oricât de mic ar fi numărul ε pe care îl luăm, probabilitatea inegalității

va fi cât de aproape de unu cât se dorește dacă numărul n luați variabile aleatoare suficient de mari. Formal, aceasta înseamnă că în condițiile teoremei

Acest tip de convergență se numește convergență prin probabilitate și se notează:

Astfel, teorema lui Cebyshev spune că, dacă există un număr suficient de mare de variabile aleatoare independente, atunci media lor aritmetică într-un singur test va lua aproape în mod sigur o valoare apropiată de media așteptărilor lor matematice.

Cel mai adesea, teorema lui Cebyshev este aplicată în situațiile în care variabile aleatoare X 1 , X 2 , … , X n au aceeași distribuție (adică aceeași lege de distribuție sau aceeași densitate de probabilitate). De fapt, este pur și simplu un număr mare de instanțe ale aceleiași variabile aleatoare.

Consecinţă(inegalitatea generalizată Chebyshev). Dacă variabile aleatoare independente X 1 , X 2 , … , X n au aceeași distribuție cu așteptările matematice M(X i )= Ași variații D(X i )= D, Acea

, adică
.

Dovada rezultă din inegalitatea generalizată Chebyshev prin trecerea la limita la n→∞ .

Să remarcăm încă o dată că egalitățile scrise mai sus nu garantează că valoarea cantității
se străduiește pentru A la n→∞. Această cantitate rămâne o variabilă aleatorie, iar valorile sale individuale pot fi destul de departe A. Dar probabilitatea unui astfel de lucru (departe de A) valori cu creștere n tinde spre 0.

cometariu. Concluzia corolarului este, evident, valabilă și în cazul mai general, când variabile aleatoare independente X 1 , X 2 , … , X n au distribuții diferite, dar aceleași așteptări matematice (egal A) și variații limitate în comun. Acest lucru ne permite să anticipăm acuratețea măsurării unei anumite cantități, chiar dacă aceste măsurători au fost efectuate cu instrumente diferite.

Să luăm în considerare mai detaliat aplicarea acestui corolar la măsurarea cantităților. Să folosim un dispozitiv n măsurători ale aceleiași mărimi, a cărei valoare adevărată este egală cu A si nu stim. Rezultatele unor astfel de măsurători X 1 , X 2 , … , X n pot diferi semnificativ unul de celălalt (și de valoarea adevărată A) din cauza diverșilor factori aleatori (modificări de presiune, temperatură, vibrații aleatorii etc.). Luați în considerare r.v. X– citirea instrumentului pentru o singură măsurătoare a unei mărimi, precum și un set de r.v. X 1 , X 2 , … , X n– citirea instrumentului la prima, a doua, ..., ultima măsurătoare. Astfel, fiecare dintre cantități X 1 , X 2 , … , X n există doar unul dintre cazurile de s.v. X, și de aceea toate au aceeași distribuție ca și r.v. X. Deoarece rezultatele măsurătorilor nu depind unele de altele, atunci r.v. X 1 , X 2 , … , X n poate fi considerat independent. Dacă dispozitivul nu produce o eroare sistematică (de exemplu, zero de pe scară nu este „off”, arcul nu este întins etc.), atunci putem presupune că așteptarea matematică M(X) = a, prin urmare M(X 1 ) = ... = M(X n ) = a. Astfel, sunt îndeplinite condițiile corolarului de mai sus și, prin urmare, ca valoare aproximativă a cantității A putem lua o „realizare” a unei variabile aleatorii
în experimentul nostru (constând în efectuarea unei serii de n măsurători), adică

.

Cu un număr mare de măsurători, o precizie bună a calculului folosind această formulă este practic sigură. Acesta este motivul pentru principiul practic conform căruia, cu un număr mare de măsurători, media lor aritmetică practic nu diferă mult de valoarea adevărată a valorii măsurate.

Metoda „eșantionării”, utilizată pe scară largă în statistica matematică, se bazează pe legea numerelor mari, care permite obținerea caracteristicilor sale obiective cu o acuratețe acceptabilă dintr-un eșantion relativ mic de valori ale unei variabile aleatorii. Dar acest lucru va fi discutat în secțiunea următoare.

Exemplu. O anumită cantitate este măsurată pe un dispozitiv de măsurare care nu face distorsiuni sistematice A o dată (valoare primită X 1 ), și apoi încă de 99 de ori (valori obținute X 2 , … , X 100 ). Pentru valoarea de măsurare adevărată A primul se ia rezultatul primei măsurători
, iar apoi media aritmetică a tuturor măsurătorilor
. Precizia de măsurare a dispozitivului este astfel încât abaterea standard a măsurătorii σ nu este mai mare de 1 (prin urmare, varianța D 2 de asemenea, nu depășește 1). Pentru fiecare metodă de măsurare, estimați probabilitatea ca eroarea de măsurare să nu depășească 2.

Soluţie. Lasă r.v. X– citirea instrumentului pentru o singură măsurătoare. Apoi, după condiție M(X)=a. Pentru a răspunde la întrebările puse, aplicăm inegalitatea generalizată Chebyshev

la ε =2 primul pentru n=1 iar apoi pentru n=100 . În primul caz obținem
, iar în al doilea. Astfel, al doilea caz garantează practic precizia de măsurare specificată, în timp ce primul lasă mari îndoieli în acest sens.

Să aplicăm afirmațiile de mai sus variabilelor aleatoare care apar în schema Bernoulli. Să ne amintim esența acestei scheme. Lasă-l să fie produs n încercări independente, fiecare dintre ele conținând un anumit eveniment A poate apărea cu aceeași probabilitate R, A q=1–р(În sens, aceasta este probabilitatea evenimentului opus - evenimentul nu are loc A) . Să cheltuim un număr n astfel de teste. Să luăm în considerare variabile aleatoare: X 1 – numărul de apariții ale evenimentului A V 1 - al-lea test, ..., X n– numărul de apariții ale evenimentului A V n- al-lea test. Toate au intrat s.v. poate lua valori 0 sau 1 (eveniment A poate apărea sau nu în test) și valoarea 1 conform condiţiei este acceptată în fiecare probă cu probabilitate p(probabilitatea producerii evenimentului Aîn fiecare încercare) și valoarea 0 cu probabilitate q= 1 p. Prin urmare, aceste mărimi au aceleași legi de distribuție:

X 1

X n

Prin urmare, valorile medii ale acestor cantități și variațiile lor sunt, de asemenea, aceleași: M(X 1 )=0 q+1 p= p, …, M(X n )= p ; D(X 1 )=(0 2 q+1 2 p)− p 2 = p∙(1− p)= p q, … , D(X n )= p q. Înlocuind aceste valori în inegalitatea generalizată Chebyshev, obținem

.

Este clar că r.v. X=X 1 +…+X n este numărul de apariții ale evenimentului A in toate n teste (cum se spune - „numărul de succese” în n teste). Lasă-l pe condus n eveniment de testare A aparut in k dintre ei. Atunci inegalitatea anterioară poate fi scrisă ca

.

Dar amploarea
, egal cu raportul dintre numărul de apariții ale evenimentului A V nîncercări independente, la numărul total de încercări, a fost numit anterior frecvența relativă a evenimentelor A V n teste. Prin urmare, există o inegalitate

.

Trecand acum la limita la n→∞, obținem
, adică
(după probabilitate). Acesta constituie conținutul legii numerelor mari în forma Bernoulli. De aici rezultă că cu un număr suficient de mare de teste n abateri arbitrar mici ale frecvenței relative
evenimente din probabilitatea sa R- evenimente aproape de încredere și abateri mari - aproape imposibile. Concluzia rezultată despre o astfel de stabilitate a frecvențelor relative (despre care am vorbit anterior ca experimental fapt) justifică definiția statistică introdusă anterior a probabilității unui eveniment ca număr în jurul căruia fluctuează frecvența relativă a unui eveniment.

Având în vedere că expresia pq= p∙(1− p)= pp 2 nu depășește intervalul de modificare
(acest lucru este ușor de verificat prin găsirea minimului acestei funcții pe acest segment), din inegalitatea de mai sus
ușor să obții asta

,

care este utilizat în rezolvarea problemelor relevante (una dintre ele va fi dată mai jos).

Exemplu. Moneda a fost aruncată de 1000 de ori. Estimați probabilitatea ca abaterea frecvenței relative de apariție a stemei de la probabilitatea acesteia să fie mai mică de 0,1.

Soluţie. Aplicarea inegalității
la p= q=1/2 , n=1000 , ε=0,1, vom primi .

Exemplu. Estimați probabilitatea ca, în condițiile exemplului anterior, numărul k emblemele aruncate vor fi în intervalul de la 400 inainte de 600 .

Soluţie. Condiție 400< k<600 înseamnă că 400/1000< k/ n<600/1000 , adică 0.4< W n (A)<0.6 sau
. După cum tocmai am văzut din exemplul anterior, probabilitatea unui astfel de eveniment nu este mai mică 0.975 .

Exemplu. Pentru a calcula probabilitatea unui eveniment A Au fost efectuate 1000 de experimente în care evenimentul A a aparut de 300 de ori. Estimați probabilitatea ca frecvența relativă (egale cu 300/1000 = 0,3) să fie departe de probabilitatea adevărată R nu mai mult de 0,1.

Soluţie. Aplicând inegalitatea de mai sus
pentru n=1000, ε=0,1, obținem .

Fenomenul de stabilizare a frecvenţelor de apariţie a evenimentelor întâmplătoare, descoperit pe un material mare şi variat, nu a avut iniţial nicio justificare şi a fost perceput ca un fapt pur empiric. Primul rezultat teoretic în acest domeniu a fost celebra teoremă Bernoulli, publicată în 1713, care a pus bazele legilor numerelor mari.

Teorema lui Bernoulli, în conținutul său, este o teoremă limită, adică o declarație cu sens asimptotic care spune ce se va întâmpla cu parametrii probabilistici cu un număr mare de observații. Strămoșul tuturor enunțurilor moderne de acest tip este tocmai teorema lui Bernoulli.

Astăzi se pare că legea matematică a numerelor mari este o reflectare a unei proprietăți generale a multor procese reale.

Având dorința de a acorda legii numerelor mari cea mai mare amploare posibilă, corespunzătoare posibilităților potențiale departe de epuizate de aplicare a acestei legi, unul dintre cei mai mari matematicieni ai secolului nostru A. N. Kolmogorov și-a formulat esența astfel: legea numerelor mari este „principiul general în virtutea căruia acțiunea totală a unui număr mare de factori aleatori duce la un rezultat aproape independent de întâmplare.”

Astfel, legea numerelor mari are două interpretări. Unul este matematic, asociat cu modele, formulări, teorii matematice specifice, iar al doilea este mai general, depășind acest cadru. A doua interpretare este asociată cu fenomenul de formare a acțiunii mai mult sau mai puțin dirijate, observat adesea în practică, pe fondul unui număr mare de factori de operare ascunși sau vizibili, care în exterior nu au o astfel de continuitate. Exemple asociate cu cea de-a doua interpretare sunt stabilirea prețurilor pe o piață liberă și formarea opiniei publice cu privire la o anumită problemă.

După ce am remarcat această interpretare generală a legii numerelor mari, să ne întoarcem la formulări matematice specifice ale acestei legi.

După cum am spus mai sus, prima și fundamental cea mai importantă pentru teoria probabilității este teorema lui Bernoulli. Conținutul acestui fapt matematic, care reflectă una dintre cele mai importante legi ale lumii înconjurătoare, se rezumă la următoarele.

Luați în considerare o secvență de teste neînrudite (adică independente), ale căror condiții sunt reproduse în mod constant de la test la test. Rezultatul fiecărui test este apariția sau neapariția evenimentului care ne interesează A.

Această procedură (schema Bernoulli) poate fi, evident, considerată tipică pentru multe domenii practice: „băiat - fată” în succesiunea nou-născuților, observații meteorologice zilnice („a plouat - nu a făcut”), controlul fluxului de produse fabricate ( „normal - defect”) etc.

Frecvența de apariție a evenimentelor A la P teste ( t A -

frecvența evenimentelor A V P teste) are cu crestere P tendinţa de a-şi stabiliza valoarea este un fapt empiric.

teorema lui Bernoulli. Să alegem orice număr pozitiv arbitrar mic

Subliniem că faptul matematic stabilit de Bernoulli într-un anumit model matematic (în schema Bernoulli) nu trebuie confundat cu regularitatea stabilită empiric a stabilității frecvenței. Bernoulli nu s-a mulțumit doar cu formula (9.1), ci, ținând cont de nevoile practicii, a dat o evaluare a inegalității prezente în această formulă. Vom reveni la această interpretare mai jos.

Legea numerelor mari a lui Bernoulli a fost subiectul cercetărilor unui număr mare de matematicieni care au căutat să o rafinească. Una dintre aceste perfecționări a fost obținută de matematicianul englez Moivre și se numește în prezent teorema Moivre-Laplace. În schema Bernoulli, luați în considerare succesiunea de mărimi normalizate:

Teorema integrală a lui Moivre - Laplace. Să alegem oricare două numere X (Și x 2.În acest caz x, x 7, apoi at P -» °°

Dacă se află în partea dreaptă a formulei (9.3) variabila x x tind la infinit, atunci limita rezultată, în funcție doar de x 2 (indicele 2 poate fi eliminat în acest caz), va fi o funcție de distribuție, se numește distribuție normală standard, sau legea lui Gauss.

Partea dreaptă a formulei (9.3) este egală cu y = F(x 2) - F(x x). F(x 2)-> 1 la x 2-> °° și F(x,) -> 0 la x, -> Datorită alegerii unui suficient de mare

X] > 0 și X]n este suficient de mare în valoare absolută, obținem următoarea inegalitate:

Luând în considerare formula (9.2), putem extrage estimări practic de încredere:

Dacă nivelul de încredere al lui y = 0,95 (adică o probabilitate de eroare de 0,05) poate părea insuficient pentru cineva, puteți „juca sigur” și puteți construi un interval de încredere puțin mai larg folosind regula trei sigma menționată mai sus:

Acest interval corespunde unui nivel de încredere foarte ridicat y = 0,997 (vezi tabelele de distribuție normală).

Luați în considerare un exemplu care implică aruncarea unei monede. Să aruncăm o monedă n = 100 de ori. S-ar putea întâmpla ca frecvența R va fi foarte diferit de probabilitate R= 0,5 (presupunând că moneda este simetrică), de exemplu, va fi egală cu zero? Pentru a face acest lucru, este necesar ca blazonul să nu cadă nici măcar o dată. Un astfel de eveniment este teoretic posibil, dar am calculat deja probabilități similare pentru acest eveniment; Această valoare

extrem de mic, ordinea sa este un număr cu 30 de zerouri după virgulă zecimală. Un eveniment cu o asemenea probabilitate poate fi considerat practic imposibil. Ce abateri ale frecvenței de la probabilitate sunt practic posibile cu un număr mare de experimente? Folosind teorema Moivre-Laplace, răspundem la această întrebare astfel: cu probabilitate la= 0,95 frecvența stemei R se încadrează în intervalul de încredere:

Dacă o eroare de 0,05 pare să nu fie mică, trebuie să creșteți numărul de experimente (lansări de monede). La crestere P lățimea intervalului de încredere scade (din păcate, nu atât de repede pe cât ne-am dori, dar invers proporțional cu -Ion). De exemplu, când P= 10.000 obținem asta R se află în intervalul de încredere cu probabilitatea de încredere la= 0,95: 0,5 ±0,01.

Astfel, am înțeles cantitativ problema aproximării frecvenței de probabilitate.

Acum să găsim probabilitatea unui eveniment pe baza frecvenței sale și să estimăm eroarea acestei aproximări.

Să facem un număr mare de experimente P(aruncă o monedă), află frecvența evenimentului Ași vrem să-i estimăm probabilitatea R.

Din legea numerelor mari P urmează că:

Acum să estimăm eroarea practic posibilă a egalității aproximative (9.7). Pentru a face acest lucru, folosim inegalitatea (9.5) sub forma:

A găsi R De R trebuie să rezolvăm inegalitatea (9.8), pentru a face acest lucru trebuie să o pătram și să rezolvăm ecuația pătratică corespunzătoare. Ca rezultat obținem:

Unde

Pentru o estimare aproximativă R De R poate fi în formula (9.8) Rîn dreapta înlocuiți cu R sau în formulele (9.10), (9.11) presupunem că

Apoi obținem:

Lăsa să intre P= 400 de experimente sa obținut valoarea frecvenței R= 0,25, apoi cu un nivel de încredere de y = 0,95 găsim:

Ce se întâmplă dacă trebuie să cunoaștem probabilitatea mai precis, cu o eroare de, să zicem, nu mai mare de 0,01? Pentru a face acest lucru, este necesar să creșteți numărul de experimente.

Presupunând în formula (9.12) probabilitatea R= 0,25, echivalăm valoarea erorii cu valoarea dată 0,01 și obținem o ecuație pentru P:

Rezolvând această ecuație, obținem n~ 7500.

Să luăm acum în considerare o altă întrebare: abaterea frecvenței de la probabilitatea obținută în experimente poate fi explicată prin cauze aleatorii, sau această abatere arată că probabilitatea nu este ceea ce ne așteptam să fie? Cu alte cuvinte, experiența confirmă ipoteza statistică acceptată sau, dimpotrivă, impune respingerea acesteia?

Să aruncăm, de exemplu, o monedă P= de 800 de ori, obținem frecvența de apariție a stemei R= 0,52. Am bănuit că moneda era asimetrică. Este justificată această suspiciune? Pentru a răspunde la această întrebare, vom pleca de la ipoteza că moneda este simetrică (p = 0,5). Să găsim intervalul de încredere (cu probabilitatea de încredere la= 0,95) pentru frecvența de apariție a stemei. Dacă valoarea obţinută în experiment R= 0,52 se încadrează în acest interval - totul este normal, ipoteza acceptată despre simetria monedei nu contrazice datele experimentale. Formula (9.12) la R= 0,5 dă un interval de 0,5 ± 0,035; valoarea primită p = 0,52 se încadrează în acest interval, ceea ce înseamnă că moneda va trebui „ștersă” de suspiciuni de asimetrie.

Metode similare sunt folosite pentru a judeca dacă diverse abateri de la așteptările matematice observate în fenomene aleatorii sunt aleatorii sau „semnificative”. De exemplu, greutatea insuficientă a fost găsită întâmplător în câteva mostre de mărfuri ambalate sau indică înșelăciunea sistematică a clienților? Rata de recuperare a crescut întâmplător la pacienții care utilizează noul medicament sau se datorează efectului medicamentului?

Legea normală joacă un rol deosebit de important în teoria probabilității și în aplicațiile sale practice. Am văzut deja mai sus că o variabilă aleatoare - numărul de apariții ale unui eveniment în schema Bernoulli - cu P-» °° se reduce la legea normală. Cu toate acestea, există un rezultat mult mai general.

Teorema limitei centrale. Suma unui număr mare de variabile aleatoare independente (sau slab dependente), comparabile între ele în ordinea variațiilor lor, este distribuită după o lege normală, indiferent care au fost legile de distribuție a termenilor. Afirmația de mai sus este o formulare calitativă aproximativă a teoriei limitei centrale. Această teoremă are multe forme, care diferă unele de altele în condițiile pe care trebuie să le îndeplinească variabilele aleatoare pentru ca suma lor să fie „normalizată” cu creșterea numărului de termeni.

Densitatea normală de distribuție Dx) se exprimă prin formula:

Unde A - așteptarea matematică a unei variabile aleatoare X s= V7) este abaterea sa standard.

Pentru a calcula probabilitatea ca x să se încadreze în intervalul (x 1? x 2), se utilizează integrala:

Deoarece integrala (9.14) la densitatea (9.13) nu este exprimată în termeni de funcții elementare („nu este luată”), atunci pentru a calcula (9.14) se folosesc tabele ale funcției de distribuție integrală a distribuției normale standard, când a = 0, a = 1 (astfel de tabele sunt disponibile în orice manual despre teoria probabilității):

Probabilitatea (9.14) folosind ecuația (10.15) este exprimată prin formula:

Exemplu. Aflați probabilitatea ca variabila aleatoare X, având o distribuţie normală cu parametri A, a, se va abate de la modul său de așteptare matematică cu cel mult 3.

Folosind formula (9.16) și tabelul funcției de distribuție a legii normale, obținem:

Exemplu. În fiecare dintre cele 700 de experimente independente evenimentul A se întâmplă cu probabilitate constantă R= 0,35. Găsiți probabilitatea ca evenimentul A se va întâmpla:

  • 1) exact de 270 de ori;
  • 2) mai puțin de 270 și mai mult de 230 de ori;
  • 3) de peste 270 de ori.

Găsirea așteptărilor matematice A = etcși abaterea standard:

variabilă aleatoare - numărul de apariții ale evenimentului A:

Găsirea valorii centrate și normalizate X:

Din tabelele cu densitatea distribuției normale găsim f(x):

Să-l găsim acum R w (x,> 270) = P 700 (270 F(1,98) = = 1 - 0,97615 = 0,02385.

Un pas serios în cercetarea problemelor numărului mare a fost făcut în 1867 de P. L. Cebyshev. El a considerat un caz foarte general când nu se cere nimic de la variabile aleatoare independente, cu excepția existenței așteptărilor și a variațiilor matematice.

inegalitatea lui Cebyshev. Pentru un număr pozitiv arbitrar mic e este valabilă următoarea inegalitate:

teorema lui Cebyshev. Dacă x x, x 2, ..., x p - variabile aleatoare independente perechi, fiecare dintre ele având o așteptare matematică E(Xj) = ci si varianta D(x,) =), iar varianțele sunt limitate uniform, adică. 1,2 ..., apoi pentru orice număr pozitiv arbitrar mic e urmatoarea relatie este valabila:

Consecinţă. Dacă a,= aio, -о 2 , i= 1,2 ..., atunci

Sarcină. De câte ori trebuie aruncată o monedă astfel încât probabilitatea să nu fie mai mică de y - 0,997, s-ar putea susține că frecvența căderii stemei va fi în intervalul (0,499; 0,501)?

Să presupunem că moneda este simetrică, p - q - 0,5. Să aplicăm teorema lui Cebyshev din formula (9.19) variabilei aleatoare X- frecvenţa de apariţie a stemei în P aruncări de monede. Am arătat deja mai sus X = X x + X 2 + ... +X„, Unde X t - o variabilă aleatorie care ia valoarea 1 dacă moneda este un cap și valoarea 0 dacă este o coadă. Asa de:

Să scriem inegalitatea (9.19) pentru evenimentul opus evenimentului indicat sub semnul probabilității:

În cazul nostru [e = 0,001, cj 2 = /?-p)]t este numărul de apariții ale stemei în P aruncare. Substituind aceste mărimi în ultima inegalitate și ținând cont că, conform condițiilor problemei, inegalitatea trebuie satisfăcută, obținem:

Exemplul dat ilustrează posibilitatea utilizării inegalității lui Chebyshev pentru a estima probabilitățile anumitor abateri ale variabilelor aleatoare (precum și probleme precum acest exemplu legate de calculul acestor probabilități). Avantajul inegalității lui Cebyshev este că nu necesită cunoașterea legilor de distribuție a variabilelor aleatoare. Desigur, dacă o astfel de lege este cunoscută, atunci inegalitatea lui Cebyshev oferă estimări prea grosiere.

Să ne uităm la același exemplu, dar folosind faptul că aruncarea unei monede este un caz special al schemei lui Bernoulli. Numărul de succese (în exemplu - numărul de steme) se supune legii binomului și cu o mare P această lege poate fi reprezentată printr-o lege normală cu așteptare matematică datorită teoremei integrale a lui Moivre - Laplace a = pr = n? 0,5 și cu abatere standard a = yfnpq - 25=0,5l/l. Variabila aleatoare - frecvența căderii stemei - are o așteptare matematică = 0,5 și o abatere standard

Atunci noi avem:

Din ultima inegalitate obținem:

Din tabelele de distribuție normală găsim:

Vedem că aproximarea normală dă numărul de aruncări de monede care furnizează o eroare dată în estimarea probabilității unei steme, care este de 37 de ori mai mică în comparație cu estimarea obținută folosind inegalitatea lui Cebyshev (dar inegalitatea lui Cebyshev face posibilă realizarea calcule similare în cazul în care nu avem informații despre legea de distribuție a variabilei aleatoare studiate).

Să considerăm acum o problemă aplicată rezolvată folosind formula (9.16).

Problema concurenței. Două companii feroviare concurente au fiecare câte un tren care circulă între Moscova și Sankt Petersburg. Aceste trenuri sunt echipate aproximativ la fel și pleacă și sosesc aproximativ la aceeași oră. Să ne prefacem că P= 1000 de pasageri își aleg trenul în mod independent și aleatoriu, prin urmare, ca model matematic pentru alegerea trenului de către pasageri, folosim schema Bernoulli cu P provocări și probabilitatea de succes R= 0,5. Compania trebuie să decidă câte locuri să asigure în tren, ținând cont de două condiții reciproc contradictorii: pe de o parte, nu doriți să aveți locuri goale, pe de altă parte, nu doriți ca oameni nemulțumiți de lipsa locurilor (data viitoare vor prefera companiile concurente). Desigur, poate fi furnizat în tren P= 1000 de locuri, dar atunci vor fi evident locuri goale. O variabilă aleatorie - numărul de pasageri dintr-un tren - în cadrul modelului matematic adoptat folosind teoria integrală a lui Moivre - Laplace se supune legii normale cu așteptări matematice a = pr = n/2 și varianța a 2 = npq = p/4 secvenţial. Probabilitatea ca mai mult de s pasageri, este determinată de raportul:

Setați nivelul de risc A, adică probabilitatea ca mai mult să vină s pasageri:

De aici:

Dacă A este rădăcina riscului ultimei ecuații, care se găsește din tabelele funcției de distribuție a legii normale, atunci obținem:

Dacă, de exemplu, P = 1000, A= 0,01 (acest nivel de risc înseamnă că numărul de locuri s va fi suficientă în 99 de cazuri din 100), atunci x a ~ 2.33 și s = 537 de locuri. Mai mult, dacă ambele companii acceptă aceleași niveluri de risc A= 0,01, atunci cele două trenuri vor avea în total 1074 de locuri, dintre care 74 vor fi goale. În mod similar, se poate calcula că 514 de locuri ar fi suficiente în 80% din toate cazurile, iar 549 de locuri ar fi suficiente în 999 din 1000 de cazuri.

Considerații similare se aplică altor probleme de serviciu concurente. De exemplu, dacă T cinematografele concurează pentru același lucru P spectatori, atunci ar trebui acceptat R= -. Primim,

care este numarul de locuri sîntr-un cinema ar trebui să fie determinată de raportul:

Numărul total de spații goale este egal cu:

Pentru A = 0,01, P= 1000 și T= 2, 3, 4 valorile acestui număr sunt aproximativ egale cu 74, 126, respectiv 147.

Să ne uităm la un alt exemplu. Lăsați trenul să fie format din P - 100 de vagoane. Greutatea fiecărei mașini este o variabilă aleatorie cu așteptări matematice A - 65 de tone și așteptarea pătrată medie o = 9 tone O locomotivă poate transporta un tren dacă greutatea acestuia nu depășește 6600 de tone; în caz contrar, trebuie să cuplați o a doua locomotivă. Trebuie să găsiți probabilitatea că nu va trebui să faceți acest lucru.

Greutățile mașinilor individuale: , având aceeași așteptare matematică A - 65 și aceeași variație d- o 2 = 81. Conform regulii așteptărilor matematice: E(x) - 100 * 65 = 6500. Conform regulii de adunare a variațiilor: D(x) = 100 x 81 = 8100. Prin extragerea rădăcinii, găsim abaterea standard. Pentru ca o locomotivă să tragă un tren, greutatea trenului trebuie să fie X s-a dovedit a fi limitativ, adică a intrat în intervalul (0; 6600). Variabila aleatoare x - suma a 100 de termeni - poate fi considerată distribuită normal. Folosind formula (9.16) obținem:

Rezultă că locomotiva va „face față” trenului cu o probabilitate de aproximativ 0,864. Să reducem acum numărul de vagoane din tren cu două, adică să luăm P= 98. Acum calculând probabilitatea ca locomotiva să „fa față” trenului, obținem o valoare de ordinul 0,99, adică un eveniment aproape sigur, deși doar două vagoane au trebuit îndepărtate pentru aceasta.

Deci, dacă avem de-a face cu sume ale unui număr mare de variabile aleatoare, atunci putem folosi legea normală. Desigur, acest lucru ridică întrebarea: câte variabile aleatoare trebuie adăugate astfel încât legea distribuției sumei să fie deja „normalizată”? Depinde care sunt legile de distribuție a termenilor. Există legi atât de complicate încât normalizarea are loc numai cu un număr foarte mare de termeni. Dar aceste legi sunt inventate de matematicieni, de regulă, natura nu creează în mod deliberat astfel de probleme. De obicei, în practică, pentru a putea folosi legea normală, sunt de ajuns cinci sau șase termeni.

Viteza cu care legea de distribuție a unei sume de variabile aleatoare distribuite identic „se normalizează” poate fi ilustrată prin exemplul variabilelor aleatoare cu distribuție uniformă pe intervalul (0, 1). Curba unei astfel de distribuții are forma unui dreptunghi, care nu mai este asemănător cu legea normală. Să adăugăm două astfel de variabile independente - obținem o variabilă aleatoare distribuită conform așa-numitei legi Simpson, a cărei reprezentare grafică are forma unui triunghi isoscel. De asemenea, nu arată ca o lege normală, dar este mai bine. Și dacă adunați trei astfel de variabile aleatoare distribuite uniform, obțineți o curbă formată din trei segmente de parabole, foarte asemănătoare cu o curbă normală. Dacă adăugați șase astfel de variabile aleatoare, obțineți o curbă care nu diferă de normală. Aceasta este baza pentru o metodă utilizată pe scară largă pentru obținerea unei variabile aleatoare distribuite normal, iar toate calculatoarele moderne sunt echipate cu senzori pentru numere aleatoare distribuite uniform (0, 1).

Următoarea metodă este recomandată ca o modalitate practică de a verifica acest lucru. Construim un interval de încredere pentru frecvența unui eveniment cu un nivel la= 0,997 conform regulii trei sigma:

iar dacă ambele capete ale sale nu se extind dincolo de segmentul (0, 1), atunci se poate folosi legea normală. Dacă oricare dintre limitele intervalului de încredere se află în afara segmentului (0, 1), atunci legea normală nu poate fi utilizată. Totuși, în anumite condiții, legea binomului pentru frecvența unui eveniment aleatoriu, dacă nu tinde spre cel normal, atunci poate tinde către o altă lege.

În multe aplicații, schema Bernoulli este folosită ca model matematic al unui experiment aleatoriu, în care numărul de încercări P este mare, un eveniment aleatoriu este destul de rar, adică R = etc nu mic, dar nici mare (fluctuează în intervalul O -5-20). În acest caz, relația limitativă este valabilă:

Formula (9.20) se numește aproximare Poisson pentru legea binomială, deoarece distribuția de probabilitate din partea sa dreaptă se numește legea lui Poisson. Se spune că distribuția Poisson este o distribuție de probabilitate pentru evenimente rare, deoarece apare atunci când limitele sunt îndeplinite: P -»°°, R-»0, dar X = pro oo.

Exemplu. Zile de nastere. Care este probabilitatea Rt (k) că într-o societate de 500 de oameni La oamenii s-au născut în ziua de Anul Nou? Dacă acești 500 de oameni sunt aleși la întâmplare, atunci schema lui Bernoulli poate fi aplicată cu probabilitatea de succes P = 1/365. Apoi

Calcule de probabilitate pentru diverse La da urmatoarele valori: RU = 0,3484...; R 2 = 0,2388...; R 3 = 0,1089...; P 4 = 0,0372...; R 5 = 0,0101...; R 6= 0,0023... Aproximații corespunzătoare folosind formula Poisson pentru X = 500 1/365 = 1,37

da urmatoarele valori: Ru = 0,3481...; R 2 = 0,2385...; R ъ = 0,1089; R 4 = 0,0373...; P 5 = 0,0102...; P 6 = 0,0023... Toate erorile sunt doar la a patra zecimală.

Iată exemple de situații în care puteți folosi legea lui Poisson a evenimentelor rare.

La o centrală telefonică are loc o conexiune incorectă cu o probabilitate scăzută R, de obicei R~0,005. Apoi formula lui Poisson ne permite să găsim probabilitatea conexiunilor incorecte pentru un număr total dat de conexiuni n~ 1000 când X = pr =1000 0,005 = 5.

Când coaceți chifle, adăugați stafide în aluat. Datorită amestecării, este de așteptat ca frecvența chiflelor cu stafide să urmeze aproximativ o distribuție Poisson R p (k, X), Unde X- densitatea stafidelor din aluat.

O substanță radioactivă emite particule i. Evenimentul că numărul de particule d ajunge în timp t zonă dată de spațiu, ia o valoare fixă La, se supune legii lui Poisson.

Numărul de celule vii cu cromozomi alterați atunci când sunt expuse la raze X urmează o distribuție Poisson.

Deci, legile numerelor mari fac posibilă rezolvarea problemei statisticii matematice asociate cu estimarea probabilităților necunoscute ale rezultatelor elementare ale unui experiment aleatoriu. Datorită acestor cunoștințe, facem ca metodele teoriei probabilităților să fie practic semnificative și utile. Legile numerelor mari fac, de asemenea, posibilă rezolvarea problemei obținerii de informații despre probabilități elementare necunoscute într-o altă formă - forma testării ipotezelor statistice.

Să luăm în considerare mai detaliat formularea și mecanismul probabilistic pentru rezolvarea problemelor de testare a ipotezelor statistice.

Legea numerelor mariîn teoria probabilității afirmă că media empirică (media aritmetică) a unui eșantion finit suficient de mare dintr-o distribuție fixă ​​este aproape de media teoretică (așteptările matematice) a acestei distribuții. În funcție de tipul de convergență, se face distincția între legea slabă a numerelor mari, când convergența are loc în probabilitate, și legea puternică a numerelor mari, când convergența are loc aproape peste tot.

Există întotdeauna un număr finit de încercări în care, cu orice probabilitate de avans dată, există mai puțin 1 frecvența relativă de apariție a unui eveniment va diferi cât mai puțin posibil de probabilitatea acestuia.

Sensul general al legii numerelor mari: acțiunea comună a unui număr mare de factori aleatori identici și independenți duce la un rezultat care, în limită, nu depinde de întâmplare.

Metodele de estimare a probabilității pe baza analizei eșantionului finit se bazează pe această proprietate. Un exemplu clar este prognoza rezultatelor alegerilor pe baza unui sondaj efectuat pe un eșantion de alegători.

YouTube enciclopedic

    1 / 5

    ✪ Legea numerelor mari

    ✪ 07 - Teoria probabilității. Legea numerelor mari

    ✪ 42 Legea numerelor mari

    ✪ 1 - Legea numerelor mari a lui Cebyshev

    ✪ Clasa a 11-a, lecția 25, curba Gaussiană. Legea numerelor mari

    Subtitrări

    Să ne uităm la legea numerelor mari, care este poate cea mai intuitivă lege din matematică și teoria probabilităților. Și pentru că se aplică atât de multe lucruri, este uneori folosit și înțeles greșit. Permiteți-mi să o definesc mai întâi pentru acuratețe și apoi vom vorbi despre intuiție. Să luăm o variabilă aleatoare, de exemplu X. Să presupunem că îi cunoaștem așteptările matematice sau media pentru populație. Legea numerelor mari spune pur și simplu că dacă luăm un exemplu de al n-lea număr de observații ale unei variabile aleatoare și luăm media tuturor acestor observații... Să luăm o variabilă. Să-l numim X cu un indice n și o bară în partea de sus. Aceasta este media aritmetică a celui de-al n-lea număr de observații ale variabilei noastre aleatoare. Iată prima mea observație. Fac experimentul o dată și fac această observație, apoi o fac din nou și fac această observație și o fac din nou și obțin asta. Conduc acest experiment de a n-a de ori, apoi împart la numărul de observații. Iată indicația mea de probă. Iată media tuturor observațiilor pe care le-am făcut. Legea numerelor mari ne spune că media mea eșantionului se va apropia de valoarea așteptată a variabilei aleatoare. Sau pot scrie, de asemenea, că media eșantionului meu se va apropia de media populației pentru a n-a cantitate care tinde spre infinit. Nu voi face o distincție clară între „aproximare” și „convergență”, dar sper că înțelegeți intuitiv că dacă iau aici un eșantion destul de mare, voi obține valoarea așteptată pentru populație în ansamblu. Cred că cei mai mulți dintre voi înțelegeți intuitiv că dacă fac suficiente teste cu un eșantion mare de exemple, în cele din urmă testele îmi vor da valorile pe care le aștept, ținând cont de valoarea și probabilitatea așteptate și de tot acel jazz. Dar cred că adesea nu este clar de ce se întâmplă acest lucru. Și înainte de a începe să explic de ce este așa, permiteți-mi să dau un exemplu concret. Legea numerelor mari ne spune că... Să presupunem că avem o variabilă aleatoare X. Este egală cu numărul de capete în 100 de aruncări ale unei monede corecte. În primul rând, cunoaștem așteptările matematice ale acestei variabile aleatorii. Acesta este numărul de aruncări de monede sau de încercări înmulțit cu șansele de succes ale oricărei încercări. Deci, acesta este egal cu 50. Adică legea numerelor mari spune că dacă luăm o probă, sau dacă fac media acestor încercări, voi obține. .. Prima dată când fac un test, voi arunca o monedă de 100 de ori, sau voi lua o cutie cu o sută de monede, o agit și apoi număr câte capete am și voi obține, să zicem , numărul 55. Acesta ar fi X1. Apoi scutur din nou cutia și obțin numărul 65. Apoi din nou și obțin 45. Și fac acest lucru de n număr de ori, apoi îl împart la numărul de încercări. Legea numerelor mari ne spune că această medie (media tuturor observațiilor mele) se va apropia de 50 pe măsură ce n se apropie de infinit. Acum aș vrea să vorbesc puțin despre motivul pentru care se întâmplă acest lucru. Mulți oameni cred că, dacă după 100 de încercări rezultatul meu este peste medie, atunci conform legilor probabilității ar trebui să obțin mai multe sau mai puține capete pentru a, ca să spunem așa, să compensez diferența. Nu este exact ceea ce se va întâmpla. Aceasta este adesea numită „eșecul jucătorului de noroc”. Lasă-mă să-ți arăt diferența. Voi folosi următorul exemplu. Lasă-mă să desenez un grafic. Să schimbăm culoarea. Acesta este n, axa mea x este n. Acesta este numărul de teste pe care le voi face. Și axa mea Y ​​va fi media eșantionului. Știm că așteptarea matematică a acestei variabile arbitrare este 50. Lasă-mă să desenez asta. Acesta este 50. Să revenim la exemplul nostru. Dacă n este... În timpul primului meu test, am luat 55, asta este media mea. Am un singur punct de intrare a datelor. Apoi, după două teste, am 65. Deci media mea ar fi 65+55 împărțit la 2. Adică 60. Și media mea a crescut puțin. Apoi am primit 45, ceea ce mi-a scăzut din nou media aritmetică. Nu am de gând să complot 45. Acum trebuie să fac o medie a tuturor acestor lucruri. Cu ce ​​este egal 45+65? Permiteți-mi să calculez această valoare pentru a reprezenta punctul. Adică 165 împărțit la 3. Adică 53. Nu, 55. Deci media scade înapoi la 55. Putem continua aceste teste. După ce am făcut trei încercări și am obținut acea medie, mulți oameni cred că zeii probabilității se vor asigura că vom obține mai puține capete în viitor, că următoarele câteva încercări vor avea scoruri mai mici pentru a scădea media. Dar nu este întotdeauna cazul. Doar pentru că obții un număr disproporționat de mare de capete nu înseamnă că la un moment dat vei începe să obții un număr disproporționat de mare de cozi. Acest lucru nu este în întregime adevărat. Legea numerelor mari ne spune că nu contează. Să zicem că după un anumit număr finit de teste, media ta... Probabilitatea este destul de mică, dar, totuși... Să presupunem că media ta a atins acest punct - 70. Te gândești: „Uau, ne-am îndepărtat de valoarea așteptată”. Dar legea numerelor mari spune că nu-i pasă de câte teste facem. Mai avem un număr nesfârșit de provocări în față. Așteptările matematice ale acestui număr infinit de încercări, mai ales într-o situație ca aceasta, ar fi următoarea. Când ajungeți la un număr finit care exprimă o valoare mare, un număr infinit care converge cu acesta va duce din nou la valoarea așteptată. Aceasta este, desigur, o interpretare foarte liberă, dar asta ne spune legea numerelor mari. Este important. Nu ne spune că dacă obținem o mulțime de capete, atunci probabilitatea de a obține cozi va crește cumva pentru a compensa. Această lege ne spune că nu contează care este rezultatul unui număr finit de încercări atâta timp cât mai aveți un număr infinit de încercări rămase. Și dacă faci destule dintre ele, vei ajunge din nou la valoarea așteptată. Acesta este un punct important. Gandeste-te la asta. Ne vedem în următorul videoclip!

Legea slabă a numerelor mari

Legea slabă a numerelor mari este numită și teorema lui Bernoulli, după Jacob Bernoulli, care a demonstrat-o în 1713.

Să existe o succesiune infinită (enumerare secvenţială) de variabile aleatoare distribuite identic şi necorelate. Adică covarianța lor c o v (X i , X j) = 0 , ∀ i ≠ j (\displaystyle \mathrm (cov) (X_(i),X_(j))=0,\;\forall i\not =j). Lăsa . Să notăm prin media eșantionului primul n (\displaystyle n) membri:

.

Apoi X ¯ n → P μ (\displaystyle (\bar (X))_(n)\to ^(\!\!\!\!\!\!\mathbb (P) )\mu ).

Adică pentru orice pozitiv ε (\displaystyle \varepsilon)

lim n → ∞ Pr (| X ¯ n − μ |< ε) = 1. {\displaystyle \lim _{n\to \infty }\Pr \!\left(\,|{\bar {X}}_{n}-\mu |<\varepsilon \,\right)=1.}

Legea întărită a numerelor mari

Să existe o succesiune infinită de variabile aleatoare independente distribuite identic ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )), definit pe un spațiu de probabilitate (Ω, F, P) (\displaystyle (\Omega,(\mathcal (F)),\mathbb (P))). Lăsa E X i = μ , ∀ i ∈ N (\displaystyle \mathbb (E) X_(i)=\mu ,\;\forall i\in \mathbb (N) ). Să notăm prin X ¯ n (\displaystyle (\bar (X))_(n)) medie eșantion de primul n (\displaystyle n) membri:

X ¯ n = 1 n ∑ i = 1 n X i , n ∈ N (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i= 1)^(n)X_(i),\;n\in \mathbb (N) ).

Apoi X ¯ n → μ (\displaystyle (\bar (X))_(n)\to \mu ) aproape intotdeauna.

Pr (lim n → ∞ X ¯ n = μ) = 1. (\displaystyle \Pr \!\left(\lim _(n\to \infty)(\bar (X))_(n)=\mu \ dreapta)=1.) .

Ca orice lege matematică, legea numerelor mari poate fi aplicată în lumea reală numai în baza anumitor ipoteze care pot fi îndeplinite doar cu un anumit grad de acuratețe. De exemplu, condițiile testelor succesive adesea nu pot fi menținute la infinit și cu o acuratețe absolută. În plus, legea numerelor mari vorbește doar despre improbabilitate abatere semnificativă a valorii medii de la așteptarea matematică.