Ipoteza nulă în statistici: un exemplu. Testarea ipotezei nule. Conceptul de ipoteză nulă

HIPOTEZE STATISTICE

Datele de probă obținute în experimente sunt întotdeauna limitate și sunt în mare parte aleatorii. De aceea, statistica matematică este utilizată pentru a analiza astfel de date, ceea ce face posibilă generalizarea tiparelor obținute în eșantion și extinderea acestora la întreaga populație generală.

Datele obținute ca urmare a experimentului pe orice eșantion servesc drept bază pentru evaluarea populației generale. Cu toate acestea, datorită acțiunii unor motive probabilistice aleatorii, estimarea parametrilor populației generale, realizată pe baza datelor experimentale (eșantion), va fi întotdeauna însoțită de o eroare și, prin urmare, astfel de estimări ar trebui considerate ca fiind conjecturale, și nu ca declarații finale. Astfel de ipoteze despre proprietățile și parametrii populației generale sunt numite ipoteze statistice . Potrivit lui G.V. Sukhodolsky: „O ipoteză statistică este de obicei înțeleasă ca o presupunere formală conform căreia asemănarea (sau diferența) unor caracteristici parametrice sau funcționale este accidentală sau, dimpotrivă, nu accidentală”.

Esența testării unei ipoteze statistice este de a stabili dacă datele experimentale și ipoteza prezentată sunt de acord, dacă este permisă atribuirea discrepanței dintre ipoteză și rezultatul analizei statistice a datelor experimentale din cauze aleatorii. Astfel, o ipoteză statistică este o ipoteză științifică care permite testarea statistică, iar statistica matematică este o disciplină științifică a cărei sarcină este de a testa științific ipoteze statistice.

Ipotezele statistice sunt clasificate în nule și alternative, direcționate și nedirecționate.

Ipoteza nulă(H 0) Este ipoteza că nu există diferențe. Dacă vrem să dovedim semnificația diferențelor, atunci este necesară ipoteza nulă respinge, altfel este necesar a confirma.

Ipoteză alternativă (H 1) - o ipoteză despre semnificația diferențelor. Aceasta este ceea ce vrem să dovedim, motiv pentru care uneori se numește experimental ipoteză.

Există sarcini când vrem să dovedim corect nesemnificatie diferențe, adică pentru a confirma ipoteza nulă. De exemplu, dacă trebuie să ne asigurăm că subiecți diferiți primesc, deși diferiți, dar echilibrați în dificultate, sau că probele experimentale și de control nu diferă în unele caracteristici semnificative. Cu toate acestea, mai des trebuie să dovedim semnificația diferențelor, pentru că sunt mai informative pentru noi în căutarea noastră pentru ceva nou.

Ipotezele nule și alternative pot fi direcționale și nedirecționale.

Ipoteze dirijate - dacă se presupune că valorile caracteristice sunt mai mari într-un grup și mai mici în celălalt:

H 0: X 1 mai puțin decât X 2,

H 1: X 1 depășește X 2.

Ipoteze nedirecționate - dacă se presupune că formele de distribuție a unei caracteristici în grupuri diferă:

H 0: X 1 nu diferă de X 2,

H 1: X 1 e diferit X 2.

Dacă am observat că într-unul dintre grupuri valorile individuale ale subiecților pentru un anumit criteriu, de exemplu, pentru activitatea socială, sunt mai mari, iar în celălalt, mai mici, atunci pentru a testa semnificația acestor diferențe, trebuie să formuleze ipoteze direcționate.

Dacă vrem să dovedim asta într-un grup A sub influența unor influențe experimentale, au avut loc modificări mai pronunțate decât în ​​grup B, atunci trebuie să formulăm și ipoteze direcționate.

Dacă vrem să dovedim că formele de distribuție a trăsăturii în grupuri diferă Ași B, apoi se formulează ipoteze nedirecționate.

Testarea ipotezei se efectuează utilizând criterii pentru evaluarea statistică a diferențelor.

Concluzia acceptată se numește decizie statistică. Să subliniem că o astfel de soluție este întotdeauna probabilistică. Când se testează o ipoteză, datele experimentale pot contrazice ipoteza H 0, atunci această ipoteză este respinsă. Altfel, adică dacă datele experimentale sunt de acord cu ipoteza H 0, nu deviază. Se spune adesea în astfel de cazuri că ipoteza H 0 este acceptat. Acest lucru arată că testarea statistică a ipotezelor bazate pe datele probelor experimentale este inevitabil asociată cu riscul (probabilitatea) de a lua o decizie falsă. În acest caz, sunt posibile erori de două feluri. O eroare de primul fel va apărea atunci când se ia o decizie de respingere a unei ipoteze. H 0, deși în realitate se dovedește a fi adevărat. O eroare de al doilea fel va apărea atunci când se ia decizia de a nu respinge ipoteza. H 0, deși în realitate va fi incorect. Evident, concluziile corecte pot fi acceptate și în două cazuri. Tabelul 7.1 rezumă cele de mai sus.

Tabelul 7.1

Este posibil ca psihologul să se înșele în decizia sa statistică; după cum putem vedea din tabelul 7.1, aceste erori pot fi de numai două feluri. Deoarece este imposibil să se excludă erorile atunci când se acceptă ipoteze statistice, este necesar să se minimizeze posibilele consecințe, adică acceptarea unei ipoteze statistice incorecte. În majoritatea cazurilor, singura modalitate de minimizare a erorilor este creșterea dimensiunii eșantionului.

CRITERII STATISTICE

Criteriul statistic- aceasta este o regulă de decizie care asigură un comportament fiabil, adică acceptarea unei ipoteze adevărate și respingerea unei ipoteze false cu o probabilitate mare.

Criteriile statistice se referă, de asemenea, la metoda de calcul a unui anumit număr și a numărului în sine.

Când spunem că fiabilitatea diferențelor a fost determinată de criteriu j *(criteriul este transformarea Fisher unghiulară), atunci vrem să spunem că am folosit metoda j * pentru a calcula un anumit număr.

Prin raportul valorilor empirice și critice ale criteriului, putem judeca dacă ipoteza nulă este confirmată sau infirmată.

În majoritatea cazurilor, pentru ca noi să recunoaștem diferențele ca semnificative, este necesar ca valoarea empirică a criteriului să o depășească pe cea critică, deși există criterii (de exemplu, criteriul Mann-Whitney sau criteriul semnului) în care trebuie să să adere la regula opusă.

În unele cazuri, formula de calcul a criteriului include numărul de observații din eșantionul studiat, notat ca n... În acest caz, valoarea empirică a criteriului este în același timp un test pentru testarea ipotezelor statistice. Folosind un tabel special, determinăm la ce nivel de semnificație statistică a diferențelor corespunde o anumită valoare empirică. Un exemplu de astfel de criteriu este criteriul j * calculat pe baza transformării Fisher unghiulare.

În majoritatea cazurilor, însă, aceeași valoare empirică a criteriului se poate dovedi a fi semnificativă sau nesemnificativă în funcție de numărul de observații din eșantionul studiat ( n) sau pe așa-numitul număr de grade de libertate, care este notat ca. v sau cum df.

Numărul de grade de libertate v egal cu numărul de clase serie de variații minus numărul condițiilor în care a fost format. Aceste condiții includ dimensiunea eșantionului ( n), mijloace și varianțe.

Să presupunem că un grup de 50 de persoane a fost împărțit în trei clase conform principiului:

Știe cum să lucreze pe computer;

Știe să efectueze numai anumite operații;

Nu pot funcționa pe un computer.

Primul și al doilea grup au inclus 20 de persoane, al treilea - 10.

Suntem limitați de o condiție - dimensiunea eșantionului. Prin urmare, chiar dacă am pierdut date despre câte persoane nu știu cum să lucreze pe un computer, putem determina acest lucru, știind că în clasele I și II există câte 20 de subiecte. Nu suntem liberi în determinarea numărului de subiecți din a treia categorie, „libertatea” se extinde doar la primele două celule ale clasificării:

Să ne cunoaștem terminologia utilizată în testarea ipotezelor.

Dar - ipoteza nulă (ipoteza scepticului) este o ipoteză nicio diferentaîntre probele comparate. Scepticul crede că diferențele dintre estimările eșantionului obținute din rezultatele cercetării sunt accidentale.

· H 1 - o ipoteză alternativă (ipoteză optimistă) este o ipoteză despre prezența diferențelor între eșantioanele comparate. Optimistul consideră că diferențele dintre estimările eșantionului sunt cauzate de motive obiective și corespund diferențelor dintre populațiile generale.

Testarea ipotezelor statistice este fezabilă numai atunci când este posibil să se compună unele magnitudine(criteriu), a cărui lege de distribuție în cazul validității este cunoscută H 0. Apoi pentru această cantitate se poate indica interval de încredere, în care valoarea sa cade cu o probabilitate dată P d. Acest interval se numește zona critică... Dacă valoarea criteriului se încadrează în regiunea critică, atunci se acceptă ipoteza H 0. În caz contrar, se acceptă ipoteza H 1.

În cercetarea medicală, se utilizează P d = 0,95 sau P d = 0,99. Aceste valori corespund niveluri de semnificație a = 0,05 sau a = 0,01.

La testarea ipotezelor statistice nivel de semnificație(a) este probabilitatea de a respinge ipoteza nulă atunci când este adevărată.

Rețineți că, la baza sa, procedura de testare a ipotezelor își propune să depisteze diferențele, și nu pentru a confirma absența lor. Când valoarea criteriului depășește zona critică, putem spune cu o inimă pură „scepticului” - ce mai vrei?! Dacă nu ar exista diferențe, atunci cu o probabilitate de 95% (sau 99%), valoarea calculată ar fi în limitele specificate. Dar nu! ...

Ei bine, dacă valoarea criteriului se încadrează în regiunea critică, atunci nu există niciun motiv să credem că ipoteza H 0 este adevărată. Acest lucru indică cel mai probabil unul dintre cele două motive posibile.



a) Dimensiunile eșantionului nu sunt suficient de mari pentru a detecta diferențele existente. Este probabil ca experimentarea continuă să aducă succes.

b) Există diferențe. Dar sunt atât de mici încât nu au nicio valoare practică. În acest caz, continuarea experimentelor nu are sens.

Să continuăm să luăm în considerare câteva dintre ipotezele statistice utilizate în cercetarea medicală.

§ 3.6. Testarea ipotezelor despre egalitatea variațiilor,
F - Criteriul lui Fisher

În unele studii clinice, efectul pozitiv nu este atestat atât de mult de magnitudine din parametrul investigat, cât este stabilizare, reducându-i fluctuațiile. În acest caz, apare întrebarea comparării a două varianțe generale pe baza rezultatelor unui sondaj de sondaj. Această sarcină poate fi rezolvată cu Criteriul lui Fisher.

Formularea problemei

lege normala distribuție. Dimensiunile eșantionului n 1 și n 2 și eșantioane variații sunt egale respectiv. Este necesar să se compare între ele varianțe generale.

Ipoteze testabile:

H 0- varianțe generale sunt la fel;

H 1 - varianțe generale diferit.

Se arată dacă probele sunt extrase din populații generale cu lege normala distribuția, atunci dacă ipoteza H 0 este adevărată, raportul varianțelor eșantionului respectă distribuția Fisher. Prin urmare, ca criteriu pentru verificarea validității lui H 0, valoarea F calculat prin formula

unde sunt varianțele eșantionului.

Acest raport respectă distribuția Fisher cu numărul de grade de libertate al numărătorului n 1 = n 1 -1 și numărul de grade de libertate ale numitorului n 2 = n 2 -1. Limitele zonei critice se găsesc folosind tabelele de distribuție Fisher sau folosind funcția de calculator FRASPINV.

Pentru exemplul prezentat în tabel. 3.4, obținem: n 1 = n 2 = 20 - 1 = 19; F = 2,16 / 4,05 = 0,53. La a = 0,05, limitele regiunii critice sunt egale, respectiv: F lion = 0,40, F right = 2,53.

Valoarea criteriului a căzut în regiunea critică, prin urmare, se acceptă ipoteza H 0: variații generale ale eșantioanelor sunt la fel.

§ 3.7. Testarea ipotezelor despre egalitatea mijloacelor,
t- Testul elevului

Sarcină de comparație mijloc două populații generale apar atunci când este de importanță practică magnitudine a trăsăturii studiate. De exemplu, atunci când se compară termenii tratamentului cu două metode diferite sau numărul de complicații care decurg din utilizarea acestora. În acest caz, puteți utiliza testul t Student.

Formularea problemei.

Au fost obținute două probe (X 1) și (X 2), extrase din populațiile generale cu lege normala distribuție și varianțe egale... Dimensiunile probei n 1 și n 2, eșantion înseamnă sunt egale și eșantioane variații-, respectiv. Este necesar să se compare între ele medii generale.

Ipoteze testabile:

H 0- medii generale sunt la fel;

H 1 - medii generale diferit.

Se arată că, în cazul validității ipotezei H 0, valoarea t calculat prin formula

, (3.10)

distribuite conform legii Studentului cu numărul de grade de libertate n= n 1 + n 2 - 2.

Aici, unde n 1 = n 1 - 1 - numărul de grade de libertate pentru primul eșantion; n 2 = n 2 - 1 este numărul de grade de libertate pentru al doilea eșantion.

Limitele zonei critice se găsesc din tabele t-alocarea sau utilizarea funcției computer STYUDRASP. Distribuția Studentului este simetrică cu zero, astfel încât limitele stânga și dreapta ale regiunii critice sunt aceleași ca mărime și opuse ca semn: - t gr și t gr.

Pentru exemplul prezentat în tabel. 3.4, obținem: n 1 = n 2 = 20 - 1 = 19; t= –2,51, n = 38. La a = 0,05 t gr = 2,02.

Valorile criteriului depășesc marginea stângă a regiunii critice, prin urmare, acceptăm ipoteza H 1: medii generale diferit... Mai mult, media populației generale prima mostră mai mica.

5. Principalele probleme ale statisticii aplicate - descrierea datelor, estimarea și testarea ipotezelor

Concepte de bază utilizate în testarea ipotezelor

Ipoteza statistică - orice presupunere privind distribuția necunoscută a variabilelor (elementelor) aleatorii. Iată formulările mai multor ipoteze statistice:

1. Rezultatele observației au o distribuție normală cu zero așteptări matematice.
2. Rezultatele observației au o funcție de distribuție N(0,1).
3. Rezultatele observației au o distribuție normală.
4. Rezultatele observațiilor în două eșantioane independente au aceeași distribuție normală.
5. Rezultatele observațiilor în două eșantioane independente au aceeași distribuție.

Distingeți între ipoteze nule și alternative. Ipoteza nulă este o ipoteză care trebuie testată. O ipoteză alternativă este fiecare ipoteză admisibilă, alta decât nulă. Se notează ipoteza nulă H 0, alternativă - H 1(din Ipoteză - „ipoteză” (engleză)).

Alegerea uneia sau altei ipoteze nule sau alternative este determinată de problemele aplicate cu care se confruntă managerul, economistul, inginerul și cercetătorul. Să ne uităm la câteva exemple.

Exemplul 11. Fie ipoteza nulă să fie ipoteza 2 din lista de mai sus și ipoteza alternativă 1, ceea ce înseamnă că situația reală este descrisă de un model probabilistic, conform căruia rezultatele observației sunt considerate ca realizări ale variabilelor aleatoare independente distribuite identic cu o distribuție funcţie N(0, σ), unde parametrul σ este necunoscut statisticilor. În cadrul acestui model, ipoteza nulă este scrisă după cum urmează:

H 0: σ = 1,

iar alternativa este așa:

H 1: σ ≠ 1.

Exemplul 12. Fie ca ipoteza nulă să fie în continuare ipoteza 2 din lista de mai sus, iar ipoteza alternativă 3 din aceeași listă. Apoi, într-un model probabilistic al unei situații manageriale, economice sau industriale, se presupune că rezultatele observației formează un eșantion din distribuția normală N(m, σ) pentru unele valori mși σ. Ipotezele sunt scrise astfel:

H 0: m= 0, σ = 1

(ambii parametri iau valori fixe);

H 1: m≠ 0 și / sau σ ≠ 1

(adică fie m≠ 0, sau σ ≠ 1, sau și m≠ 0 și σ ≠ 1).

Exemplul 13. Lasa H 0 este ipoteza 1 din lista de mai sus și H 1 - ipoteza 3 din aceeași listă. Atunci modelul probabilistic este același ca în exemplul 12,

H 0: m= 0, σ este arbitrar;

H 1: m≠ 0, σ este arbitrar.

Exemplul 14. Lasa H 0 este ipoteza 2 din lista de mai sus și conform H 1 rezultatele observației au o funcție de distribuție F(X), nu la fel ca funcția de distribuție normală standard F (x). Atunci

H 0: F(x) = Ф (x) Cu toti NS(scris ca F(x) ≡ Ф (x));

H 1: F(x 0) ≠ Ф (x 0) cu cineva x 0(adică nu este adevărat că F(x) ≡ Ф (x)).

Notă. Aici ≡ este semnul coincidenței identice a funcțiilor (adică, coincidență pentru toate valorile posibile ale argumentului NS).

Exemplul 15. Lasa H 0 este ipoteza 3 din lista de mai sus și conform H 1 rezultatele observației au o funcție de distribuție F(X), anormal. Atunci

Cu cineva m, σ;

H 1: pentru orice m, σ există x 0 = x 0(m, σ) astfel încât .

Exemplul 16. Lasa H 0 - ipoteza 4 din lista de mai sus, conform modelului probabilistic, două eșantioane sunt extrase din populații cu funcții de distribuție F(X) și G(X), care sunt normale cu parametrii m 1, σ 1 și m 2, respectiv σ 2 și H 1 - negare H 0. Atunci

H 0: m 1 = m 2, σ 1 = σ 2 și m 1 și σ 1 sunt arbitrare;

H 1: m 1 ≠ m 2 și / sau σ 1 ≠ σ 2.

Exemplul 17. Să presupunem că în condițiile exemplului 16 se știe în plus că σ 1 = σ 2. Atunci

H 0: m 1 = m 2, σ> 0 și m 1 și σ sunt arbitrare;

H 1: m 1 ≠ m 2, σ> 0.

Exemplul 18. Lasa H 0 - ipoteza 5 din lista de mai sus, conform modelului probabilistic, două eșantioane sunt extrase din populații cu funcții de distribuție F(X) și G(X) respectiv, în timp ce H 1 - negare H 0. Atunci

H 0: F(X) G(X) , Unde F(X)

H 1: F(X) și G(X) sunt funcții de distribuție arbitrare și

F(X) G(X) cu cineva NS.

Exemplul 19. Fie, în condițiile Exemplului 17, să se presupună în plus că funcțiile de distribuție F(X) și G(X) diferă doar în schimb, adică G(X) = F(X- A) cu cineva A... Atunci

H 0: F(X) G(X) ,

Unde F(X) - o funcție de distribuție arbitrară;

H 1: G(X) = F(X- a) și ≠ 0,

Unde F(X) Este o funcție de distribuție arbitrară.

Exemplul 20. Fie, în condițiile exemplului 14, se știe suplimentar că, conform modelului probabilistic al situației F(X) este funcția normală de distribuție cu varianță unitară, adică are forma N(m, 1). Atunci

H 0: m = 0 (acestea. F(x) = Ф (x)

Cu toti NS(scris ca F(x) ≡ Ф (x));

H 1: m 0

(adică nu este adevărat că F(x) ≡ Ф (x)).

Exemplul 21.În reglementarea statistică a proceselor tehnologice, economice, manageriale sau de altă natură, se ia în considerare un eșantion, extras dintr-o populație cu o distribuție normală și o varianță cunoscută, precum și ipoteze

H 0: m = m 0 ,

H 1: m= m 1 ,

unde valoarea parametrului m = m 0 corespunde cursului raționalizat al procesului și tranziției către m= m 1 indică discordie.

Exemplul 22.În controlul acceptării statistice, numărul de unități de produs defecte din eșantion respectă o distribuție hipergeometrică, parametrul necunoscut fiind p = D/ N- nivelul de defectivitate, unde N- volumul lotului de produse; D- numărul total de articole defecte din lot. Planurile de control utilizate în documentele de reglementare, tehnice și comerciale (standarde, contracte de furnizare etc.) vizează adesea testarea unei ipoteze

H 0: p < AQL

H 1: p > LQ,

Unde AQL - nivelul de acceptare a defectității; LQ - nivelul de respingere a defectivității (este evident că AQL < LQ).

Exemplul 23. O serie de caracteristici ale distribuțiilor indicatorilor controlați sunt utilizate ca indicatori ai stabilității unui proces tehnologic, economic, managerial sau de alt tip, în special, coeficientul de variație v = σ/ M(X). Este necesar să se testeze ipoteza nulă

H 0: v < v 0

sub o ipoteză alternativă

H 1: v > v 0 ,

Unde v 0 - o anumită valoare limită predeterminată.

Exemplul 24. Fie modelul probabilistic al a două eșantioane să fie același ca în Exemplul 18, așteptările matematice ale rezultatelor observației în primul și al doilea eșantion vor fi notate M(NS) și M(Avea) respectiv. Într-o serie de situații, se testează ipoteza nulă.

H 0: M (X) = M (Y)

împotriva ipotezei alternative

H 1: M (X) ≠ M (Y).

Exemplul 25... S-a notat mai sus mare importanțăîn statisticile matematice ale funcțiilor de distribuție simetrice față de 0, la verificarea simetriei

H 0: F(- X) = 1 – F(X) Cu toti X, in caz contrar F arbitrar;

H 1: F(- X 0 ) ≠ 1 – F(X 0 ) cu cineva X 0 , in caz contrar F arbitrar.

În metodele probabilist-statistice de luare a deciziilor, sunt utilizate multe alte formulări de probleme pentru testarea ipotezelor statistice. Unele dintre ele sunt discutate mai jos.

Sarcina specifică de testare a unei ipoteze statistice este complet descrisă dacă sunt date ipotezele nule și alternative. Alegerea metodei de testare a ipotezei statistice, proprietățile și caracteristicile metodelor sunt determinate atât de ipotezele nule, cât și de cele alternative. În general vorbind, ar trebui utilizate metode diferite pentru a testa aceeași ipoteză nulă sub diferite ipoteze alternative. Deci, în exemplele 14 și 20, ipoteza nulă este aceeași, iar cele alternative sunt diferite. Prin urmare, în condițiile din Exemplul 14, ar trebui aplicate metode bazate pe criteriile bunătății de potrivire cu o familie parametrică (de tipul Kolmogorov sau de tip omega-pătrat), iar în condițiile din Exemplul 20, metode bazate pe la testul Studentului sau la criteriul Cramer-Welch. Dacă, în condițiile Exemplului 14, se folosește testul t al Studentului, atunci el nu va rezolva sarcinile atribuite. Dacă, în condițiile din Exemplul 20, folosim testul bunătății de potrivire de tip Kolmogorov, atunci, dimpotrivă, va rezolva problemele ridicate, deși, probabil, mai rău decât testul t al Studentului special adaptat pentru acest lucru caz.

Atunci când prelucrați date reale, alegerea corectă a ipotezelor este de o mare importanță. H 0 și H 1. Ipotezele asumate, de exemplu, distribuția normală, trebuie justificate cu atenție, în special prin metode statistice. Rețineți că în majoritatea covârșitoare a formulărilor specifice aplicate, distribuția rezultatelor observației este diferită de cea normală.

O situație apare adesea când forma ipotezei nule rezultă din formularea unei probleme aplicate, dar forma ipotezei alternative nu este clară. În astfel de cazuri, ar trebui să se ia în considerare o ipoteză alternativă de tipul cel mai general și să se utilizeze metode care rezolvă problema pusă pentru tot posibilul H 1. În special, atunci când se testează ipoteza 2 (din lista de mai sus) ca zero, ar trebui să se utilizeze ca ipoteză alternativă H 1 din Exemplul 14 și nu din Exemplul 20, dacă nu există o justificare specială pentru normalitatea distribuției rezultatelor observației în ipoteza alternativă.

Anterior

Pe baza datelor colectate în studii statistice, după prelucrarea lor, se trag concluzii despre fenomenele studiate. Aceste concluzii sunt făcute prin prezentarea și testarea ipotezelor statistice.

Ipoteza statistică se numește orice afirmație despre forma sau proprietățile distribuției variabilelor aleatorii observate experimental. Ipotezele statistice sunt testate prin metode statistice.

Se numește ipoteza de testat principal (zero)și notat H 0. Pe lângă zero, există și ipoteză alternativă (concurentă) H 1, negând principalul . Astfel, ca urmare a testării, una și numai una dintre ipoteze va fi acceptată. , iar al doilea va fi respins.

Tipuri de erori... Ipoteza prezentată este testată pe baza unui studiu al unui eșantion obținut de la populația generală. Datorită randomității eșantionului, validarea nu duce întotdeauna la concluzia corectă. În acest caz, pot apărea următoarele situații:
1. Principala ipoteză este corectă și acceptată.
2. Principala ipoteză este corectă, dar este respinsă.
3. Ipoteza principală este incorectă și este respinsă.
4. Principala ipoteză nu este corectă, dar este acceptată.
În cazul 2, se vorbește despre eroare de primul fel, în ultimul caz despre care vorbim eroare de al doilea fel.
Astfel, pentru unele eșantioane, se ia decizia corectă, iar pentru altele, cea greșită. Decizia este luată de valoarea unei funcții de eșantionare, numită caracteristici statistice, criteriu statistic sau pur și simplu statistici... Setul de valori pentru această statistică poate fi împărțit în două subseturi disjuncte:

  • H 0 este acceptat (nu respins), apelat zona de acceptare a ipotezelor (zona fezabilă);
  • un subset al valorilor statistice pentru care ipoteza H 0 este respins (respins) și ipoteza este acceptată H 1 se numește zona critică.

Concluzii:

  1. Criteriu este o variabilă aleatorie K care vă permite să acceptați sau să respingeți ipoteza nulă H0.
  2. La testarea ipotezelor, pot fi comise erori de 2 genuri.
    Eroare de primul fel este că ipoteza va fi respinsă H 0 dacă este corect („sări peste țintă”). Probabilitatea de a face o greșeală de primul fel este notată cu α și se numește nivel de semnificație... Cel mai adesea în practică, se presupune că α = 0,05 sau α = 0,01.
    Eroare de tip II este că ipoteza H0 este acceptată dacă este incorectă („fals pozitiv”). Probabilitatea unei astfel de erori este notată cu β.

Clasificarea ipotezelor

Principala ipoteză H 0 despre valoarea parametrului necunoscut q al distribuției arată de obicei astfel:
H 0: q = q 0.
Ipoteza concurentă H 1 poate avea astfel următoarea formă:
H 1: q < q 0 , H 1: q> q 0 sau H 1: qq 0 .
În consecință, se dovedește stânga, dreapta sau bilateral zone critice. Punctele limită ale regiunilor critice ( puncte critice) sunt determinate din tabelele de distribuție ale statisticilor corespunzătoare.

Când testați o ipoteză, este prudent să reduceți probabilitatea de a lua decizii proaste. Toleranță de eroare de tip I. de obicei notate Ași a sunat nivel de semnificație... Valoarea sa este de obicei mică ( 0,1, 0,05, 0,01, 0,001 ...). Dar o scădere a probabilității unei erori de tip I duce la o creștere a probabilității unei erori de tip II ( b), adică dorința de a accepta doar ipoteze corecte determină o creștere a numărului de ipoteze corecte respinse. Prin urmare, alegerea nivelului de semnificație este determinată de importanța problemei ridicate și de gravitatea consecințelor unei decizii incorecte.
Testarea statistică a ipotezelor constă din pașii următori:
1) definirea ipotezelor H 0 și H 1 ;
2) selectarea statisticilor și stabilirea nivelului de semnificație;
3) determinarea punctelor critice K crși zona critică;
4) calculul valorii statistice din eșantion Pentru a ex;
5) compararea valorii statistice cu zona critică ( K crși Pentru a ex);
6) luarea deciziilor: dacă valoarea statisticilor nu este inclusă în zona critică, atunci se acceptă ipoteza H 0 și ipoteza este respinsă H 1, iar dacă intră în regiunea critică, atunci ipoteza este respinsă H 0 și ipoteza este acceptată H 1. În același timp, rezultatele testării ipotezei statistice ar trebui interpretate după cum urmează: dacă ipoteza este acceptată H 1 , atunci poate fi considerat dovedit și dacă ipoteza este acceptată H 0 , apoi s-a recunoscut că nu contrazice rezultatele observațiilor, însă această proprietate, împreună cu H 0 poate avea și alte ipoteze.

Clasificarea testelor de ipoteză

Să luăm acum în considerare mai multe ipoteze statistice diferite și mecanisme pentru a le testa.
Eu) Ipoteza despre media generală a distribuției normale cu varianță necunoscută. Presupunem că populația generală are o distribuție normală, media și varianța acesteia sunt necunoscute, dar există motive să credem că media generală este egală cu a. La nivelul de semnificație α, ipoteza ar trebui testată H 0: x = a. Ca alternativă, poate fi utilizată una dintre cele trei ipoteze discutate mai sus. În acest caz, statisticile sunt o variabilă aleatorie având o distribuție Student cu n- 1 grad de libertate. Se determină valoarea experimentală (observată) corespunzătoare t ex t cr H 1: x> a se găsește în funcție de nivelul de semnificație α și de numărul de grade de libertate n- 1. Dacă t ex < t cr H 1: x ≠ a, valoarea critică se găsește în funcție de nivelul de semnificație α / 2 și același număr de grade de libertate. Ipoteza nulă este acceptată dacă | t ex | II) Ipoteza egalității a două valori medii ale populațiilor generale distribuite aleatoriu (probe mari independente). La nivelul de semnificație α, ipoteza ar trebui testată H 0: x ≠ y. Dacă dimensiunea ambelor eșantioane este mare, atunci putem presupune că eșantionul înseamnă o distribuție normală, iar variațiile lor sunt cunoscute. În acest caz, o variabilă aleatorie poate fi utilizată ca statistici
,
având o distribuție normală și M(Z) = 0, D(Z) = 1. Se determină valoarea experimentală corespunzătoare z ex... Valoarea critică se găsește din tabelul de funcții Laplace z cr... Sub o ipoteză alternativă H 1: x> y se găsește din afecțiune F(z cr) = 0,5 – A... Dacă z ex< z кр , atunci se acceptă ipoteza nulă, altfel este respinsă. Sub o ipoteză alternativă H 1: x ≠ y valoarea critică se găsește din condiție F(z cr) = 0,5 × (1 - A). Ipoteza nulă este acceptată dacă | z ex |< z кр .

III) Ipoteza despre egalitatea a două valori medii ale populațiilor generale distribuite în mod normal, ale căror varianțe sunt necunoscute și aceleași (mici eșantioane independente). La nivelul de semnificație α, ar trebui testată ipoteza principală H 0: x = y. Ca statistică, folosim o variabilă aleatorie
,
având o distribuție Student cu ( n x + n la- 2) grade de libertate. Se determină valoarea experimentală corespunzătoare t ex... Din tabelul punctelor critice ale distribuției studentului, se găsește valoarea critică t cr... Totul este rezolvat similar ipotezei (I).

IV) Conjectura asupra egalității a două varianțe ale populațiilor generale distribuite în mod normal... În acest caz, la nivel de semnificație A trebuie să testez ipoteza H 0: D(NS) = D(Da). Statistica este o variabilă aleatorie cu distribuția Fisher - Snedecor cu f 1 = n b- 1 și f 2 = n m- 1 grade de libertate (S 2 b - varianță mare, volumul eșantionului său n b). Se determină valoarea experimentală (observată) corespunzătoare F ex... Valoare critica F cr sub o ipoteză alternativă H 1: D(NS) > D(Da) se găsește din tabelul punctelor critice ale distribuției Fisher - Snedecor după nivelul de semnificație Ași numărul de grade de libertate f 1 și f 2. Ipoteza nulă este acceptată dacă F ex < F cr.

Instrucțiuni. Pentru calcul, trebuie să specificați dimensiunea datelor sursă.

V) Ipoteza egalității mai multor varianțe ale populațiilor generale distribuite în mod normal asupra eșantioanelor de aceeași dimensiune. În acest caz, la nivel de semnificație A trebuie să testez ipoteza H 0: D(NS 1) = D(NS 2) = …= D(X l). Statistica este o variabilă aleatorie cu o distribuție Kochren cu grade de libertate f = n- 1 și l (n - mărimea fiecărui eșantion, l Este numărul de probe). Această ipoteză este testată în același mod ca și cea precedentă. Se utilizează un tabel cu punctele critice ale distribuției Cochren.

Vi) Ipoteza despre importanța corelației.În acest caz, la nivel de semnificație A trebuie să testez ipoteza H 0: r= 0. (Dacă coeficientul de corelație este zero, atunci valorile corespunzătoare nu sunt legate între ele). Statistica în acest caz este o variabilă aleatorie
,
având o distribuție Student cu f = n- 2 grade de libertate. Această ipoteză este testată la fel ca ipoteza (I).

Instrucțiuni. Indicați cantitatea de date sursă.

Vii) Ipoteza despre semnificația probabilității de apariție a unui eveniment. Un număr destul de mare de n procese independente în care evenimentul A a avut loc m o singura data. Există motive să credem că probabilitatea producerii acestui eveniment într-un test este p 0... Necesar la nivel de semnificație A testați ipoteza că probabilitatea unui eveniment A este egal cu probabilitatea ipotetică p 0... (Deoarece probabilitatea este estimată de frecvența relativă, ipoteza testată poate fi formulată într-un alt mod: dacă frecvența relativă observată și probabilitatea ipotetică diferă semnificativ sau nu).
Numărul de încercări este suficient de mare, deci frecvența relativă a evenimentului A distribuite conform legii normale. Dacă ipoteza nulă este adevărată, atunci așteptarea ei matematică este p 0, și varianța. În conformitate cu aceasta, ca statistică, alegem o variabilă aleatorie
,
care se distribuie aproximativ conform legii normale cu zero așteptare matematică și varianță unitară. Această ipoteză este testată exact în același mod ca și în cazul (I).

Instrucțiuni. Pentru calcul, trebuie să completați datele inițiale.

În diferite etape ale cercetării și modelării statistice, devine necesară formularea și verificarea experimentală a unor ipoteze (ipoteze) cu privire la natura și amploarea parametrilor necunoscuți ai populației generale analizate (populații). De exemplu, un cercetător face o presupunere: „eșantionul este extras dintr-o populație generală normală” sau „media generală a populației analizate este de cinci”. Astfel de ipoteze sunt numite ipoteze statistice.

Compararea ipotezei enunțate cu privire la populația generală cu datele eșantionului disponibile, însoțită de o evaluare cantitativă a gradului de fiabilitate a concluziei obținute, se realizează utilizând unul sau alt criteriu statistic și se numește testarea statistică a ipotezelor .

Ipoteza prezentată se numește zero (principal) ... Este obișnuit să o denotăm H 0.

În raport cu ipoteza afirmată (principală), se poate formula întotdeauna alternativă (concurentă) contrazicându-l. De obicei se notează o ipoteză alternativă (concurentă) H 1.

Scopul testării ipotezei statistice este de a lua o decizie cu privire la validitatea ipotezei principale pe baza datelor eșantionului H 0.

Dacă ipoteza prezentată se reduce la afirmația că valoarea unui parametru necunoscut al populației generale exact egal valoare dată, atunci se numește această ipoteză simplu, de exemplu: „venitul mediu total pe cap de locuitor al populației din Rusia este de 650 de ruble pe lună”; „Rata șomajului (ponderea șomerilor în populația activă din punct de vedere economic) în Rusia este de 9%”. În alte cazuri, ipoteza este numită complicat.

Ca ipoteză nulă H 0 este obișnuit să propunem o ipoteză simplă, deoarece de obicei este mai convenabil să verificați afirmația mai strictă.

Ipoteze despre forma legii distribuției variabilei aleatorii investigate;

Ipoteze despre valorile numerice ale parametrilor populației generale studiate;

Ipoteze despre omogenitatea a două sau mai multe probe sau a unor caracteristici ale populațiilor analizate;

Ipoteze despre forma generală a modelului care descrie relația statistică dintre trăsături etc.

Deoarece ipotezele statistice sunt testate pe baza datelor eșantionului, adică număr limitat de observații, decizii privind ipoteza nulă H 0 sunt de natură probabilistică. Cu alte cuvinte, o astfel de decizie este inevitabil însoțită de o anumită probabilitate, deși posibil foarte mică, a unei concluzii eronate în ambele direcții.



Deci, într-o mică parte din cazuri α ipoteza nulă H 0 poate fi respins, atunci când, de fapt, în populația generală este corect. Această greșeală se numește eroare de primul fel ... Și probabilitatea sa este de obicei numită nivel de semnificație și desemnează α .

Dimpotrivă, într-o mică parte din cazuri β ipoteza nulă H 0 este acceptat, în timp ce în populația generală este eronat, iar ipoteza alternativă este valabilă H 1... Această greșeală se numește eroare de al doilea fel ... Probabilitatea unei erori de tip II este de obicei notată β ... Probabilitate 1 - β sunt numite puterea criteriului .

Cu o dimensiune fixă ​​a eșantionului, puteți alege la discreția dvs. valoarea probabilității unei singure erori α sau β ... O creștere a probabilității uneia dintre ele duce la o scădere a celeilalte. Este obișnuit să setați probabilitatea unei erori de primul fel α - nivelul de semnificație. De regulă, se utilizează unele valori standard ale nivelului de semnificație. α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Apoi, evident, din două criterii caracterizate de aceeași probabilitate α respinge o ipoteză validă H 0, cel cu cea mai mică eroare de tip II ar trebui acceptat β , adică mai multă putere. Reducerea probabilităților ambelor erori α și β poate fi realizat prin mărirea dimensiunii eșantionului.

Soluție corectă cu privire la ipoteza nulă H 0 poate fi, de asemenea, de două tipuri:

Ipoteza nulă va fi acceptată H 0, întrucât, de fapt, în populația generală, ipoteza nulă este adevărată H 0; probabilitatea unei astfel de decizii 1 - α;

Ipoteza nulă H 0 va fi respins în favoarea unei alternative H 1,întrucât, de fapt, în populația generală, ipoteza nulă H 0 se abate în favoarea unei alternative H 1; probabilitatea unei astfel de decizii 1 - β este puterea criteriului.

Rezultatele rezolvării ipotezei nule pot fi ilustrate folosind Tabelul 8.1.

Tabelul 8.1

Ipotezele statistice sunt testate folosind criteriu statistic(să o numim în formă generală LA), care este o funcție a rezultatelor observației.

Criteriul statistic este o regulă (formulă) prin care se determină măsura discrepanței dintre rezultatele unei observații eșantion și ipoteza declarată H 0.

Un criteriu statistic, ca orice funcție a rezultatelor observației, este o variabilă aleatorie și sub ipoteza validității ipotezei nule H 0 este supus unor legi de distribuție teoretice bine studiate (și tabelate) cu densitate de distribuție f (k).

Alegerea unui criteriu pentru testarea ipotezelor statistice poate fi efectuată pe baza diferitelor principii. De cele mai multe ori se folosesc raportul de probabilitate, care vă permite să construiți cel mai puternic criteriu dintre toate criteriile posibile. Esența sa se rezumă la alegerea unui astfel de criteriu LA cu o funcție de densitate cunoscută f (k) sub rezerva validității ipotezei H 0, astfel încât la un anumit nivel de semnificație α ar putea găsi punctul de răsturnare K cr.distribuirea f (k), care ar împărți gama de valori ale criteriului în două părți: gama de valori acceptabile, în care rezultatele unei observații eșantionate par cele mai plauzibile și o regiune critică, în care rezultatele unei observații eșantion arată mai puțin plauzibilă în raport cu ipoteza nulă H 0.

Dacă un astfel de criteriu LA este selectată, iar densitatea distribuției sale este cunoscută, atunci sarcina de a testa ipoteza statistică este redusă la faptul că la un anumit nivel de semnificație α calculați valoarea observată a criteriului pe baza datelor eșantionului K obl.și stabiliți dacă este cel mai mult sau mai puțin plauzibil în raport cu ipoteza nulă H 0.

Fiecare tip de ipoteză statistică este testat folosind criteriul adecvat, care este cel mai puternic în fiecare caz. De exemplu, testarea ipotezei cu privire la forma legii de distribuție a unei variabile aleatorii poate fi efectuată folosind testul bunătății de potrivire a Pearson χ 2; testarea ipotezei despre egalitatea valorilor necunoscute ale varianțelor a două populații generale - folosind criteriul F- Fisher; o serie de ipoteze despre valori necunoscute ale parametrilor populațiilor generale sunt testate folosind criteriul Z- variabilă normală distribuită și criteriu aleatoriu T- T student, etc.

Se numește valoarea criteriului, calculată conform regulilor speciale bazate pe datele eșantionului valoarea criteriului observat (K obl.).

Valorile criteriilor care împart setul valorilor criteriilor în gama de valori valabile(cel mai plauzibil în raport cu ipoteza nulă H 0) și zona critică(intervalul de valori mai puțin plauzibil în raport cu tabelele de distribuție ale unei variabile aleatorii LA selectate ca criteriu sunt numite puncte critice (K cr.).

Aria valorilor admisibile (aria de acceptare a ipotezei nule H 0) LA H 0 nu se abate.

O zonă critică este ansamblul valorilor criteriului LA pentru care ipoteza nulă H 0 deviază în favoarea unui concurent H 1 .

Distinge unilateral(dreptaci sau stângaci) și zone critice bilaterale.

Dacă ipoteza concurentă este dreaptă, de exemplu, H 1: a> a 0, atunci regiunea critică este dreapta(Figura 1). Cu ipoteza concurentă dreaptă, punctul critic (K roșu pe partea dreaptă) ia valori pozitive.

Dacă ipoteza concurentă este de stânga, de exemplu, H 1: a< а 0 , atunci regiunea critică este stânga(Figura 2). Cu o ipoteză concurentă din partea stângă, punctul critic ia valori negative (Spre roșu. Partea stângă).

Dacă ipoteza concurentă este bilaterală, de exemplu, H 1: a¹ un 0, atunci regiunea critică este bilateral(Figura 3). Cu o ipoteză concurentă pe două fețe, se determină două puncte critice (Roșu pe partea stângăși Pentru a cr. dreapta).


Gama de admisibilitate Critică

zona valorilor