Seminaro tema: atranka sociologiniuose tyrimuose Pagrindinės sąvokos. Reprezentatyvus pavyzdys Imtis ir bendra populiacija

Statistiniai tyrimai yra labai sunkūs ir brangūs, todėl kilo mintis nuolatinį stebėjimą pakeisti atrankiniu.

Pagrindinis nepertraukiamo stebėjimo tikslas yra gauti ištirtos statistinės populiacijos charakteristikas tiriamai jos daliai.

Selektyvus stebėjimas- Tai statistinių tyrimų metodas, kai apibendrinti populiacijos rodikliai nustatomi tik atskirai daliai, remiantis atsitiktinės atrankos nuostatomis.

Taikant atrankos metodą, tiriama tik tam tikra tirtos populiacijos dalis, o tiriama statistinė populiacija vadinama bendrąja populiacija.

Imties populiacija arba tiesiog mėginys gali būti vadinama vienetų dalimi, pasirinkta iš bendros populiacijos, kuriai bus atliekami statistiniai tyrimai.

Atrankos metodo vertė: kai tiriamas minimalus vienetų skaičius, statistinis tyrimas bus atliktas per trumpesnį laiką ir mažiausiomis lėšomis bei darbo sąnaudomis.

Bendroje populiacijoje vienetų, turinčių tiriamą bruožą, dalis vadinama bendrąja proporcija (žymima R), o tiriamojo kintamojo charakteristikos vidutinė vertė yra bendras vidurkis (žymimas NS).

Imties populiacijoje tiriamo požymio dalis vadinama imties dalimi arba dalimi (žymima w), vidutinė imties vertė imties vidurkis.

Jei tyrimo metu bus laikomasi visų jo mokslinės organizacijos taisyklių, tada atrankos metodas duos gana tikslius rezultatus, todėl patartina šį metodą naudoti nuolatinio stebėjimo duomenims patikrinti.

Šis metodas tapo plačiai paplitęs valstybinėje ir ne departamentų statistikoje, nes tiriant minimalų tirtų vienetų skaičių, jis leidžia atlikti išsamų ir tikslų tyrimą.

Tirtą statistinę populiaciją sudaro vienetai, turintys skirtingas charakteristikas. Imties populiacijos sudėtis gali skirtis nuo bendros populiacijos sudėties; šis neatitikimas tarp imties ir bendros populiacijos savybių yra atrankos klaida.

Atrankos stebėjimui būdingos klaidos apibūdina neatitikimo tarp imties stebėjimo duomenų ir visos populiacijos dydį. Klaidos, atsirandančios imant atranką, vadinamos reprezentatyvumo klaidomis ir skirstomos į atsitiktines ir sistemines.

Jei imties populiacija tiksliai neatkuria visos populiacijos dėl nenutrūkstamo stebėjimo pobūdžio, tai vadinama atsitiktinėmis klaidomis, o jų dydžiai nustatomi pakankamai tiksliai, remiantis didelių skaičių dėsniu ir tikimybės teorija.

Sisteminės klaidos atsiranda pažeidžiant atsitiktinumo principą renkantis populiacijos vienetus stebėjimui.

2. Atrankos tipai ir schemos

Atrankos klaidos dydis ir jos nustatymo metodai priklauso nuo atrankos tipo ir schemos.

Yra keturi stebėjimo vienetų rinkinio atrankos tipai:

1) atsitiktinis;

2) mechaninis;

3) tipiškas;

4) serijinis (įdėtas).

Atsitiktinis mėginių ėmimas- labiausiai paplitęs atsitiktinės imties atrankos metodas, jis dar vadinamas burtų traukimo metodu, kai kiekvienam statistinės populiacijos vienetui yra parengiamas bilietas su eilės numeriu.

Be to, atsitiktinai parenkamas reikiamas statistinės populiacijos vienetų skaičius. Esant tokioms sąlygoms, kiekviena iš jų turi tą pačią tikimybę patekti į imtį, pavyzdžiui, laimėjimų traukimas, kai tam tikra skaičių dalis, į kurią patenka laimėjimas, atsitiktine tvarka parenkama iš bendro išduotų bilietų skaičiaus. Tuo pačiu metu visiems numeriams suteikiama vienoda galimybė patekti į imtį.

Mechaninis pasirinkimas- tai metodas, kai visa populiacija pagal atsitiktinį kriterijų yra suskirstyta į vienalytės apimties grupes, tada iš kiekvienos grupės paimamas tik vienas vienetas. Visi tiriamos statistinės populiacijos vienetai yra iš anksto išdėstyti tam tikra tvarka, tačiau priklausomai nuo imties dydis, reikiamas vienetų skaičius mechaniškai parenkamas tam tikru intervalu ...

Įprastas pasirinkimas - Tai metodas, pagal kurį tiriama statistinė populiacija yra suskirstyta pagal reikšmingą, tipišką požymį į kokybiškai vienalytes, panašias grupes, tada iš kiekvienos šios grupės atsitiktine tvarka parenkamas tam tikras vienetų skaičius, proporcingas konkrečiam grupės svoriui. visoje populiacijoje.

Įprasta atranka suteikia tikslesnius rezultatus, nes į ją įtraukiami visų tipinių imties grupių atstovai.

Serijinis (įdėtas) pasirinkimas. Atrenkamos visos grupės (serijos, lizdai), atsitiktinai arba mechaniškai atrinktos. Kiekviena tokia grupė ir serija yra nuolat stebima, o rezultatai perduodami visai populiacijai.

Mėginių ėmimo tikslumas taip pat priklauso nuo atrankos schemos. Mėginių ėmimas gali būti atliekamas pagal pakartotinio ir nesikartojančio mėginių ėmimo schemą.

Pakartotinis pasirinkimas. Kiekvienas pasirinktas vienetas ar serija grąžinamas visai populiacijai ir gali būti grąžintas į mėginį.Tai yra vadinamoji grąžinto kamuolio schema.

Nekartojamas pasirinkimas. Kiekvienas tiriamas vienetas yra pašalinamas ir negrąžinamas į visumą, todėl jis nėra pakartotinai išnagrinėtas. Ši schema vadinama negrąžinamu kamuoliu.

Pakartotinis mėginių ėmimas duoda tikslesnius rezultatus, nes to paties imties dydžio atveju stebėjimas apima daugiau tirtos populiacijos vienetų.

Kombinuotas pasirinkimas gali pereiti vieną ar daugiau žingsnių. Mėginys vadinamas vienpakopiu, jei tiriami vieną kartą atrinkti populiacijos vienetai.

Mėginys vadinamas daugiapakopiu, jei populiacijos atranka vyksta etapais, vienas po kito einančiais etapais ir kiekvienas atrankos etapas turi savo atrankos vienetą.

Daugiafazė atranka - visuose atrankos etapuose išsaugomas tas pats atrankos vienetas, tačiau atliekami keli etapai, imties tyrimų etapai, kurie skiriasi tyrimo programos apimtimi ir imties dydžiu.

Bendrosios populiacijos ir imties populiacijos parametrų charakteristikos nurodomos šiais simboliais:

N- gyventojų skaičius;

n- imties dydis;

X- bendras vidurkis;

NS- imties vidurkis;

R- bendroji dalis;

w - atrankinė akcija;

2 - bendras dispersija (bruožo dispersija bendroje populiacijoje);

2 - tos pačios savybės imties dispersija;

? - standartinis nuokrypis bendroje populiacijoje;

? - standartinis nuokrypis imtyje.

3. Atrankos klaidos

Kiekvienas atrankos vienetas turi turėti lygias galimybes būti atrinktiems į kitus - tai yra atsitiktinės imties pagrindas.

Atsitiktinis mėginių ėmimas - Tai vienetų atranka iš visos populiacijos burtų keliu arba kitu panašiu būdu.

Atsitiktinumo principas yra tas, kad objekto įtraukimui ar pašalinimui iš mėginio negali turėti įtakos jokie kiti veiksniai, išskyrus atvejį.

Pavyzdžio dalis Ar imties vienetų skaičiaus ir bendros populiacijos vienetų skaičiaus santykis:


Tinkama atsitiktinė atranka gryna forma yra pirminė tarp visų kitų atrankos rūšių; ji apima ir įgyvendina pagrindinius atrankinio statistinio stebėjimo principus.

Du pagrindiniai apibendrinančių rodiklių tipai, naudojami atrankos metodu, yra vidutinė kiekybinės charakteristikos vertė ir santykinė alternatyvios charakteristikos vertė.

Imties dalis (w) arba konkreti yra nustatoma pagal vienetų, turinčių tiriamą savybę, skaičiaus santykį m,į bendrą imties vienetų skaičių (n):


Norint apibūdinti atrankos rodiklių patikimumą, išskiriamos vidutinės ir ribinės atrankos klaidos.

Atrankos klaida, dar vadinama reprezentatyvumo klaida, yra skirtumas tarp atitinkamų atrankos ir bendrųjų charakteristikų:

?x = | x - x |;

?w = | x - p |.

Atrankos klaida būdinga tik mėginių stebėjimams

Mėginio vidurkis ir mėginio dalis- tai atsitiktiniai kintamieji, kurių vertės skiriasi priklausomai nuo tiriamos statistinės populiacijos vienetų, kurie buvo įtraukti į imtį. Atitinkamai atrankos klaidos taip pat yra atsitiktinės vertės ir taip pat gali turėti skirtingas vertes. Todėl nustatomas galimų klaidų vidurkis - vidutinė atrankos paklaida.

Vidutinė atrankos klaida nustatoma pagal imties dydį: kuo didesnis skaičius, visi kiti dalykai yra lygūs, tuo mažesnė vidutinės atrankos klaidos vertė. Atliekant imties apklausą, apimantį vis daugiau bendros populiacijos vienetų, mes vis tiksliau apibūdiname visą populiaciją.

Vidutinė atrankos paklaida priklauso nuo tiriamo požymio variacijos laipsnio, savo ruožtu, variacijos laipsniui būdinga dispersija? 2 arba w (l - w)- už alternatyvią funkciją. Kuo mažiau požymio ir dispersijos variacijos, tuo mažesnė vidutinė atrankos klaida ir atvirkščiai.

Atsitiktiniam pakartotiniam imimui teoriškai vidutinės paklaidos apskaičiuojamos pagal šias formules:

1) vidutiniam kiekybiniam bruožui:


kur? 2 - vidutinė kiekybinio požymio dispersijos vertė.

2) už akciją (alternatyvi funkcija):


Taigi, kaip bruožo dispersija yra populiacijoje? 2 nėra tiksliai žinoma, praktiškai jie naudoja dispersijos S 2 vertę, apskaičiuotą imties populiacijai, remiantis didelių skaičių dėsniu, pagal kurį imties populiacija, kurios imties dydis yra pakankamai didelis, tiksliai atkuria bendros populiacijos.

Atsitiktinio pakartotinio mėginių ėmimo vidutinės atrankos paklaidos formulės yra tokios. Vidutinė kiekybinio požymio vertė: bendras dispersija pasirenkama taip:


kur S 2 yra dispersijos vertė.

Mechaninis mėginių ėmimas- tai vienetų atranka į imtį iš bendros populiacijos, kuri pagal neutralų kriterijų yra suskirstyta į lygias grupes; daroma taip, kad iš kiekvienos tokios grupės būtų parenkamas tik vienas vienetas.

Atliekant mechaninę atranką, tiriamos statistinės populiacijos vienetai preliminariai išdėstomi tam tikra tvarka, po to tam tikru intervalu mechaniškai parenkamas nurodytas vienetų skaičius. Be to, intervalo dydis bendroje populiacijoje yra lygus abipusiam imties daliai.

Esant pakankamai didelei populiacijai, mechaninis atranka pagal rezultatų tikslumą yra beveik atsitiktinė. Todėl, norint nustatyti vidutinę mechaninės atrankos paklaidą, naudojamos savaiminio atsitiktinio mėginių ėmimo formulės.

Norint pasirinkti vienetus iš nevienalytės populiacijos, naudojamas vadinamasis tipinis pavyzdys, jis naudojamas, kai visus bendrosios populiacijos vienetus galima suskirstyti į kelias kokybiškai vienalytes, panašias grupes pagal charakteristikas, nuo kurių priklauso tiriami rodikliai.

Tada kiekviena tipinė grupė individualiai atrenka vienetus į imties populiaciją atsitiktinai arba mechaniniu būdu.

Įprasta atranka paprastai naudojama tiriant sudėtingas statistines populiacijas.

Įprastas mėginių ėmimas suteikia tikslesnius rezultatus. Bendros populiacijos tipizavimas užtikrina tokios imties reprezentatyvumą, kiekvienos tipologinės grupės atstovavimą joje, o tai leidžia atmesti grupių dispersijos įtaką vidutinei atrankos paklaidai. Todėl, nustatant vidutinę tipinės imties klaidą, kaip variacijos rodiklis naudojamas grupės vidinių dispersijų vidurkis.

Serijinė atranka apima atsitiktinę atranką iš bendros vienodo dydžio grupių populiacijos, kad būtų galima stebėti visus vienetus tokiose grupėse.

Kadangi visi be išimties vienetai tiriami grupėse (serijose), vidutinė atrankos klaida (renkantis vienodo dydžio serijas) priklauso tik nuo grupių (serijų) dispersijos.

4. Imties rezultatų platinimo plačiajai visuomenei būdai

Galutinis imties stebėjimo tikslas yra bendros populiacijos apibūdinimas remiantis imties rezultatais.

Atrankos metodas naudojamas tam tikros imties rodikliams, skirtiems bendros populiacijos charakteristikoms gauti. Priklausomai nuo tyrimo tikslų, tai atliekama tiesiogiai perskaičiuojant imties rodiklius visai populiacijai arba taikant korekcijos koeficientų apskaičiavimo metodą.

Tiesioginio perskaičiavimo metodas yra tas, kad su juo imties dalies rodikliai w arba vidutinis NS taikomi visai populiacijai, atsižvelgiant į atrankos klaidą.

Korekcinių koeficientų metodas naudojamas, kai atrankos metodo tikslas yra išsiaiškinti visiškos apskaitos rezultatus. Šis metodas naudojamas patikslinti metinio gyventojų surašymo tarp gyventojų duomenis.

Statistinė populiacija- vienetų, turinčių masę, tipiškumą, kokybinį homogeniškumą ir kintamumą, rinkinys.

Statistinę populiaciją sudaro materialiai esami objektai (darbuotojai, įmonės, šalys, regionai), yra objektas.

Surinkimo vienetas- kiekvienas konkretus statistinės populiacijos vienetas.

Viena ir ta pati statistinė populiacija pagal vieną požymį gali būti vienalytė, o pagal kitą - nevienalytė.

Kokybinis vienodumas- visų gyventojų vienetų panašumas dėl tam tikrų priežasčių, o visų kitų - skirtumai.

Statistinėje populiacijoje skirtumai tarp vieno ir kito populiacijos vieneto dažnai yra kiekybinio pobūdžio. Skirtingų populiacijos vienetų charakteristikos verčių kiekybiniai pokyčiai vadinami variacijomis.

Funkcijos variacija- kiekybinis požymio pokytis (kiekybiniam požymiui) pereinant iš vieno populiacijos vieneto į kitą.

Ženklas Tai vienetų, objektų ir reiškinių savybė, charakteristika ar kita savybė, kurią galima stebėti ar išmatuoti. Ženklai skirstomi į kiekybinius ir kokybinius. Pavadinimo vertės įvairovė ir kintamumas atskirais populiacijos vienetais vadinamas variacija.

Atributinės (kokybinės) charakteristikos netinka skaitmeninei išraiškai (gyventojų sudėtis pagal lytį). Kiekybinės charakteristikos išreiškiamos skaičiais (populiacijos sudėtis pagal amžių).

Indeksas- tai kiekybiškai apibendrinanti kokybinė bet kurios vienetų ar visumos savybės ypatybė tam tikromis laiko ir vietos sąlygomis.

Rezultatų kortelė Tai rodiklių rinkinys, išsamiai atspindintis tiriamą reiškinį.

Pavyzdžiui, tiriamas atlyginimas:
  • Funkcija - darbo užmokestis
  • Statistinė populiacija - visi darbuotojai
  • Gyventojų vienetas - kiekvienas darbuotojas
  • Kokybinis homogeniškumas - sukauptas darbo užmokestis
  • Ženklo variacija - skaičių seka

Bendra populiacija ir jos pavyzdžiai

Pagrindas yra duomenų rinkinys, gautas matuojant vieną ar daugiau savybių. Faktiškai stebimas objektų rinkinys, statistiškai pateiktas daugybės atsitiktinio kintamojo stebėjimų, yra mėginių ėmimas ir hipotetiškai egzistuoja (spėjama) - bendros populiacijos... Bendra populiacija gali būti baigtinė (stebėjimų skaičius N = konst) arba begalinis ( N = ∞), o imtis iš bendros populiacijos visada yra riboto stebėjimų skaičiaus rezultatas. Stebėjimų, sudarančių mėginį, skaičius vadinamas imties dydis... Jei imties dydis yra pakankamai didelis ( n → ∞) imamas pavyzdys didelis kitaip jis vadinamas pavyzdžiu ribotas tūris... Mėginys laikomas mažas jei matuojant atsitiktinį vienmatį kintamąjį imties dydis neviršija 30 ( n<= 30 ), o matuojant kelis ( k) ypatybės daugiamatėje erdvėje, santykis nĮ k mažiau nei 10 (n / k< 10) ... Pavyzdžių formos variacijos diapazonas jei jos nariai yra eilinė statistika y., atsitiktinio kintamojo imties reikšmės NS surūšiuota didėjančia tvarka (reitinguojama), o funkcijos reikšmės vadinamos galimybės.

Pavyzdys... Beveik tas pats atsitiktinai parinktas objektų rinkinys - vieno Maskvos administracinio rajono komerciniai bankai gali būti laikomi imtimi iš visų šio rajono komercinių bankų gyventojų ir kaip pavyzdys iš visų Maskvos komercinių bankų gyventojų. , taip pat pavyzdys iš šalies komercinių bankų ir kt.

Pagrindiniai atrankos metodai

Statistinių išvadų patikimumas ir prasmingas rezultatų aiškinimas priklauso nuo to reprezentatyvumas mėginių ėmimas, t.y. visapusiškumas ir tinkamumas reprezentuoti bendrosios populiacijos savybes, dėl kurių šis pavyzdys gali būti laikomas tipišku. Gyventojų statistinių savybių tyrimą galima organizuoti dviem būdais: naudojant tęstinis ir nepertraukiamas. Nuolatinis stebėjimas numato visų apklausą vienetų studijavo agregatas, a nepertraukiamas (selektyvus) stebėjimas- tik jo dalys.

Yra penki pagrindiniai pavyzdžių stebėjimo organizavimo būdai:

1. paprastas atsitiktinis pasirinkimas, kurioje objektai atsitiktine tvarka išgaunami iš bendros objektų populiacijos (pavyzdžiui, naudojant lentelę ar atsitiktinių skaičių generatorių), o kiekvieno iš galimų pavyzdžių tikimybė yra vienoda. Tokie mėginiai vadinami tinkamas atsitiktinis;

2. lengvas pasirinkimas naudojant įprastą procedūrą atliekamas naudojant mechaninį komponentą (pavyzdžiui, datą, savaitės dieną, buto numerį, abėcėlės raidę ir kt.), ir tokiu būdu gauti mėginiai vadinami mechaninis;

3. sluoksniuotas atranka susideda iš to, kad bendra tūrio populiacija yra suskirstyta į tūrio pogrupius ar sluoksnius (sluoksnius) taip. Sluoksniai yra homogeniški objektai pagal statistines charakteristikas (pavyzdžiui, populiacija yra suskirstyta į sluoksnius pagal amžiaus grupes ar socialinę klasę; įmonės - pagal pramonę). Šiuo atveju mėginiai vadinami sluoksniuotas(kitaip, stratifikuotas, tipiškas, zonuotas);

4. metodai serijinis formavimui naudojama atranka serijinis arba įdėti mėginiai... Jie yra patogūs, jei reikia iš karto ištirti „bloką“ ar objektų seriją (pavyzdžiui, prekių siunta, tam tikros serijos gaminiai ar šalies teritorinio-administracinio padalinio gyventojai). Partijos gali būti atrenkamos visiškai atsitiktinai arba mechaniškai. Šiuo atveju atliekamas išsamus tam tikros prekių partijos arba viso teritorinio vieneto (gyvenamojo pastato ar kvartalo) tyrimas;

5. kartu(laipsniškai) atranka gali apimti kelis atrankos metodus vienu metu (pavyzdžiui, stratifikuotas ir atsitiktinis arba atsitiktinis ir mechaninis); toks pavyzdys vadinamas kartu.

Atrankos tipai

Iki protas atskirti individualią, grupinę ir kombinuotą atranką. At individualus pasirinkimas atrinkti atskiri bendros populiacijos vienetai, su grupės pasirinkimas- kokybiškai vienalytės vienetų grupės (serijos) ir kombinuotas pasirinkimas prisiima pirmojo ir antrojo tipų derinį.

Iki metodas atranka atskirti kartojasi ir nesikartoja pavyzdys.

Nepakartojama vadinama atranka, kai į imtį patekęs vienetas negrįžta į pradinę populiaciją ir nedalyvauja tolesnėje atrankoje; o vienetų skaičius bendroje populiacijoje N atrankos metu sumažėja. At kartojamas pasirinkimas pagautas imtyje vienetas po registracijos grąžinamas plačiajai visuomenei ir taip išlaiko lygias galimybes kartu su kitais vienetais būti naudojamas tolesnėje atrankos procedūroje; o vienetų skaičius bendroje populiacijoje N išlieka nepakitęs (metodas retai naudojamas socialiniuose ir ekonominiuose tyrimuose). Tačiau su dideliu N (N → ∞) formulės, skirtos nepakartojamas atranka artėja prie tų, kurioms skirta kartojamas pasirinkimas ir beveik dažnai naudojami pastarieji ( N = konst).

Pagrindinės bendrosios ir imties populiacijos parametrų charakteristikos

Statistinės tyrimo išvados yra pagrįstos atsitiktinio kintamojo pasiskirstymu, o stebėtos vertės (x 1, x 2, ..., x n) vadinami atsitiktinio kintamojo realizavimais NS(n yra imties dydis). Atsitiktinio kintamojo pasiskirstymas bendroje populiacijoje yra teorinis, idealus, o jo imties analogas yra empirinis paskirstymas. Kai kurie teoriniai skirstiniai pateikiami analitiškai, t.y. jų galimybės nustatykite pasiskirstymo funkcijos reikšmę kiekviename atsitiktinio kintamojo galimų verčių erdvės taške. Imties pasiskirstymo funkciją sunku nustatyti, o kartais ir neįmanoma galimybės yra apskaičiuojami pagal empirinius duomenis, o po to pakeičiami analitine išraiška, apibūdinančia teorinį pasiskirstymą. Šiuo atveju prielaida (arba hipotezė) apie pasiskirstymo tipą gali būti ir statistiškai teisingas, ir klaidingas. Bet kokiu atveju iš mėginio rekonstruotas empirinis pasiskirstymas tik apytiksliai apibūdina tikrąjį. Svarbiausi paskirstymo parametrai yra tikėtina vertė ir dispersija.

Iš prigimties paskirstymai yra tęstinis ir diskretus... Geriausiai žinomas nuolatinis paskirstymas yra normalus... Selektyvūs parametrų analogai ir jiems yra: vidutinė vertė ir empirinė dispersija. Tarp diskrečiųjų socialinių ir ekonominių tyrimų, dažniausiai naudojamas alternatyva (dichotominė) paskirstymas. Šio skirstinio matematinių lūkesčių parametras išreiškia santykinę vertę (arba Dalintis) populiacijos vienetai, turintys tiriamą požymį (jis pažymėtas raide); gyventojų dalis, kuri neturi šios savybės, žymima raide q (q = 1 - p)... Alternatyvaus pasiskirstymo dispersija taip pat turi empirinį analogą.

Pasiskirstymo parametrų charakteristikos apskaičiuojamos skirtingais būdais, priklausomai nuo pasiskirstymo tipo ir populiacijos vienetų parinkimo metodo. Pagrindiniai teorinio ir empirinio skirstinio variantai pateikti lentelėje. 1.

Mėginio k n dalis yra imties vienetų skaičiaus ir bendros populiacijos vienetų skaičiaus santykis:

k n = n / N.

Mėginio frakcija w Ar vienetų santykis su ištirta funkcija x iki imties dydžio n:

w = n n / n.

Pavyzdys. Prekių partijoje, kurioje yra 1000 vienetų, su 5% mėginiu mėginio frakcija k n absoliučia verte yra 50 vienetų. (n = N * 0,05); jei šiame pavyzdyje randami 2 sugedę produktai, tada selektyvių atliekų norma w bus 0,04 (w = 2/50 = 0,04 arba 4%).

Kadangi imties populiacija skiriasi nuo bendros populiacijos, tada atrankos klaidos.

1 lentelė. Pagrindiniai bendrosios ir imties populiacijos parametrai

Atrankos klaidos

Gali atsirasti bet kokių (tvirtų ir atrankinių) dviejų tipų klaidų: registracijos ir reprezentatyvumo. Klaidos Registracija gali turėti atsitiktinis ir sistemingas charakteris. Atsitiktinis klaidos susideda iš daugelio skirtingų nekontroliuojamų priežasčių, yra netyčinės ir dažniausiai subalansuoja viena kitą (pvz., prietaiso rodmenų pokyčiai, kai temperatūra svyruoja patalpoje).

Sistemingas klaidos yra tendencingos, nes jos pažeidžia mėginio objektų atrankos taisykles (pavyzdžiui, matavimų nuokrypiai keičiant matavimo prietaiso nustatymus).

Pavyzdys. Norint įvertinti miesto gyventojų socialinę padėtį, planuojama ištirti 25% šeimų. Jei tuo pačiu metu kas ketvirtas butas pasirenkamas atsižvelgiant į jo skaičių, kyla pavojus, kad bus pasirinkti visi tik vieno tipo butai (pavyzdžiui, vieno kambario butai), o tai sukels sistemingą klaidą ir iškraipys rezultatai; pageidautina pasirinkti buto numerį burtų keliu, nes klaida bus atsitiktinė.

Reprezentatyvios klaidos yra būdingi tik atrankiniam stebėjimui, jų negalima išvengti ir jie atsiranda dėl to, kad imtis nevisiškai atkuria bendrą populiaciją. Iš imties gautų rodiklių vertės skiriasi nuo tų pačių reikšmių rodiklių bendroje populiacijoje (arba gautos nuolat stebint).

Mėginio stebėjimo klaida yra skirtumas tarp parametro vertės bendrojoje populiacijoje ir jo imties vertės. Vidutinei kiekybinės charakteristikos vertei ji lygi :, o akcijai (alternatyvi charakteristika) -.

Atrankos klaidos būdingos tik mėginių stebėjimams. Kuo didesnės šios klaidos, tuo labiau empirinis skirstinys skiriasi nuo teorinio. Empirinio skirstinio parametrai yra atsitiktinės vertės, todėl atrankos klaidos taip pat yra atsitiktinės vertės, jos gali turėti skirtingas reikšmes skirtingiems mėginiams, todėl įprasta skaičiuoti vidutinė klaida.

Vidutinė atrankos klaida yra reikšmė, išreiškianti standartinį imties vidurkio nuokrypį nuo matematinių lūkesčių. Ši vertė, atsižvelgiant į atsitiktinės atrankos principą, visų pirma priklauso nuo imties dydžio ir požymio kitimo laipsnio: kuo didesnis ir mažesnis požymio kitimas (taigi ir vertė), tuo mažesnė vidutinė atrankos klaida. Bendros populiacijos ir imties populiacijos dispersijų santykis išreiškiamas formule:

tie. pakankamai didelių, galime manyti, kad. Vidutinė atrankos klaida rodo galimus imties populiacijos parametro nukrypimus nuo bendrosios populiacijos parametro. Lentelė 2 parodytos išraiškos, skirtos apskaičiuoti vidutinę atrankos paklaidą įvairiems stebėjimo organizavimo metodams.

2 lentelė. Vidutinė imties vidurkio paklaida (m) ir skirtingų tipų mėginių dalis

Kur yra tęstinės funkcijos grupės vidinių imties dispersijų vidurkis;

Akcijų grupėje skirtumų vidurkis;

- pasirinktų serijų skaičius, - bendras serijų skaičius;

,

kur yra -osios serijos vidurkis;

- bendras visos imties vidutinis tęstinumo požymis;

,

kur yra funkcijos dalis trečioje serijoje;

- bendra funkcijos dalis visoje imtyje.

Tačiau apie vidutinės paklaidos vertę galima spręsti tik esant tam tikrai tikimybei P (P ≤ 1). Lyapunovas A.M. įrodė, kad imties vidurkių pasiskirstymas, taigi ir jų nukrypimai nuo bendro vidurkio, pakankamai dideliam skaičiui maždaug atitinka įprastinio pasiskirstymo įstatymą, su sąlyga, kad bendros populiacijos vidurkis yra ribotas ir dispersija ribota.

Matematiškai šis teiginys apie vidurkį išreiškiamas taip:

ir trupmenai išraiška (1) bus tokia:

kur - yra ribinė atrankos klaida, kuris yra vidutinės atrankos klaidos kartotinis , o daugybos faktorius yra JAV pasiūlytas studento testas („pasitikėjimo koeficientas“). „Gosset“ (slapyvardis „Studentas“); skirtingų dydžių mėginių vertės saugomos specialioje lentelėje.

Funkcijos Ф (t) reikšmės kai kurioms t reikšmėms yra lygios:

Todėl išraišką (3) galima skaityti taip: su tikimybe P = 0,683 (68,3%) galima teigti, kad imties ir bendrojo vidurkio skirtumas neviršys vienos vidutinės paklaidos vertės m (t = 1), su tikimybe P = 0,954 (95,4%)- kad jis neviršys dviejų vidutinių klaidų vertės m (t = 2), su tikimybe P = 0,997 (99,7%)- neviršys trijų reikšmių m (t = 3). Taigi lemia tikimybė, kad šis skirtumas tris kartus viršys vidutinės klaidos vertę klaidos lygis ir nebėra 0,3% .

Lentelė 3 parodytos ribinės atrankos paklaidos apskaičiavimo formulės.

3 lentelė. Ribinė imties paklaida (D), lyginant su vidurkiu ir proporcija (p) skirtingiems mėginių stebėjimo tipams

Imties rezultatų paskirstymas visai populiacijai

Galutinis selektyvaus stebėjimo tikslas yra apibūdinti bendrą populiaciją. Mažo dydžio imčių atveju empiriniai parametrų įvertinimai (ir) gali žymiai nukrypti nuo jų tikrųjų reikšmių (ir). Todėl tampa būtina nustatyti ribas, per kurias tikrosios parametrų (ir) vertės yra (ir).

Pasitikėjimo intervalas bet kurio bendrosios populiacijos parametro θ vadinamas atsitiktiniu šio parametro verčių diapazonu, kurio tikimybė artima 1 ( patikimumas) yra tikroji šio parametro vertė.

Ribinė klaida mėginių ėmimas Δ leidžia nustatyti ribines gyventojų charakteristikų vertes ir jų charakteristikas pasitikėjimo intervalai kurie yra lygūs:

Esmė pasitikėjimo intervalas gautas atimant ribinė klaida iš imties vidurkio (dalis), o viršutinis - jį pridėjus.

Pasitikėjimo intervalas vidutiniškai ji naudoja ribinę atrankos paklaidą ir tam tikram patikimumo lygiui nustatoma pagal formulę:

Tai reiškia, kad esant tam tikrai tikimybei R, kuris vadinamas pasitikėjimo lygiu ir yra unikaliai nustatomas pagal vertę t, galima teigti, kad tikroji vidurkio vertė yra intervale nuo , o tikroji trupmenos vertė yra intervale nuo

Skaičiuojant trijų standartinių patikimumo lygių patikimumo intervalą P = 95%, P = 99% ir P = 99,9% reikšmę pasirenka. Programos priklausomai nuo laisvės laipsnių skaičiaus. Jei imties dydis yra pakankamai didelis, tada šias tikimybes atitinkančios vertės t yra lygūs: 1,96, 2,58 ir 3,29 ... Taigi ribinė atrankos klaida leidžia nustatyti ribines bendrosios populiacijos charakteristikų vertes ir jų patikimumo intervalus:

Atrankinio stebėjimo rezultatų paskirstymas plačiajai visuomenei atliekant socialinius ir ekonominius tyrimus turi savo ypatybes, nes tam reikia visų jo tipų ir grupių reprezentatyvumo išsamumo. Tokio paskirstymo galimybės pagrindas yra skaičiavimas santykinė klaida:

kur Δ % - santykinė ribinė atrankos paklaida; ,.

Yra du pagrindiniai metodai, kaip imties stebėjimą išplėsti visai populiacijai: tiesioginė konversija ir koeficientų metodas.

Esmė tiesioginis konvertavimas susideda iš imties vidurkio padauginimo !! \ overline (x) iš bendros populiacijos dydžio.

Pavyzdys... Tegul vidutinis mažylių skaičius mieste yra įvertinamas imties metodu ir yra asmuo. Jei mieste yra 1000 jaunų šeimų, tai reikiamų vietų skaičius savivaldybės lopšeliuose gaunamas padauginus šį vidurkį iš bendros populiacijos dydžio N = 1000, t.y. bus 1200 vietų.

Šansų metodas patartina naudoti tuo atveju, kai atliekamas atrankinis stebėjimas, siekiant patikslinti nuolatinio stebėjimo duomenis.

Šiuo atveju naudojama formulė:

kur visi kintamieji yra populiacijos dydis:

Reikalingas imties dydis

4 lentelė. Reikalingas imties dydis (n) įvairiems mėginių stebėjimo organizavimo tipams

Planuojant mėginio stebėjimą su iš anksto nustatyta leistinos atrankos paklaidos verte, būtina teisingai įvertinti reikiamą imties dydis... Ši apimtis gali būti nustatyta remiantis leistina imties stebėjimo paklaida, remiantis tam tikra tikimybe, kuri garantuoja leistiną klaidos lygio vertę (atsižvelgiant į stebėjimo organizavimo būdą). Reikiamo imties dydžio n nustatymo formules nesunku gauti tiesiogiai iš ribinės atrankos klaidos formulių. Taigi, iš ribinės klaidos išraiškos:

imties dydis yra tiesiogiai nustatomas n:

Ši formulė rodo, kad mažėjant ribinei atrankos klaidai Δ reikiamas imties dydis žymiai padidėja, o tai yra proporcinga Studento testo dispersijai ir kvadratui.

Tam tikram stebėjimo organizavimo metodui reikalingas imties dydis apskaičiuojamas pagal lentelėje pateiktas formules. 9.4.

Praktiniai skaičiavimo pavyzdžiai

1 pavyzdys. Nepertraukiamos kiekybinės charakteristikos vidurkio ir patikimumo intervalo apskaičiavimas.

Norėdamas įvertinti atsiskaitymo su kreditoriais greitį, bankas atsitiktine tvarka paėmė 10 mokėjimo dokumentų. Jų vertės pasirodė lygios (dienomis): 10; 3; 15; 15; 22; 7; aštuoni; 1; 19; dvidešimt.

Būtina su tikimybe P = 0,954 nustatyti ribinę paklaidą Δ imties vidurkis ir patikimumo ribos vidutiniam skaičiavimo laikui.

Sprendimas. Vidutinė vertė apskaičiuojama pagal formulę iš lentelės. 9.1 mėginiui

Dispersija apskaičiuojama pagal formulę iš lentelės. 9.1.

Vidutinė dienos kvadrato klaida.

Vidutinė klaida apskaičiuojama pagal formulę:

tie. vidurkis yra x ± m = 12,0 ± 2,3 dienos.

Vidurio patikimumas buvo

Apribojimo paklaida apskaičiuojama pagal formulę iš lentelės. 9.3 pakartotinei atrankai, nes populiacijos dydis nežinomas, ir P = 0,954 pasitikėjimo lygis.

Taigi, vidutinė vertė yra lygi `x ± D =` x ± 2m = 12,0 ± 4,6, t.y. tikroji jo vertė svyruoja nuo 7,4 iki 16,6 dienų.

Naudojant studento lentelę. Programa leidžia daryti išvadą, kad n = 10 - 1 = 9 laisvės laipsnių atveju gauta vertė yra patikima, o jos reikšmingumo lygis yra 0,001 svaro sterlingų, t. gauta vidutinė reikšmė labai skiriasi nuo 0.

2 pavyzdys. Tikimybės įvertinimas (bendroji dalis) p.

Taikant mechaninį 1000 šeimų socialinės padėties tyrimo metodą, paaiškėjo, kad mažas pajamas gaunančių šeimų dalis w = 0,3 (30%)(pavyzdys buvo 2% , t.y. n / N = 0,02). Reikia su pasitikėjimo lygiu p = 0,997 nustatyti rodiklį R mažas pajamas gaunančios šeimos visame regione.

Sprendimas. Pagal pateiktas funkcijos vertes Ф (t) rasti tam tikrą pasitikėjimo lygį P = 0,997 reikšmę t = 3(žr. 3 formulę). Ribinė dalijimosi klaida w nustatoma pagal formulę iš lentelės. 9.3 nesikartojančių mėginių ėmimui (mechaninis mėginių ėmimas visada nesikartojantis):

Ribinė santykinės atrankos klaida % bus:

Regiono mažas pajamas gaunančių šeimų tikimybė (bendra dalis) bus p = w ± Δ w, o pasitikėjimo ribos p apskaičiuojamos remiantis dviguba nelygybe:

w - Δ w ≤ p ≤ w - Δ w, t.y. tikroji p vertė yra:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Taigi, esant 0,997 tikimybei, galima teigti, kad mažas pajamas gaunančių šeimų dalis tarp visų regiono šeimų svyruoja nuo 28,6% iki 31,4%.

3 pavyzdys. Atskiros funkcijos, nurodytos intervalo eilute, vidurkio ir patikimumo intervalo apskaičiavimas.

Lentelė 5. buvo nustatytas užsakymų dėl užsakymų paskirstymas pagal jų vykdymo laiką.

5 lentelė. Stebėjimų pasiskirstymas pagal įvykio laiką

Sprendimas. Vidutinis pristatymo laikas apskaičiuojamas pagal formulę:

Vidutinis laikotarpis bus:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 mėnesio.

Tą patį atsakymą gauname, jei p i duomenis naudojame iš priešpaskutinio lentelės stulpelio. 9.5, naudojant formulę:

Atkreipkite dėmesį, kad paskutinės gradacijos intervalo vidurys randamas dirbtinai papildant jį ankstesnės gradacijos intervalo pločiu, lygiu 60 - 36 = 24 mėnesiai.

Dispersija apskaičiuojama pagal formulę

kur x i- intervalo eilutės vidurys.

Todėl !! \ sigma = \ frac (20 ^ 2 + 14 ^ 2 + 1 + 25 ^ 2 + 49 ^ 2) (4) ir vidutinio kvadrato paklaida.

Vidutinė klaida apskaičiuojama naudojant mėnesio formulę, t.y. vidurkis yra !! \ overline (x) ± m = 23,1 ± 13,4.

Apribojimo paklaida apskaičiuojama pagal formulę iš lentelės. 9.3 pakartotinei atrankai, nes populiacijos dydis nežinomas, esant 0,954 patikimumo lygiui:

Taigi vidurkis yra:

tie. tikroji jo vertė svyruoja nuo 0 iki 50 mėnesių.

4 pavyzdys. Norint nustatyti atsiskaitymo greitį su N = 500 korporacijos įmonių kreditoriais komerciniame banke, būtina atlikti pavyzdinį tyrimą atsitiktinės atrankos būdu. Nustatykite reikiamą imties dydį n, kad, esant tikimybei P = 0,954, imties vidurkio paklaida neviršytų 3 dienų, jei bandomieji įvertinimai parodė, kad standartinis nuokrypis s buvo 10 dienų.

Sprendimas... Norėdami nustatyti būtinų tyrimų skaičių n, naudosime pakartotinio pasirinkimo iš lentelės formulę. 9.4:

Jame t reikšmė nustatoma iš patikimumo lygio P = 0,954. Jis lygus 2. Vidutinis kvadratas s = 10, bendrosios populiacijos dydis yra N = 500, o vidurkio ribinė paklaida yra Δ x = 3. Pakeisdami šias reikšmes į formulę, gauname:

tie. pakanka sudaryti 41 įmonės pavyzdį, kad būtų galima įvertinti reikiamą parametrą - atsiskaitymų su kreditoriais greitį.

Pavyzdys - tai yra:

1) tų tyrimo objekto elementų, kurie bus tiesiogiai tiriami, visuma;

2) tyrimo objekto elementų parinkimo metodai ir procedūros.

Bendra populiacija - visas objektų rinkinys, susijęs su tiriama problema. Sociologiniuose tyrimuose kaip G.S. dažniausiai yra atskiri asmenys - gyventojai (miestai, šalys ir kt.), socialinė grupė (jaunimas, bedarbiai, verslininkai ir kt.), žiniasklaidos auditorija (KVS) ir kt. Tačiau daugeliu atvejų , GS ... gali sudaryti didesni elementai (objektai) - šeimos (namų ūkiai), akademinės grupės, įmonės, religinės bendruomenės, atskiros gyvenvietės ar valstybės ir kt.

Pavyzdinė populiacija - dalis objektų iš bendros populiacijos, atrinkti tyrimui, siekiant padaryti išvadą apie visą populiaciją.

Kad išvada, gauta tiriant imtį, būtų išplėsta visai visuomenei, imtis turi turėti reprezentatyvumo savybę.

Reprezentatyvumas Ar imties gebėjimas atstovauti tikslinei populiacijai. Kuo tiksliau imties sudėtis atspindi populiaciją tiriamais klausimais, tuo didesnė jos reprezentatyvumas.

PAVYZDYS: Reprezentatyvumą galima iliustruoti tokiu pavyzdžiu. Tarkime, visi gyventojai yra mokyklos mokiniai (600 žmonių iš 20 klasių, 30 žmonių kiekvienoje klasėje). Tyrimo objektas - požiūris į rūkymą. 60 aukštųjų mokyklų moksleivių pavyzdys yra daug mažiau reprezentatyvus gyventojams nei tų pačių 60 mokinių pavyzdys, kuriame bus 3 mokiniai iš kiekvienos klasės. Pagrindinė to priežastis yra nevienodas amžiaus pasiskirstymas klasėse. Vadinasi, pirmuoju atveju imties reprezentatyvumas yra žemas, o antruoju atveju reprezentatyvumas yra didelis (visi kiti dalykai yra lygūs).

Pavyzdžių tipai

1. Atsitiktinis mėginių ėmimas.

1.1 Paprastas atsitiktinis pasirinkimas.

1.2 Sisteminio (arba mechaninio) mėginių ėmimo metodas.

1.3 Serijinis (įdėtas arba grupuotas) mėginių ėmimas.

1.4 Stratifikuotas mėginys.

2. Neatsitiktinis pavyzdys (neįtikėtina).

2.2. Savaiminis mėginių ėmimas.

2.3. Daugiapakopis ir vienpakopis mėginių ėmimas.

1. Atsitiktinis mėginių ėmimas.

Atsitiktinės atrankos ypatumas yra tas, kad visi bendros populiacijos vienetai turi vienodą tikimybę būti įtrauktiems į imtį. Atsitiktinai imant mėginius, atsitiktinumo principas... Atrankos sistemą gali sudaryti įmonių darbuotojų sąrašai, telefonų katalogai, automobilių savininkų registracijos sąrašai, rinkėjų sąrašai apylinkėse, namų knygos, taip pat įvairūs paties sociologo sudaryti sąrašai, atsižvelgiant į tyrimo tikslus (sąrašas gatvės, kuriose vėliau atrenkami respondentai).

Atsitiktinė atranka paprastai naudojama visuomenės nuomonės apklausose prieš rinkimus, referendumus ir kitus viešus renginius.

PliusasŠis metodas yra visiškas atsitiktinumo principo laikymasis ir dėl to sistemingų klaidų išvengimas.

Šio metodo trūkumai:

- Poreikis sudaryti bendrų gyventojų elementų sąrašą.

- Apklausos sudėtingumas.

- Palyginti didelis imties dydis.

Statistikoje yra du pagrindiniai tyrimo metodai - tęstinis ir atrankinis. Atliekant imties tyrimą, privaloma laikytis šių reikalavimų: imties populiacijos reprezentatyvumo ir pakankamo stebėjimo vienetų skaičiaus. Renkantis stebėjimo vienetus, tai įmanoma Ofsetinės klaidos, tai yra, tokie įvykiai, kurių atsiradimo neįmanoma tiksliai numatyti. Šios klaidos yra objektyvios ir natūralios. Nustatant atrankos tyrimo tikslumo laipsnį, įvertinamas paklaidos, kuri gali atsirasti atrankos metu, kiekis - Atsitiktinė reprezentatyvumo klaida (M) — Tai yra faktinis skirtumas tarp vidutinių ar santykinių verčių, gautų atliekant atranką, ir panašių verčių, kurios būtų gautos atliekant apklausą visoje populiacijoje.

Tyrimo rezultatų patikimumo vertinimas apima:

1. reprezentatyvumo klaidos

2. vidutinės (arba santykinės) vertės pasitikėjimo ribos bendroje populiacijoje

3. vidutinių (arba santykinių) verčių skirtumo pasitikėjimas (pagal t kriterijų)

Reprezentatyvumo klaidos apskaičiavimas(mm) aritmetinis vidurkis (M):

Kur σ yra standartinis nuokrypis; n yra imties dydis (> 30).

Santykinės vertės (Р) reprezentatyvumo klaidos (mР) apskaičiavimas:

Kur P yra atitinkama santykinė vertė (apskaičiuota, pavyzdžiui,%);

Q = 100 - Ρ% yra abipusis P; n - imties dydis (n> 30)

Klinikiniame ir eksperimentiniame darbe dažnai reikia naudoti Mažas pavyzdys, Kai stebėjimų skaičius yra mažesnis arba lygus 30. Su nedideliu pavyzdžiu reprezentatyvumo klaidoms apskaičiuoti, tiek vidutinės, tiek santykinės vertės , Stebėjimų skaičius sumažinamas vienu, t.y.

; .

Reprezentatyvumo klaidos dydis priklauso nuo imties dydžio: kuo didesnis stebėjimų skaičius, tuo mažesnė klaida. Norint įvertinti imties rodiklio patikimumą, taikomas toks metodas: rodiklis (arba vidutinė vertė) turi būti 3 kartus didesnė už jo klaidą, šiuo atveju jis laikomas patikimu.

Žinant klaidos dydį nepakanka pasitikėti atrankos tyrimo rezultatais, nes konkreti atrankos tyrimo paklaida gali būti žymiai didesnė (arba mažesnė) nei vidutinė reprezentatyvumo paklaida. Siekiant nustatyti tikslumą, kuriuo tyrėjas nori gauti rezultatą, statistikoje naudojama tokia sąvoka kaip prognozės be klaidų tikimybė, kuri yra būdinga atrankinių biomedicinos statistinių tyrimų rezultatų patikimumui. Paprastai atliekant biomedicininius statistinius tyrimus naudojama 95% arba 99% klaidų prognozavimo tikimybė. Kritiškiausiais atvejais, kai būtina padaryti ypač svarbias išvadas teoriniu ar praktiniu požiūriu, naudojama 99,7% klaidų prognozės tikimybė.

Tam tikras prognozės be klaidų tikimybės laipsnis atitinka tam tikrą vertę Ribinė atsitiktinės atrankos klaida (Δ - delta), kuris nustatomas pagal formulę:

Δ = t * m, kur t yra patikimumo koeficientas, kuris didelei imčiai, kurios 95% klaidų prognozės tikimybė yra 2,6; su tikimybe be klaidų prognozuoti 99% - 3,0; su klaidų prognozės tikimybe 99,7% - 3,3, o su nedidele imtimi ji nustatoma pagal specialią Studento t reikšmių lentelę.

Naudojant ribinę mėginių ėmimo paklaidą (Δ), galima nustatyti Pasitikėjimo ribos, kuriame, esant tam tikrai tikimybei, kad prognozė be klaidų, faktinė statistinio kiekio vertė , Būdinga visai bendrai populiacijai (vidutinei ar giminaitei).

Pasitikėjimo riboms nustatyti naudojamos šios formulės:

1) vidutinėms vertėms:

Kur Mgen - bendros populiacijos vidurkio pasitikėjimo ribos;

Msample - vidutinė vertė , Gauta atliekant tyrimą su imtine populiacija; t yra pasitikėjimo koeficientas, kurio reikšmę lemia prognozės be klaidų tikimybė, su kuria tyrėjas nori gauti rezultatą; mM yra vidurkio reprezentatyvumo klaida.

2) santykinėms vertėms:

Kur Pgen - santykinės vertės pasitikėjimo ribos visoje populiacijoje; Psyb - santykinė vertė, gauta atliekant tyrimą su imtine populiacija; t yra pasitikėjimo veiksnys; mP - santykinės vertės reprezentatyvumo klaida.

Pasitikėjimo ribos rodo, kiek imties dydis gali svyruoti dėl atsitiktinių priežasčių.

Su nedideliu stebėjimų skaičiumi (n<30), для вычисления довери­тельных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, Nurodomas laisvų laipsnių skaičius (n) , Kuris yra n-1.

Tiesą sakant, pradėsime ne nuo vieno, o nuo trijų klausimų: kas yra atranka? kada jis reprezentatyvus? kas tai?

Visuma Ar bet kuri žmonių grupė, organizacijos, renginiai mus domina, apie kuriuos norime padaryti išvadas, ir vyksta, arba objektas, - bet koks tokio rinkinio elementas 1 .Pavyzdys - bet koks atvejų (objektų) rinkinio pogrupis, skirtas analizei. Jei norime ištirti valstijų įstatymų leidėjų sprendimų priėmimo veiklą, galėtume ištirti tokią veiklą Virdžinijos, Šiaurės Karolinos ir Pietų Karolinos valstijų įstatymų leidžiamosiose institucijose, o ne visose penkiasdešimtyje valstijų ir, remiantis tuo, skleisti gyventojų, iš kurių buvo atrinktos šios trys valstybės, gauti duomenys. Jei norime ištirti Pensilvanijos rinkėjų pasirinkimo sistemą, tai galėtume padaryti apklausę 50 „Yu“ darbuotojų. S. Steele “Pitsburge ir išplatinti apklausos rezultatus visiems valstijos rinkėjams. Panašiai, jei norime išmatuoti kolegijų studentų intelektą, galėtume išbandyti visus Ohajo gynybos žaidėjus tam tikram futbolo sezonui, o tada apibendrinti rezultatus gyventojams, kurių dalis jie yra. Kiekviename pavyzdyje mes elgiamės taip: mes sudarome populiacijos pogrupį mes išsamiai išstudijavome šį pogrupį arba pavyzdį ir išplėtėme savo rezultatus visai populiacijai. Tai yra pagrindiniai mėginių ėmimo etapai.

Tačiau atrodo gana akivaizdu, kad kiekvienas iš šių pavyzdžių turi didelį trūkumą. Pavyzdžiui, nors Virdžinijos, Šiaurės Karolinos ir Pietų Karolinos įstatymų leidėjai yra valstijų įstatymų leidėjų visumos dalis, dėl istorinių, geografinių ir politinių priežasčių jie greičiausiai veiks labai panašiai ir labai skirtingai nei įstatymų leidėjai, kurie taip skiriasi nuo tokiose valstijose kaip Niujorkas, Nebraska ir Aliaska. Nors penkiasdešimt plieno apdirbėjų Pitsburge iš tikrųjų gali būti Pensilvanijos rinkėjai, jų socialinė ir ekonominė padėtis, išsilavinimas ir gyvenimo patirtis greičiausiai skirsis nuo daugelio panašių rinkėjų. Panašiai, nors Ohajo futbolininkai yra kolegijos studentai, dėl įvairių priežasčių jie gali labai skirtis nuo kitų studentų. Kitaip tariant, nors kiekvienas iš šių pogrupių iš tikrųjų yra pavyzdys, kiekvieno iš jų nariai sistemingai skiriasi nuo daugumos kitų gyventojų, iš kurių jie yra atrinkti. Kaip atskira grupė, nė viena iš jų nėra būdinga nuomonių požymių, elgesio motyvų ir charakteristikų pasiskirstymui bendroje populiacijoje, su kuria ji yra susijusi. Atitinkamai politologai pasakytų, kad nė vienas iš šių pavyzdžių nėra tipiškas.

Reprezentatyvus pavyzdys - tai pavyzdys, kuriame visos pagrindinės bendrosios populiacijos, iš kurios šis mėginys yra paimtas, bruožai pateikiami maždaug tokia pačia proporcija arba tokiu pat dažniu, kaip ši savybė atsiranda šioje bendrojoje populiacijoje. Taigi, jei 50% visų valstybės įstatymų leidėjų renkasi tik kas dvejus metus, maždaug pusė reprezentacinės valstybės įstatymų leidėjų imties turėtų būti tokio tipo. Jei 30% Pensilvanijos rinkėjų yra mėlynakiai, tai apie 30% atstovo šių rinkėjų mėginiai (ne 100%, kaip aukščiau pateiktame pavyzdyje) turėtų būti mėlyni. Ir jei 2% visų kolegijos studentų yra sportininkai, maždaug tokia pati dalis reprezentacinio kolegijos studentų turėtų būti sportininkai. Kitaip tariant, reprezentatyvus pavyzdys yra mikrokosmosas, mažesnis, bet tikslus populiacijos modelis, kurį jis turėtų atstovauti. Jei mėginys yra tipiškas, galima daryti prielaidą, kad iš to pavyzdžio tyrimo padarytos išvados bus taikomos pradinei populiacijai. Šią rezultatų sklaidą mes vadiname apibendrinamumu.

Galbūt grafinė iliustracija padės tai išsiaiškinti. Tarkime, norime ištirti JAV suaugusiųjų politinės grupės narystės modelius. 5.1 paveiksle pavaizduoti trys apskritimai, suskirstyti į šešis vienodus sektorius. 5.1a paveiksle pavaizduota visa nagrinėjama populiacija. Gyventojai yra klasifikuojami pagal politines grupes (pvz., Partijas ir interesų grupes), kurioms jie priklauso. Šiame pavyzdyje kiekvienas suaugęs asmuo priklauso bent vienai ir ne daugiau kaip šešioms politinėms grupėms; ir šie šeši narystės lygiai yra vienodai bendri (taigi lygūs sektoriai). Tarkime, norime ištirti žmonių prisijungimo prie grupės motyvus, grupės pasirinkimo ir dalyvavimo modelius, tačiau dėl ribotų išteklių galime apklausti tik vieną iš šešių gyventojų. Kas turėtų būti pasirinktas analizei?

Ryžiai. 5.1. Atranka iš bendros populiacijos

Vieną iš galimų tam tikro dydžio pavyzdžių iliustruoja tamsesnė sritis 5.1b paveiksle, tačiau ji aiškiai neatspindi populiacijos struktūros. Jei iš šios imties apibendrintume, darytume išvadą (1), kad visi suaugę amerikiečiai priklauso penkioms politinėms grupėms ir (2), kad visas amerikiečių grupių elgesys sutampa su tų, kurie yra tiksliai penkiose grupėse, elgesiu. Tačiau mes žinome, kad pirmoji išvada nėra teisinga, ir tai gali sukelti mums abejonių dėl antrosios pagrįstumo. Taigi, 5.1b paveiksle pavaizduotas pavyzdys nėra tipiškas, nes neatspindi tam tikros populiacijos nuosavybės (dažnai vadinamos) pasiskirstymo parametras ) pagal jo faktinį pasiskirstymą. Sakoma, kad toks pavyzdys pasislinko link penkių grupių nariai arba nukrypo nuo visi kiti narystės grupėje modeliai. Remdamiesi tokia šališka imtimi, mes linkę daryti klaidingas išvadas apie populiaciją.

Tai aiškiausiai gali parodyti katastrofos pavyzdys, kuris trečiajame dešimtmetyje ištiko žurnalą „Literary Digest“, kuris surengė visuomenės nuomonės apklausą dėl rinkimų rezultatų. „Literatūrinė santrauka“ buvo periodinis leidinys, kuriame buvo spausdinami laikraščių ir kitos viešąją nuomonę atspindinčios medžiagos vadovėliai; šis žurnalas buvo labai populiarus amžiaus pradžioje. Nuo 1920 m. Žurnalas atliko plataus masto visos šalies apklausą, kurioje daugiau nei milijonas žmonių buvo išsiųsti balsavimo biuleteniai paštu, prašydami nurodyti, kieno kandidatūrai jie teikia pirmenybę artėjančiuose prezidento rinkimuose. Bėgant metams žurnalo apklausos rezultatai buvo tokie tikslūs, kad rugsėjo mėn. Apklausa lapkričio mėn. Ir kaip galėjo atsirasti klaida tokiame dideliame mėginyje? Tačiau 1936 metais būtent taip ir atsitiko: didele balsų dauguma (60:40) pergalė buvo prognozuojama respublikonų kandidatui Alfui Landonui. Rinkimuose Landonas pralaimėjo neįgaliam asmeniui - Franklinas D. Rooseveltas - praktiškai tuo pačiu rezultatu, su kuriuo turėjo laimėti. „Literary Digest“ patikimumas buvo taip smarkiai sumenkintas, kad netrukus po to žurnalas nustojo leisti. Kas nutiko? Paprasčiausiai „Digest“ apklausoje buvo naudojamas šališkas pavyzdys. Atvirukai buvo siunčiami žmonėms, kurių vardai buvo išgauti iš dviejų šaltinių: telefonų katalogų ir automobilių registracijos sąrašų. Ir nors šis atrankos metodas nelabai skyrėsi nuo kitų metodų anksčiau, situacija buvo visiškai kitokia dabar, per 1936 m. Didžiąją depresiją, kai mažiau pasiturintys rinkėjai, labiausiai tikėtina Ruzvelto atrama, negalėjo sau leisti turėti telefono, ką jau kalbėti apie automobilį. Taigi iš tikrųjų „Digest“ apklausoje naudojamas pavyzdys buvo šališkas tų, kurie greičiausiai bus respublikonų, ir vis dar stebina, kad Rooseveltas turėjo tokį gerą rezultatą.

Kaip galima išspręsti šią problemą? Grįžtant prie mūsų pavyzdžio, palyginkite 5.1b paveikslo pavyzdį su 5.1c paveiksle esančiu pavyzdžiu. Pastaruoju atveju šeštadalis populiacijos taip pat buvo atrinkta analizei, tačiau kiekviena pagrindinė populiacijos rūšis yra atrinkta tokia proporcija, kokia ji yra visoje populiacijoje. Šis pavyzdys rodo, kad kas šeštas suaugęs amerikietis priklauso vienai politinei grupei, kas šeštas - du ir pan. Tokia atranka taip pat atskleis kitus jos narių skirtumus, kurie gali būti susiję su dalyvavimu skirtingose ​​grupėse. Taigi 5.1c paveiksle pavaizduotas pavyzdys yra tipiškas nagrinėjamos populiacijos pavyzdys.

Žinoma, šis pavyzdys yra supaprastintas bent dviem labai svarbiais požiūriais. Pirma, dauguma politologų dominančios populiacijos yra įvairesnės nei parodyta pavyzdyje. Žmonės, dokumentai, vyriausybės, organizacijos, sprendimai ir kt. skiriasi vienas nuo kito ne vienu, o daug didesniu ženklų skaičiumi. Taigi tipinis pavyzdys turėtų būti toks kiekvienas pagrindinė, išsiskirianti iš kitų sričių pateikiama proporcingai jos daliai visumoje. Antra, situacija, kai tikrasis kintamųjų ar charakteristikų, kurias norime išmatuoti, pasiskirstymas nėra iš anksto žinomas, pasitaiko daug dažniau nei priešingai - galbūt tai nebuvo matuojama ankstesniame surašyme. Taigi reprezentatyvus pavyzdys turėtų būti suprojektuotas taip, kad jis galėtų tiksliai atspindėti esamą pasiskirstymą net tada, kai negalime tiesiogiai įvertinti jo pagrįstumo. Atrankos procedūra turi turėti vidinę logiką, galinčią mus įtikinti, kad jei galėtume palyginti imtį su surašymu, ji tikrai būtų reprezentatyvi.

Siekdami užtikrinti, kad būtų galima tiksliai atspindėti sudėtingą tam tikros populiacijos organizavimą ir tam tikrą pasitikėjimą, kad siūlomos procedūros gali tai padaryti, tyrėjai kreipiasi į statistinius metodus. Tačiau jie veikia dviem kryptimis. Pirma, naudodamiesi tam tikromis taisyklėmis (vidine logika), tyrėjai sprendžia klausimą, kokius konkrečius objektus jie turėtų tirti, kas tiksliai turėtų būti įtraukta į konkretų pavyzdį. Antra, naudodamiesi labai skirtingomis taisyklėmis, jie nusprendžia, kiek objektų pasirinkti. Mes išsamiai nenagrinėsime šių daugybės taisyklių, mes apsvarstysime tik jų vaidmenį politikos mokslų tyrimuose. Pradėkime nuo objektų, sudarančių reprezentatyvų pavyzdį, pasirinkimo strategijų.