Seminari teema: proovide võtmine sotsioloogilises uurimuses Põhimõisted. Esindav valim Valim ja üldpopulatsioon

Statistilised uuringud on väga töömahukad ja kulukad, mistõttu tekkis mõte asendada pidev vaatlus valikulisega.

Katkendliku vaatluse peamine eesmärk on saada uuritud statistilise populatsiooni tunnused selle uuritava osa jaoks.

Valikuline vaatlus- See on statistiliste uuringute meetod, mille puhul üldkogumi üldised näitajad kehtestatakse ainult eraldi osas juhusliku valiku sätete alusel.

Valimismeetodi abil uuritakse ainult teatud osa uuritud populatsioonist, samas kui uuritavat statistilist populatsiooni nimetatakse üldpopulatsiooniks.

Valimispopulatsiooni või lihtsalt valimit võib nimetada üldpopulatsiooni hulgast valitud ühikute osaks, millele tehakse statistilised uuringud.

Valimismeetodi väärtus: minimaalse uuritavate ühikute arvu korral viiakse statistiline uuring läbi lühema aja jooksul ning kõige väiksemate rahaliste ja tööjõukuludega.

Üldpopulatsioonis nimetatakse uuritavate tunnustega ühikute osakaalu üldiseks proportsiooniks (tähistatud R), ja uuritud muutuja tunnuse keskmine väärtus on üldine keskmine (tähistatud NS).

Valimispopulatsioonis nimetatakse uuritava tunnuse osa valimi osaks või osaks (tähistatud w -ga), valimi keskmine väärtus on proovi keskmine.

Kui uuringu ajal järgitakse kõiki selle teadusliku korralduse reegleid, annab proovivõtumeetod üsna täpsed tulemused ja seetõttu on soovitatav seda meetodit kasutada pideva vaatluse andmete kontrollimiseks.

See meetod on laialt levinud riiklikus ja osakondadevälises statistikas, sest minimaalse uuritud ühikute arvu uurimisel võimaldab see põhjalikku ja täpset uurimist.

Uuritud statistiline populatsioon koosneb üksustest, millel on erinevad omadused. Valimipopulatsiooni koostis võib erineda üldpopulatsiooni koosseisust; see erinevus valimi omaduste ja üldkogumi vahel on valimisviga.

Valimi vaatlusele omased vead iseloomustavad valimi vaatluse andmete ja kogu populatsiooni vahelise lahknevuse suurust. Valimi käigus tekkinud vigu nimetatakse representatiivsuse vigadeks ning need jagunevad juhuslikeks ja süstemaatilisteks.

Kui valimipopulatsioon ei taasta vaatluse katkendliku iseloomu tõttu kogu populatsiooni täpselt, siis nimetatakse seda juhuslikeks vigadeks ning nende suurused määratakse piisava täpsusega suurte arvude seaduse ja tõenäosusteooria alusel.

Süstemaatilised vead tekivad juhuslikkuse põhimõtte rikkumise tagajärjel rahvastikuühikute vaatlemiseks.

2. Valiku tüübid ja skeemid

Valimisvea suurus ja selle määramise meetodid sõltuvad valiku tüübist ja skeemist.

Vaatlusüksuste komplekti jaoks on neli tüüpi valikut:

1) juhuslik;

2) mehaaniline;

3) tüüpiline;

4) seriaalne (pesastatud).

Juhuslik proovivõtt- kõige levinum juhusliku valimi valimise meetod, seda nimetatakse ka loosimismeetodiks, mille puhul koostatakse igale statistilise populatsiooni ühikule pilet seerianumbriga.

Lisaks valitakse juhuslikult vajalik hulk statistilise populatsiooni ühikuid. Nendel tingimustel on igaühel neist sama tõenäosus valimisse sattuda, näiteks võitude loosimine, kui teatud osa numbritest, millele võit langeb, valitakse juhuslikult väljaantud piletite koguarvust. Samal ajal on kõikidele numbritele tagatud võrdne võimalus valimisse pääseda.

Mehaaniline valik- see on meetod, kus kogu populatsioon jagatakse juhusliku kriteeriumi järgi homogeense mahuga rühmadesse, seejärel võetakse igast rühmast ainult üks ühik. Kõik uuritud statistilise populatsiooni üksused on esialgselt paigutatud teatud järjekorda, kuid sõltuvalt valimi suurus, vajalik arv ühikuid valitakse mehaaniliselt teatud ajavahemiku järel ...

Tüüpiline valik - See on meetod, mille puhul uuritud statistiline populatsioon jagatakse olulise, tüüpilise tunnuse järgi kvalitatiivselt homogeenseteks sarnasteks rühmadeks, seejärel valitakse igast rühmast juhuslikult teatud arv ühikuid, mis on proportsionaalsed rühma erikaaluga. kogu elanikkond.

Tüüpiline valik annab täpsemaid tulemusi, kuna see hõlmab valimis kõigi tüüpiliste rühmade esindajaid.

Seeria (pesastatud) valik. Valiku alla kuuluvad terved rühmad (seeriad, pesad), mis on valitud juhuslikult või mehaaniliselt. Iga sellise rühma ja seeria puhul viiakse läbi pidev vaatlus ja tulemused edastatakse kogu populatsioonile.

Proovivõtmise täpsus sõltub ka valiku skeemist. Proovide võtmine võib toimuda vastavalt korduva ja korduva proovivõtmise skeemile.

Korduv valik. Iga valitud ühik või seeria tagastatakse kogu populatsioonile ja selle saab proovile tagasi saata. See on niinimetatud tagastatud palli skeem.

Korduv valik. Iga uuritud üksus võetakse tagasi ja ei tagastata agregaati, nii et seda ei kontrollita uuesti. Seda skeemi nimetatakse tagastamata kuuliks.

Korduv valim annab täpsemad tulemused, sest sama valimi suuruse puhul hõlmab vaatlus rohkem uuritud populatsiooni ühikuid.

Kombineeritud valik võib läbida ühe või mitu sammu. Proovivõtmist nimetatakse üheastmeliseks, kui uuritakse populatsiooni valitud üksusi.

Valimit nimetatakse mitmeastmeliseks, kui populatsiooni valik läbib etappe, järjestikuseid etappe ja igal valiku etapil on oma valikuüksus.

Mitmefaasiline proovivõtmine - valimi võtmise kõikides etappides säilitatakse sama valimiüksus, kuid viiakse läbi mitu etappi, valikuuringute etappe, mis erinevad uuringuprogrammi laiuse ja valimi suuruse poolest.

Üldkogumi ja valimi populatsiooni parameetrite omadused on tähistatud järgmiste sümbolitega:

N- elanikkonna maht;

n- näidissuurus;

X- üldine keskmine;

NS- proovi keskmine;

R- üldosa;

w - valikuline aktsia;

2 - üldine dispersioon (tunnuse dispersioon üldpopulatsioonis);

2 - sama tunnuse dispersioon;

? - standardhälve üldpopulatsioonis;

? - standardhälve valimis.

3. Proovivigu

Valimi vaatluse igal üksusel peaks olema teistega võrdne võimalus olla valitud - see on enesele juhusliku valimi alus.

Enesevalik proovivõtmine - See on üksuste valimine kogu elanikkonnast loosi teel või muul sarnasel viisil.

Juhuslikkuse põhimõte seisneb selles, et objekti valimisse kaasamist või väljaarvamist ei saa mõjutada muud tegurid peale juhtumi.

Proovi jagamine Kas valimis olevate ühikute arvu ja üldkogumi ühikute arvu suhe:


Õige juhuslik valik puhtal kujul on esialgne valik kõigi teiste valiku tüüpide seas; see sisaldab ja rakendab valikulise statistilise vaatluse aluspõhimõtteid.

Valimismeetodis kasutatakse kahte peamist üldistavate näitajate tüüpi: kvantitatiivse tunnuse keskmine väärtus ja alternatiivse tunnuse suhteline väärtus.

Valimi osa (w) või konkreetne määratakse kindlaks uuritud tunnusega ühikute arvu suhtega m, valimi ühikute koguarvule (n):


Valiminäitajate usaldusväärsuse iseloomustamiseks eristatakse valimi võtmise keskmisi ja marginaalseid vigu.

Valimi viga, mida nimetatakse ka representatiivsuse veaks, on erinevus vastava valimi ja üldiste omaduste vahel:

?x = | x - x |;

?w = | x - p |.

Prooviviga on omane ainult valimivaatlustele

Valimi keskmine ja proovi osakaal Kas juhuslikud muutujad, mis võtavad erinevaid väärtusi sõltuvalt valimisse kaasatud uuritud statistilise populatsiooni ühikutest. Sellest tulenevalt on ka valimisvead juhuslikud väärtused ja võivad samuti omandada erinevaid väärtusi. Seetõttu määratakse kindlaks võimalike vigade keskmine - keskmine valimisviga.

Keskmine valimisviga määratakse valimi suuruse järgi: mida suurem on arv, kui muud asjad on võrdsed, seda väiksem on keskmine valimisviga. Valimiuuringuga hõlmates üha suuremat hulka elanikkonna ühikuid, iseloomustame üha täpsemalt kogu elanikkonda.

Keskmine valimisviga sõltub uuritava tunnuse varieeruvusastmest, omakorda variatsiooni astet iseloomustab dispersioon? 2 või w (l - w)- alternatiivse funktsiooni jaoks. Mida väiksem on tunnuse ja dispersiooni variatsioon, seda väiksem on keskmine valimisviga ja vastupidi.

Juhuslikul korduvalimisel võetakse teoreetiliselt keskmised vead, kasutades järgmisi valemeid:

1) keskmise kvantitatiivse tunnuse puhul:


kus? 2 - kvantitatiivse tunnuse dispersiooni keskmine väärtus.

2) aktsia jaoks (alternatiivne funktsioon):


Niisiis, kuidas on tunnuse dispersioon üldpopulatsioonis? 2 ei ole täpselt teada, praktikas kasutavad nad suure hulga seaduse alusel valimipopulatsiooni jaoks arvutatud dispersiooni väärtust S 2, mille kohaselt piisavalt suure valimi suurusega valimipopulatsioon kordab üldise elanikkond üsna täpselt.

Juhusliku uuesti proovivõtmise keskmise valimisvea valemid on järgmised. Kvantitatiivse tunnuse keskmise väärtuse puhul: üldist dispersiooni väljendatakse valikaine kaudu järgmiselt:


kus S 2 on dispersiooni väärtus.

Mehaaniline proovivõtmine- See on üksuste valimine üldpopulatsioonist valimisse, mis on neutraalse kriteeriumi järgi jagatud võrdseteks rühmadeks; tehakse nii, et igast sellisest rühmast valitakse ainult üks üksus.

Mehaanilise valiku korral on uuritud statistilise populatsiooni ühikud esialgselt paigutatud kindlasse järjekorda, misjärel valitakse mehaaniliselt teatud ajavahemiku järel kindlaks määratud arv ühikuid. Lisaks on intervalli suurus üldpopulatsioonis võrdne valimi osakaalu vastastikusega.

Piisavalt suure populatsiooni korral on tulemuste täpsuse mõttes mehaaniline valik iseenesest juhuslik, mistõttu mehaanilise valiku keskmise vea määramiseks kasutatakse enesele juhusliku mitte korduva proovivõtmise valemeid.

Üksuste valimiseks heterogeensest populatsioonist kasutatakse nn tüüpilist valimit, seda kasutatakse siis, kui kõik üldpopulatsiooni ühikud saab jagada mitmeks kvalitatiivselt homogeenseks sarnaseks rühmaks vastavalt tunnustele, millest uuritud näitajad sõltuvad.

Seejärel tehakse igast tüüpilisest rühmast üksiküksus valimispopulatsiooni individuaalse juhusliku või mehaanilise valimi abil.

Tüüpilist valimit kasutatakse tavaliselt keerukate statistiliste populatsioonide uurimisel.

Tavaline proovivõtt annab täpsemad tulemused. Üldkogumi tüüpimine tagab sellise valimi representatiivsuse, iga tüpoloogilise rühma esindatuse selles, mis võimaldab välistada rühmadevahelise dispersiooni mõju keskmisele valimisveale. Seetõttu kasutatakse tüüpilise valimi keskmise vea määramisel variatsiooni indikaatorina rühmasiseste dispersioonide keskmist.

Seeriaproovide võtmine hõlmab juhuslikku valimist võrdse suurusega rühmade üldpopulatsioonist, et kõiki üksusi sellistes rühmades jälgida.

Kuna eranditult kõiki üksusi uuritakse rühmade (seeriate) piires, sõltub keskmine valimisviga (võrdse suurusega seeriate valimisel) ainult rühmadevahelisest (seeriatevahelisest) dispersioonist.

4. Proovitulemuste levitamise viisid elanikkonnale

Valimitulemuste põhjal üldpopulatsiooni iseloomustamine on valimi vaatluse lõppeesmärk.

Valimismeetodit kasutatakse valimi teatud näitajate jaoks üldkogumi omaduste saamiseks. Sõltuvalt uuringu eesmärkidest viiakse see läbi elanikkonna valimiindeksite otsese ümberarvutamise või parandustegurite arvutamise meetodi abil.

Otsese ümberarvutamise meetod on see, et koos sellega on valimi osakaalu näitajad w või keskmine NS kohaldatakse üldpopulatsiooni suhtes, võttes arvesse valimi viga.

Parandustegurite meetodit kasutatakse juhul, kui valimi koostamise meetodi eesmärk on selgitada täieliku raamatupidamise tulemusi. Seda meetodit kasutatakse kariloomade iga -aastase loenduse andmete täpsustamiseks elanikkonna hulgas.

Statistiline populatsioon- massi, tüüpilisuse, kvalitatiivse homogeensuse ja varieeruvusega ühikute kogum.

Statistiline populatsioon koosneb materiaalselt olemasolevatest objektidest (töötajad, ettevõtted, riigid, piirkonnad), on objekt.

Koondühik- iga statistilise populatsiooni üksus.

Üks ja sama statistiline populatsioon võib olla ühes tunnuses homogeenne ja teises heterogeenne.

Kvalitatiivne ühtsus- mingil põhjusel täitematerjali kõigi ühikute sarnasus ja ülejäänud osas erinev.

Statistilises populatsioonis on erinevused ühe rahvastikuühiku ja teise vahel sageli oma olemuselt kvantitatiivsed. Populatsiooni erinevate üksuste tunnuse väärtuste kvantitatiivseid muutusi nimetatakse variatsioonideks.

Funktsiooni variatsioon- tunnuse kvantitatiivne muutus (kvantitatiivse tunnuse puhul) üleminekul populatsiooni ühelt ühikult teisele.

Märk Kas üksuste, objektide ja nähtuste omadus, iseloomulik tunnus või muu tunnus, mida saab jälgida või mõõta. Märgid jagunevad kvantitatiivseteks ja kvalitatiivseteks. Tunnuse väärtuse mitmekesisust ja varieeruvust populatsiooni üksikutes nimetatakse variatsioon.

Atribuutiivsed (kvalitatiivsed) tunnused ei sobi numbriliseks väljenduseks (populatsiooni koosseis soo järgi). Kvantitatiivsed omadused on numbrilised (populatsiooni koosseis vanuse järgi).

Indeks- see on kvantitatiivselt kokkuvõttev kvalitatiivne omadus üksuste või komplekti mis tahes omadusele teatud aja- ja kohatingimustes.

Tulemuskaart Kas näitajate kogum, mis peegeldab terviklikult uuritavat nähtust.

Näiteks uuritakse palka:
  • Funktsioon - palk
  • Statistiline elanikkond - kõik töötajad
  • Rahvastikuühik - iga töötaja
  • Kvalitatiivne homogeensus - kogunenud palk
  • Märgi variatsioon - numbrite seeria

Üldpopulatsioon ja proov sellest

Aluseks on andmete kogum, mis on saadud ühe või mitme tunnuse mõõtmise tulemusena. Tegelikult vaadeldav objektide kogum, mida statistiliselt esindab hulk juhusliku muutuja vaatlusi, on proovide võtmine ja hüpoteetiliselt olemas (oletatud) - üldine elanikkond... Üldpopulatsioon võib olla piiratud (vaatluste arv N = konst) või lõpmatu ( N = ∞) ja üldpopulatsiooni valim on alati piiratud arvu vaatluste tulemus. Valimit moodustavate vaatluste arvu nimetatakse näidissuurus... Kui valimi suurus on piisavalt suur ( n → ∞) proovi võetakse arvesse suur muidu nimetatakse seda prooviks piiratud maht... Proovi võetakse arvesse väike kui ühemõõtmelise juhusliku muutuja mõõtmisel ei ületa valimi suurus 30 ( n<= 30 ) ja mitme mõõtmisel ( k) funktsioonid mitmemõõtmelises ruumis, suhe n To k vähem kui 10 (n / k< 10) ... Näidisvormid variatsioonivahemik kui selle liikmed on ordinaalne statistika st juhusliku muutuja valimisväärtused NS sorteeritakse kasvavas järjekorras (järjestatud), samas kui funktsiooni väärtusi nimetatakse võimalusi.

Näide... Peaaegu sama juhuslikult valitud objektide komplekti - Moskva ühe halduspiirkonna kommertspangad - võib pidada valimiks kõigi selle linnaosa kommertspankade elanikkonnast ja valimiks kõigi Moskva kommertspankade elanikkonnast , samuti valim riigi kommertspankadest jne.

Põhilised proovivõtumeetodid

Statistiliste järelduste usaldusväärsus ja tulemuste mõtestatud tõlgendamine sõltub sellest esinduslikkus proovivõtmine, s.t. elanikkonna omaduste esitamise täielikkus ja piisavus, mille suhtes seda valimit võib pidada tüüpiliseks. Rahvastiku statistiliste omaduste uurimist saab korraldada kahel viisil: kasutades pidev ja katkendlik. Pidev vaatlus näeb ette kõigi küsitluse ühikutõppinud agregaat, a katkendlik (valikuline) vaatlus- ainult selle osad.

Proovivaatluse korraldamiseks on viis peamist viisi:

1. lihtne juhuslik valik, kus objektid ekstraheeritakse juhuslikult objektide üldpopulatsioonist (näiteks tabeli või juhuslike arvude generaatori abil), kusjuures kõigi võimalike proovide tõenäosus on võrdne. Selliseid proove nimetatakse õige juhuslik;

2. lihtne valik tavalise protseduuri abil viiakse läbi mehaanilise komponendi abil (näiteks kuupäev, nädalapäev, korteri number, tähestiku täht jne) ja sel viisil saadud proove nimetatakse mehaaniline;

3. kihistunud valik seisneb selles, et mahu üldpopulatsioon on jaotatud mahu alamhulkadeks või kihtideks (kihtideks) nii. Kihid on statistiliste omaduste poolest homogeensed objektid (näiteks rahvastik jaguneb kihtideks vanuserühmade või sotsiaalse klassi järgi; ettevõtted - tööstusharu järgi). Sel juhul kutsutakse proove kihistunud(muidu, kihistunud, tüüpiline, tsoneeritud);

4. meetodid seriaal moodustamiseks kasutatakse valikut seriaal või pesastatud proovid... Need on mugavad, kui on vaja viivitamatult uurida "plokki" või esemete seeriat (näiteks kaubasaadetist, teatud seeria tooteid või riigi territoriaal-haldusjaotuse elanikke). Partiide valimine võib toimuda puhtjuhuslikult või mehaaniliselt. Sellisel juhul viiakse läbi teatud kaubapartii või kogu territoriaalüksuse (elamu või kvartal) täielik ülevaatus;

5. kombineeritud(astmeline) valik võib ühendada korraga mitu valikumeetodit (näiteks kihistatud ja juhuslik või juhuslik ja mehaaniline); sellist näidist nimetatakse kombineeritud.

Valiku tüübid

Kõrval meelest eristada individuaalset, grupi- ja kombineeritud valikut. Kell individuaalne valik valimisse valitakse üldpopulatsiooni üksikud üksused koos grupi valik- kvalitatiivselt homogeensed üksuste rühmad (seeriad) ja kombineeritud valik eeldab esimese ja teise tüübi kombinatsiooni.

Kõrval meetod valik eristab korduv ja mitte korduv proov.

Kordamatu nimetatakse valikut, mille puhul valimisse sattunud üksus ei naase algpopulatsiooni juurde ega osale edasises valikus; samas kui ühikute arv elanikkonnas N väheneb valikuprotsessis. Kell korratakse valik tabatud valimis tagastatakse üksus pärast registreerimist üldpopulatsioonile ja säilib seega koos teiste üksustega võrdsed võimalused edasises valikumenetluses kasutamiseks; samas kui ühikute arv elanikkonnas N jääb muutumatuks (meetodit kasutatakse sotsiaal-majanduslikes uuringutes harva). Siiski suurega N (N → ∞) valemid jaoks kordamatu valikud lähenevad neile korratakse valik ja peaaegu sagedamini kasutatakse viimaseid ( N = konst).

Üld- ja valimipopulatsiooni parameetrite põhiomadused

Uuringu statistilised järeldused põhinevad juhusliku muutuja jaotusel, samas kui täheldatud väärtused (x 1, x 2, ..., x n) nimetatakse juhusliku muutuja realiseerimiseks NS(n on valimi suurus). Juhusliku muutuja jaotus üldpopulatsioonis on teoreetiline, ideaalne ja selle valimi analoog on empiiriline levitamine. Mõned teoreetilised jaotused on antud analüütiliselt, s.t. nende oma võimalusi määrake jaotusfunktsiooni väärtus juhusliku muutuja võimalike väärtuste ruumi igas punktis. Valimi puhul on jaotusfunktsiooni raske kindlaks teha ja seetõttu mõnikord võimatu võimalusi hinnatakse empiiriliste andmete põhjal ja seejärel asendatakse need teoreetilist jaotust kirjeldava analüütilise väljendiga. Sel juhul eeldatakse (või hüpotees) jaotuse tüübi kohta võib olla nii statistiliselt õige kui ka ekslik. Kuid igal juhul iseloomustab valimist rekonstrueeritud empiiriline jaotus ainult ligikaudselt tõelist. Kõige olulisemad jaotusparameetrid on oodatud väärtus ja dispersioon.

Oma olemuselt on jaotused sellised pidev ja diskreetne... Tuntuim pidev jaotus on normaalne... Parameetrite selektiivsed analoogid ja selle jaoks on: keskmine väärtus ja empiiriline dispersioon. Sotsiaalmajanduslike uuringute diskreetsete hulgas kasutatakse kõige sagedamini alternatiivne (dihhotoomne) levitamine. Selle jaotuse matemaatilise ootuse parameeter väljendab suhtelist väärtust (või jaga) elanikkonna üksused, millel on uuritav tunnus (see on tähistatud tähega); elanikkonna osakaalu, kellel seda omadust pole, tähistatakse tähega q (q = 1 - p)... Alternatiivse jaotuse dispersioonil on ka empiiriline analoog.

Jaotusparameetrite omadused arvutatakse erineval viisil, sõltuvalt jaotuse tüübist ja populatsiooni ühikute valimise meetodist. Peamised teoreetiliste ja empiiriliste jaotuste kohta on toodud tabelis. 1.

Proovi k n fraktsioon on valimi ühikute arvu ja elanikkonna ühikute arvu suhe:

k n = n / N.

Proovifraktsioon w Kas uuritud tunnusega ühikute suhe x valimi suurusele n:

w = n n / n.

Näide. Kaubapartiis, mis sisaldab 1000 ühikut, 5% prooviga proovifraktsioon k n absoluutväärtus on 50 ühikut. (n = N * 0,05); kui selles proovis leitakse 2 defektset toodet, siis valikulise jäätme määr w on 0,04 (w = 2/50 = 0,04 või 4%).

Kuna valimipopulatsioon erineb üldpopulatsioonist, siis proovivõtmise vead.

Tabel 1. Üld- ja valimipopulatsiooni põhiparameetrid

Proovivigu

Igasuguste (pidevate ja valikuliste) vigade puhul võib esineda kahte tüüpi vigu: registreerimine ja representatiivsus. Vead registreerimine võib olla juhuslik ja süstemaatiline iseloom. Juhuslik vead koosnevad paljudest erinevatest kontrollimatutest põhjustest, on tahtmatud ja tavaliselt tasakaalustavad üksteist kokku (näiteks muutused instrumendinäidudes ruumi temperatuurikõikumiste ajal).

Süstemaatiline vead on tendentslikud, kuna need rikuvad proovis olevate objektide valimise reegleid (näiteks mõõtmiste kõrvalekalded mõõteseadme seade muutmisel).

Näide. Linna elanike sotsiaalse staatuse hindamiseks on kavas uurida 25% peredest. Kui samal ajal valitakse iga neljanda korteri valik selle arvu järgi, siis on oht valida kõik ainult ühte tüüpi korterid (näiteks ühetoalised), mis annab süstemaatilise vea ja moonutab tulemusi ; korteri numbri valimine partii kaupa on eelistatavam, kuna viga on juhuslik.

Esindaja vead on omased ainult valikulisele vaatlusele, neid ei saa vältida ja need tulenevad asjaolust, et valim ei taasta täielikult üldpopulatsiooni. Valimis saadud näitajate väärtused erinevad üldpopulatsiooni samade väärtuste näitajatest (või saadud pideva vaatluse teel).

Proovi vaatlusviga on parameetri väärtuse erinevus üldkogumis ja selle valimi väärtus. Kvantitatiivse tunnuse keskmise väärtuse korral on see võrdne :, ja aktsia puhul (alternatiivne tunnus) -.

Valimisvead on iseloomulikud ainult valimivaatlustele. Mida suuremad on need vead, seda enam erineb empiiriline jaotus teoreetilisest. Empiirilise jaotuse parameetrid on juhuslikud väärtused, seetõttu on ka valimisvead juhuslikud väärtused, need võivad erinevate proovide jaoks võtta erinevaid väärtusi ja seetõttu on tavaks arvutada keskmine viga.

Keskmine valimi viga on väärtus, mis väljendab valimi keskmise standardhälvet matemaatilisest ootusest. See väärtus sõltub juhusliku valiku põhimõttest lähtudes eelkõige valimi suurusest ja tunnuse varieeruvusastmest: mida suurem ja väiksem on tunnuse variatsioon (ja seega ka väärtus), seda väiksem on keskmine proovivõtmise viga. Üldkogumi ja valimispopulatsiooni erinevuste suhe on väljendatud järgmise valemiga:

neid. piisavalt suurte puhul võime eeldada, et. Keskmine valimisviga näitab valimispopulatsiooni parameetri võimalikke kõrvalekaldeid üldkogumi parameetrist. Tabel Joonisel 2 on esitatud väljendid keskmise vaatlusvea arvutamiseks erinevate vaatluste korraldamise meetodite jaoks.

Tabel 2. Valimi keskmise vea (m) keskmine ja osakaal erinevat tüüpi valimitel

Kus on grupisisese valimi variatsioonide keskmine pideva funktsiooni korral;

Grupisiseste aktsiate erinevuste keskmine;

- valitud seeriate arv, - seeriate koguarv;

,

kus on -seeria keskmine;

- kogu valimi keskmine keskmine pideva funktsiooni korral;

,

kus on tunnuse osa kolmandas seerias;

- funktsiooni kogu osakaal kogu valimis.

Kuid keskmise vea väärtust saab hinnata ainult teatud tõenäosusega P (P ≤ 1). Ljapunov A.M. tõestas, et valimi keskmiste ja seega ka nende kõrvalekalded üldisest keskmisest piisavalt suure arvu puhul järgivad ligikaudu normaaljaotuse seadust, tingimusel et üldkogumil on piiratud keskmine ja piiratud dispersioon.

Matemaatiliselt väljendatakse seda väidet keskmise kohta järgmiselt:

ja murdosa puhul on avaldis (1) järgmisel kujul:

kus - seal on marginaalne proovivõtmise viga, mis on keskmise valimisvea kordaja , ja mitmekordistustegur on USA pakutud üliõpilase test ("usaldusfaktor"). Gosset (teise nimega "Õpilane"); erinevate proovide suuruste väärtused salvestatakse spetsiaalsesse tabelisse.

Funktsiooni Ф (t) väärtused mõne t väärtuse korral on võrdsed:

Seetõttu võib avaldist (3) lugeda järgmiselt: tõenäosusega P = 0,683 (68,3%) võib väita, et valimi ja üldise keskmise erinevus ei ületa ühte keskmise vea väärtust m (t = 1), tõenäosusega P = 0,954 (95,4%)- et see ei ületa kahe keskmise vea väärtust m (t = 2), tõenäosusega P = 0,997 (99,7%)- ei ületa kolme väärtust m (t = 3). Seega määrab tõenäosus, et see erinevus ületab kolmekordse keskmise vea vea tase ja pole enam 0,3% .

Tabel 3 näitab valemit valimi vea arvutamiseks.

Tabel 3. Valimi piirviga (D) keskmise ja proportsiooni (p) puhul erinevat tüüpi valimivaatluste puhul

Valimistulemuste levitamine üldpopulatsioonile

Valikulise vaatluse lõppeesmärk on üldpopulatsiooni iseloomustamine. Väikeste valimite korral võivad parameetrite (ja) empiirilised hinnangud oluliselt erineda nende tegelikest väärtustest (ja). Seetõttu on vaja kehtestada piirid, mille piires parameetrite (ja) näidisväärtuste tegelikud väärtused (ja) asuvad.

Usaldusvahemiküldpopulatsiooni mis tahes parameetri θ kohta nimetatakse selle parameetri juhuslikku väärtuste vahemikku, mille tõenäosus on lähedane 1 ( usaldusväärsus) sisaldab selle parameetri tegelikku väärtust.

Marginaalne viga proovide võtmine Δ võimaldab määrata elanikkonna omaduste piirväärtusi ja nende omadusi usaldusintervallid mis on võrdsed:

Alumine joon usaldusvahemik saadud lahutades marginaalne viga valimi keskmisest (osakaal) ja ülemine selle lisamisega.

Usaldusvahemik keskmiseks kasutab see valimi võtmise vea piirväärtust ja antud usaldusnivoo jaoks määratakse kindlaks valem:

See tähendab, et antud tõenäosusega R, mida nimetatakse usaldustasemeks ja mille väärtus määrab ainulaadselt t, võib väita, et keskmise tegelik väärtus jääb vahemikku ja murdosa tegelik väärtus jääb vahemikku

Usaldusintervalli arvutamisel kolme standardse usaldustaseme jaoks P = 95%, P = 99% ja P = 99,9% väärtuse valib. Rakendused sõltuvalt vabadusastmete arvust. Kui valimi suurus on piisavalt suur, siis neile tõenäosustele vastavad väärtused t on võrdsed: 1,96, 2,58 ja 3,29 ... Seega võimaldab valimi võtmise vea piir määrata üldkogumi omaduste piirväärtused ja nende usaldusvahemikud:

Valikulise vaatluse tulemuste levitamisel elanikkonnale sotsiaalmajanduslikes uuringutes on oma eripärad, kuna see nõuab kõigi selle tüüpide ja rühmade esinduslikkuse täielikkust. Sellise jaotuse võimaluse aluseks on arvutus suhteline viga:

kus Δ % - suhteline marginaalne valimi viga; ,.

Valimisvaatluse laiendamiseks elanikkonnale on kaks peamist meetodit: otsene teisendamine ja koefitsientide meetod.

Olemus otsene konverteerimine koosneb valimi keskmise !! \ overline (x) korrutamisest üldkogumi suurusega.

Näide... Olgu näidismeetodil hinnatud linna väikelaste keskmine arv ja olgu inimene. Kui linnas on 1000 noort perekonda, siis saadakse munitsipaallasteaedades nõutavate kohtade arv, korrutades selle keskmise üldpopulatsiooni suurusega N = 1000, s.t. kokku 1200 kohta.

Koefitsientide meetod seda on soovitav kasutada juhul, kui pideva vaatluse andmeid selgitatakse, kui tehakse valikulist vaatlust.

Sel juhul kasutatakse valemit:

kus kõik muutujad on populatsiooni suurus:

Nõutav valimi suurus

Tabel 4. Vajalik valimi suurus (n) erinevat tüüpi proovide vaatluse korraldamiseks

Valimi vaatluse kavandamisel lubatava valimisvea ettemääratud väärtusega on vaja õigesti hinnata vajalikku näidissuurus... Seda mahtu saab määrata valimi vaatluse lubatud vea alusel, mis põhineb antud tõenäosusel, mis tagab vea taseme lubatud väärtuse (arvestades vaatluse korraldamise viisi). Valemeid nõutava valimi suuruse määramiseks on lihtne hankida otse valimi marginaalse vea valemitest. Niisiis, piirvea väljendist:

valimi suurus määratakse otseselt n:

See valem näitab, et väheneva valimi vea korral Δ nõutav valimi suurus suureneb oluliselt, mis on võrdeline õpilase testi dispersiooni ja ruuduga.

Vaatluse korraldamise konkreetse meetodi jaoks arvutatakse nõutav valimi suurus vastavalt tabelis esitatud valemitele. 9.4.

Praktilised arvutusnäited

Näide 1. Pideva kvantitatiivse karakteristiku keskmise ja usaldusintervalli arvutamine.

Võlausaldajatega arveldamise kiiruse hindamiseks viis pank läbi 10 maksedokumendi juhusliku valimi. Nende väärtused osutusid võrdseks (päevades): 10; 3; 15; 15; 22; 7; kaheksa; 1; 19; kakskümmend.

Vajalik tõenäosusega P = 0,954 määrata piirviga Δ valimi keskmine ja arvutuste keskmise aja usalduspiirid.

Lahendus. Keskmine väärtus arvutatakse tabeli valemi abil. 9.1 proovi jaoks

Hälve arvutatakse tabeli valemi abil. 9.1.

Päeva keskmine ruutviga.

Keskmine viga arvutatakse järgmise valemi abil:

neid. keskmine on x ± m = 12,0 ± 2,3 päeva.

Keskmise usaldusväärsus oli

Piirav viga arvutatakse tabeli valemi abil. 9.3 uuesti proovide võtmiseks, kuna populatsiooni suurus pole teada, ja P = 0,954 usalduse tase.

Seega on keskmine väärtus võrdne `x ± D =` x ± 2m = 12,0 ± 4,6, s.t. selle tegelik väärtus jääb vahemikku 7,4 kuni 16,6 päeva.

Õpilase tabeli kasutamine. Rakendus võimaldab meil järeldada, et n = 10 - 1 = 9 vabadusastme puhul on saadud väärtus usaldusväärne, mille olulisuse tase on 0,001 naela, s.t. saadud keskmine väärtus erineb oluliselt 0 -st.

Näide 2. Tõenäosuse hindamine (üldosa) lk.

Mehaanilise valimismeetodi abil 1000 perekonna sotsiaalse staatuse uurimiseks selgus, et madala sissetulekuga perede osakaal oli w = 0,3 (30%)(proov oli 2% , st. n / N = 0,02). Vajalik enesekindlusega p = 0,997 määrake indikaator R madala sissetulekuga pered kogu piirkonnas.

Lahendus. Vastavalt funktsiooni esitatud väärtustele Ф (t) leidke antud enesekindlustase P = 0,997 tähendus t = 3(vt valem 3). Jagamise viga w määratakse tabeli valemiga. 9.3 korduva proovivõtmise korral (mehaaniline proovivõtmine on alati mitte korduv):

Suhteline valimi marginaalne viga aastal % saab:

Piirkonna madala sissetulekuga perede tõenäosus (üldine osakaal) on p = w ± Δ w ja usalduspiirid p arvutatakse kahekordse ebavõrdsuse alusel:

w - Δ w ≤ p ≤ w - Δ w, st. p tegelik väärtus on:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Seega võib tõenäosusega 0,997 väita, et madala sissetulekuga perede osakaal kõigist piirkonna peredest jääb vahemikku 28,6% kuni 31,4%.

Näide 3. Intervalliseeriaga määratud diskreetse funktsiooni keskmise ja usaldusintervalli arvutamine.

Tabel 5. määratud on tellimuste esitamise korralduste jaotus ettevõtte poolt nende täitmise aja järgi.

Tabel 5. Vaatluste jaotus esinemise aja järgi

Lahendus. Keskmine tarneaeg arvutatakse järgmise valemi abil:

Keskmine periood on:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 kuud.

Sama vastuse saame, kui kasutame tabeli eelviimase veeru andmeid p i kohta. 9.5 kasutades valemit:

Pange tähele, et viimase gradatsiooni intervalli keskosa leitakse, täiendades seda kunstlikult eelmise gradatsiooni intervalli laiusega 60 - 36 = 24 kuud.

Hälve arvutatakse valemi abil

kus x i- intervalli rea keskel.

Seetõttu !! \ sigma = \ frac (20 ^ 2 + 14 ^ 2 + 1 + 25 ^ 2 + 49 ^ 2) (4) ja ruutkeskmine viga.

Keskmine viga arvutatakse kuu valemi abil, s.t. keskmine on !! \ overline (x) ± m = 23,1 ± 13,4.

Piirav viga arvutatakse tabeli valemi abil. 9.3 uuesti proovide võtmiseks, kuna populatsiooni suurus pole teada, 0,954 usaldusnivoo korral:

Seega keskmine on:

neid. selle tegelik väärtus jääb vahemikku 0 kuni 50 kuud.

Näide 4. Kommertspangas korporatsiooni N = 500 ettevõtte võlausaldajatega arveldamise kiiruse määramiseks on vaja läbi viia valimi uuring juhusliku kordumatu valiku meetodil. Määrake nõutav valimi suurus n nii, et tõenäosusega P = 0,954 ei ületa valimi keskmise viga 3 päeva, kui katsehinnangud näitasid, et standardhälve s oli 10 päeva.

Lahendus... Vajalike uuringute arvu n määramiseks kasutame tabelist korduva valiku valemit. 9.4:

Selles määratakse t väärtus usaldusnivoo jaoks P = 0,954. See on võrdne 2. Juure keskmine ruut s = 10, üldkogumi suurus on N = 500 ja keskmise vea piirväärtus on Δ x = 3. Asendades need väärtused valemisse, saame:

neid. piisab 41 ettevõtte valimi koostamisest, et hinnata nõutavat parameetrit - võlausaldajatega arveldamise kiirust.

Näidis - see on:

1) uurimisobjekti nende elementide kogum, mida otseselt uuritakse;

2) meetodid ja protseduurid uurimisobjekti elementide valimiseks.

Üldine elanikkond - uuritava probleemiga seotud objektide täielik komplekt. Sotsioloogilistes uuringutes G.S. kõige sagedamini on üksikisikute agregaadid - elanikkond (linnad, riigid jne), sotsiaalne rühm (noored, töötud, ärimehed jne), massimeedia publik (QMS) jne. Paljudel juhtudel , GS ... võib koosneda suurematest elementidest (objektidest) - pered (leibkonnad), akadeemilised rühmad, ettevõtted, usukogukonnad, üksikud asulad või osariigid jne.

Proovipopulatsioon - osa üldpopulatsiooni objektidest, mis valiti uurimiseks, et teha järeldusi kogu elanikkonna kohta.

Selleks, et valimi uurimisel saadud järeldust saaks laiendada kogu elanikkonnale, peab valimil olema representatiivsuse omadus.

Esinduslikkus Kas valimi võime esindada sihtrühma. Mida täpsemalt esindab valimi koosseis uuritavatel teemadel elanikkonda, seda suurem on selle representatiivsus.

NÄIDE: Esinduslikkust saab illustreerida järgmise näitega. Oletame, et elanikkond on kõik kooli õpilased (600 inimest 20 klassist, 30 inimest igas klassis). Uuringu teemaks on suhtumine suitsetamisse. 60 gümnasisti valim esindab elanikkonda palju vähem kui sama 60 õpilase valim, kuhu kuulub 3 õpilast igast klassist. Selle peamine põhjus on klasside ebavõrdne vanuseline jaotus. Järelikult on esimesel juhul valimi representatiivsus madal ja teisel juhul esinduslikkus kõrge (kõik muud asjad on võrdsed).

Proovi tüübid

1. Juhuslik proovide võtmine.

1.1 Lihtne juhuslik valik.

1.2 Süstemaatilise (või mehaanilise) proovivõtu meetod.

1.3 Järjestikune (pesastatud või rühmitatud) proovivõtt.

1.4 Kihistatud proov.

2. Mitte-juhuslik valim (ebatõenäoline).

2.2. Spontaanne proovide võtmine.

2.3. Mitmeastmeline ja üheastmeline proovivõtmine.

1. Juhuslik proovide võtmine.

Juhuvalimi eripära on see, et kõigil üldkogumi üksustel on võrdne tõenäosus valimisse kaasamiseks. Juhusliku proovivõtmise korral juhuslikkuse põhimõte... Valimiraamistik võib olla ettevõtte töötajate nimekirjad, telefonikataloogid, autoomanike registreerimisnimekirjad, valijate nimekirjad valimisjaoskondades, majaraamatud, samuti mitmesugused nimekirjad, mille sotsioloog ise on koostanud, sõltuvalt uuringu eesmärkidest (nimekiri tänavad, kust seejärel valitakse vastajad).

Avaliku arvamuse küsitlustes kasutatakse enne valimisi, rahvahääletusi ja muid avalikke üritusi juhuslikku valimit.

Pluss See meetod on juhuslikkuse põhimõtte täielik järgimine ja sellest tulenevalt süstemaatiliste vigade vältimine.

Selle meetodi puudused:

- Vajadus elanikkonna elementide loetelu järele.

- Uuringu keerukus.

- suhteliselt suur valimi suurus.

Statistikas on kaks peamist uurimismeetodit - pidev ja valikuline. Valikuuringu läbiviimisel on kohustuslik järgida järgmisi nõudeid: valimipopulatsiooni esinduslikkus ja piisav arv vaatlusühikuid. Vaatlusüksuste valimisel on see võimalik Nihke vead, see tähendab selliseid sündmusi, mille esinemist ei saa täpselt ette näha. Need vead on objektiivsed ja loomulikud. Valimiuuringu täpsusastme määramisel hinnatakse proovivõtmise käigus tekkida võiva vea hulka - Esinduslikkuse juhuslik viga (M) — See on tegelik erinevus valikuuringust saadud keskmiste või suhteliste väärtuste ja sarnaste väärtuste vahel, mis saadakse üldise elanikkonna küsitlusest.

Uurimistulemuste usaldusväärsuse hindamine näeb ette:

1. esindatuse vead

2. elanikkonna keskmiste (või suhteliste) väärtuste enesekindluse piirid

3. usaldus keskmiste (või suhteliste) väärtuste erinevuse suhtes (vastavalt kriteeriumile t)

Esinduslikkuse vea arvutamine(mm) aritmeetiline keskmine (M):

Kus σ on standardhälve; n on valimi suurus (> 30).

Suhtelise väärtuse (Р) representatiivsuse vea (mР) arvutamine:

Kus P on vastav suhteline väärtus (arvutatud näiteks%-des);

Q = 100 - Ρ% on P vastastik; n - valimi suurus (n> 30)

Kliinilises ja eksperimentaalses töös on sageli vaja kasutada Väike proov, Kui vaatluste arv on väiksem või võrdne 30. Väikese valimiga, et arvutada representatiivsuse vead, nii keskmised kui ka suhtelised väärtused , Vaatluste arvu vähendatakse ühe võrra, s.t.

; .

Esindatavuse vea suurus sõltub valimi suurusest: mida suurem on vaatluste arv, seda väiksem on viga. Valimiindikaatori usaldusväärsuse hindamiseks kasutatakse järgmist lähenemisviisi: näitaja (või keskmine väärtus) peab olema 3 korda suurem kui selle viga, antud juhul peetakse seda usaldusväärseks.

Vea suuruse teadmisest ei piisa, et olla kindel valimiuuringu tulemustes, kuna valimi uuringu konkreetne viga võib olla oluliselt suurem (või väiksem) kui representatiivsuse keskmise vea väärtus. Selleks, et määrata kindlaks, millise täpsusega teadlane soovib tulemust saada, kasutab statistika sellist mõistet nagu veavaba ennustuse tõenäosus, mis on iseloomulik selektiivsete biomeditsiiniliste statistiliste uuringute tulemuste usaldusväärsusele. Tavaliselt kasutatakse biomeditsiiniliste statistiliste uuringute läbiviimisel 95% või 99% veavaba ennustuse tõenäosust. Kõige kriitilisematel juhtudel, kui on vaja teha eriti olulisi järeldusi teoreetilises või praktilises plaanis, kasutatakse 99,7% veavaba prognoosi tõenäosust.

Vigadevaba prognoosi teatud tõenäosus vastab teatud väärtusele Juhuvalimite piirviga (Δ - delta), mis määratakse järgmise valemiga:

Δ = t * m, kus t on usalduskoefitsient, mis 95% veavaba prognoosi tõenäosusega suure valimi puhul on 2,6; veavaba prognoosi tõenäosusega 99% - 3,0; tõrgeteta prognoosi tõenäosusega 99,7% - 3,3 ja väikese valimi korral määrab selle spetsiaalne õpilase t väärtuste tabel.

Kasutades proovivõtu marginaalset viga (Δ), saab määrata Usalduse piirid, milles teatud veavaba prognoosi tõenäosusega statistilise koguse tegelik väärtus , Kogu üldpopulatsiooni iseloomustamine (keskmine või suhteline).

Usalduspiiride määramiseks kasutatakse järgmisi valemeid:

1) keskmiste väärtuste puhul:

Kus Mgen - elanikkonna keskmise usalduspiirid;

Proov - keskmine , Saadud valimi populatsiooni uuringu läbiviimisel; t on usalduskoefitsient, mille väärtuse määrab kindlaks vigadeta prognoosi tõenäosusaste, millega uurija soovib tulemust saada; mM on keskmise representatiivsuse viga.

2) suhteliste väärtuste puhul:

Kus Pgen - üldise elanikkonna suhtelise väärtuse usalduspiirid; Psyb on suhteline väärtus, mis saadakse valimi populatsiooni uuringu läbiviimisel; t on usaldustegur; mP - suhtelise väärtuse representatiivsuse viga.

Usalduspiirid näitavad, kui suures ulatuses võib valimi suurus juhuslikel põhjustel kõikuda.

Väikese arvu vaatlustega (n<30), для вычисления довери­тельных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, Näitab saadaolevate vabadusastmete arvu (n) , Mis on n-1.

Tegelikult alustame mitte ühe, vaid kolme küsimusega: Mis on proovivõtmine? millal see on esinduslik? mis see on?

Täitematerjal Kas mõni grupp inimesi, organisatsioone, üritusi pakub meile huvi, mille kohta tahame järeldusi teha, ja toimub, või objekt, - sellise komplekti mis tahes element 1 .Näidis - analüüsimiseks eraldatud juhtumite (objektide) alamrühm. Kui tahame uurida osariikide seadusandjate otsustusaktiivsust, võiksime uurida sellist tegevust Virginia, Põhja-Carolina ja Lõuna-Carolina osariikide seadusandlikes organites, mitte kõigis viiekümnes osariigis ja selle põhjal jaotada andmed, mis on saadud elanikkonna kohta, kelle seast need kolm osariiki valiti. Kui tahame uurida Pennsylvania valijate eelistuste süsteemi, võiksime seda teha, küsitledes Yu 50 töötajat. S. Steele ”Pittsburghis ja levitada küsitluse tulemusi kõigile osariigi valijatele. Samuti, kui tahame mõõta kolledži üliõpilaste intelligentsust, võiksime testida kõiki Ohio kaitsemängijaid antud jalgpallihooajal ja seejärel üldistada tulemusi elanikkonnale, kelle osaks nad on. Igas näites toimime järgmiselt: loome pigem alamrühma elanikkonna sees uurime seda alarühma või valimit üksikasjalikult ja laiendame oma tulemusi kogu elanikkonnale. Need on proovide võtmise peamised etapid.

Siiski tundub üsna ilmne, et kõigil neil proovidel on märkimisväärne puudus. Näiteks kui Virginia, Põhja -Carolina ja Lõuna -Carolina seadusandjad kuuluvad osariikide seadusandjate kogu hulka, siis ajaloolistel, geograafilistel ja poliitilistel põhjustel tegutsevad nad tõenäoliselt väga sarnaselt ja väga erineval viisil kui seadusandjad, kes on nii erinevad Osariigid nagu New York, Nebraska ja Alaska. Kuigi viiskümmend Pittsburghi terasetöösturit võivad tõepoolest olla Pennsylvania valijad, on nende sotsiaalmajanduslikul seisundil, haridusel ja elukogemustel tõenäoliselt erinevad seisukohad kui paljudel sarnastel valijatel. Samamoodi, kuigi Ohio jalgpallurid on kolledžiõpilased, võivad nad erinevatel põhjustel teistest üliõpilastest väga erineda. Teisisõnu, kuigi igaüks neist alarühmadest on tõepoolest valim, on nende liikmed süstemaatiliselt erinevad enamikust ülejäänud elanikkonnast, kelle hulgast nad välja valitakse. Eraldi rühmana pole ükski neist tüüpiline arvamuste atribuutide, käitumismotiivide ja omaduste jaotuse poolest üldises elanikkonnas, millega see on seotud. Sellest tulenevalt ütleksid politoloogid, et ükski neist proovidest ei ole representatiivne.

Esindav proov - see on valim, milles on esitatud kõik üldpopulatsiooni põhijooned, millest see proov on välja võetud, ligikaudu samas proportsioonis või sama sagedusega, millega see omadus selles üldpopulatsioonis esineb. Seega, kui 50% kõigist osariikide seadusandjatest koguneb ainult iga kahe aasta tagant, peaks umbes pool osariikide seadusandjate esinduslikust valimist olema seda tüüpi. Kui 30% Pennsylvania valijatest on sinikraed, siis umbes 30% esindajatest nende valijate proovid (mitte 100% nagu ülaltoodud näites) peaksid olema sinised. Ja kui 2% kõigist kolledži üliõpilastest on sportlased, peaks umbes sama osa esindatavatest üliõpilastest olema sportlased. Teisisõnu, representatiivne proov on mikrokosmos, väiksem, kuid täpne populatsiooni mudel, mida see peaks esindama. Kuivõrd valim on representatiivne, võib kindlalt eeldada, et selle valimi uurimisel tehtud järeldused kehtivad algpopulatsiooni kohta. Seda tulemuste levitamist nimetame üldistamiseks.

Ehk aitab graafiline illustratsioon seda selgitada. Oletame, et tahame uurida USA täiskasvanud elanikkonna fraktsioonidesse kuulumise mustreid. Joonisel 5.1 on kujutatud kolm ringi, mis on jagatud kuueks võrdseks sektoriks. Joonis 5.1a kujutab kogu vaadeldavat populatsiooni. Elanikkonnaliikmed liigitatakse vastavalt poliitilistele rühmadele (näiteks parteid ja huvigrupid), kuhu nad kuuluvad. Selles näites kuulub iga täiskasvanu vähemalt ühte ja mitte rohkem kui kuue fraktsiooni; ja need kuus liikmestaatust on kokkuvõttes võrdselt levinud (seega võrdsed sektorid). Oletame, et tahame uurida grupiga liituvate inimeste motiive, grupi valikut ja osalemismustreid, kuid piiratud ressursside tõttu suudame küsitleda ainult ühte kuuendast elanikkonnast. Kes tuleks analüüsimiseks välja valida?

Riis. 5.1. Proovide võtmine üldpopulatsioonist

Ühte võimalikku antud suurusega näidist illustreerib joonisel 5.1b varjutatud ala, kuid see ei kajasta selgelt populatsiooni struktuuri. Kui me selle valimi põhjal üldistaksime, siis järeldaksime (1), et kõik Ameerika täiskasvanud inimesed kuuluvad viide poliitilisse gruppi ja (2) et kogu Ameerika rühmituse käitumine langeb kokku täpselt viie grupi inimeste käitumisega. Siiski teame, et esimene järeldus ei ole õige ja see võib tekitada meis kahtlusi teise kehtivuse osas. Seega Joonisel 5.1b näidatud valim ei ole representatiivne, kuna see ei kajasta antud rahvastikuomaduste jaotust (sageli nimetatakse seda) parameeter ) vastavalt selle tegelikule levikule. Selline proov on väidetavalt suunas nihkunud viie rühma liikmed või eemale nihkunud kõik muud rühmaliikmete mudelid. Sellise kallutatud valimi põhjal kipume tegema populatsiooni kohta ekslikke järeldusi.

Seda saab kõige selgemalt näidata näitel katastroofist, mis tabas 1930. aastatel ajakirja "Literary Digest", mis korraldas avaliku arvamuse küsitluse valimistulemuste kohta. Literary Digest oli perioodika, kus trükiti ajalehtede juhtkirju ja muud avalikku arvamust kajastavat materjali; see ajakiri oli sajandi alguses väga populaarne. Alates 1920. aastast korraldas ajakiri ulatusliku üleriigilise küsitluse, kus enam kui miljonile inimesele saadeti posti teel hääletussedel, milles paluti märkida, kelle kandidatuuri nad eelseisvatele presidendivalimistele eelistasid. Ajakirja küsitluste tulemused on aastate jooksul olnud nii täpsed, et septembri küsitlus tundus muutvat novembrikuised valimised vähetähtsaks. Ja kuidas võis viga tekkida nii suure valimi korral? 1936. aastal juhtus aga täpselt nii: suure häälteenamusega (60:40) ennustati võitu vabariiklaste kandidaadile Alf Landonile. Valimistel kaotas Landon puudega inimesele - Franklin D. Roosevelt - praktiliselt sama tulemusega, millega ta oleks pidanud võitma. "Literary Digest" usaldusväärsust õõnestati nii rängalt, et peagi pärast seda lõpetas ajakirja väljaandmine. Mis juhtus? Lihtsalt, Digest küsitlus kasutas kallutatud valimit. Postkaarte saadeti inimestele, kelle nimed võeti välja kahest allikast: telefonikataloogidest ja autoregistreerimisnimekirjadest. Ja kuigi see valikumeetod ei erinenud väga palju teistest meetoditest varem, oli olukord hoopis teistsugune nüüd, 1936. aasta suure depressiooni ajal, kui vähem jõukad valijad, kõige tõenäolisem Roosevelti alustala, ei saanud endale lubada telefoni, autost rääkimata. Seega oli Digest küsitluses kasutatud valim tegelikult nende suhtes, kes olid kõige tõenäolisemalt vabariiklased, ja on endiselt üllatav, et Rooseveltil oli nii hea tulemus.

Kuidas seda probleemi lahendada? Tulles tagasi meie näite juurde, võrrelge joonisel 5.1b näidatud näidist joonisel 5.1c. Viimasel juhul valiti analüüsiks ka kuuendik elanikkonnast, kuid valimis on esindatud iga populatsiooni põhitüüp proportsioonis, milles see on esindatud kogu populatsioonis. See proov näitab, et iga kuues Ameerika täiskasvanu kuulub ühte poliitilisse rühma, iga kuues kuni kaks jne. Selline valim paljastab ka muid erinevusi liikmete vahel, mis võivad korreleeruda erinevates rühmades osalemisega. Seega on joonisel 5.1c näidatud valim vaadeldava populatsiooni tüüpiline valim.

Muidugi on see näide lihtsustatud vähemalt kahest äärmiselt olulisest vaatenurgast. Esiteks on enamik poliitikateadlastele huvipakkuvaid populatsioone mitmekesisemad kui näites näidatud. Inimesed, dokumendid, valitsused, organisatsioonid, otsused jne. erinevad üksteisest mitte ühe, vaid palju suurema arvu märkide poolest. Seega peaks tüüpiline valim olema selline igaüks peamine, teistest eristuv piirkond oli esitatakse proportsionaalselt tema osaga kokku. Teiseks, olukord, kus nende muutujate või tunnuste tegelikku jaotust, mida me soovime mõõta, pole ette teada, esineb palju sagedamini kui vastupidi - võib -olla ei mõõdetud seda eelmisel rahvaloendusel. Seega tuleks tüüpiline valim kujundada nii, et see kajastaks täpselt olemasolevat jaotust isegi siis, kui me ei saa selle kehtivust otseselt hinnata. Valimisprotseduuril peab olema sisemine loogika, mis võib meid veenda, et kui me saaksime valimit loendusega võrrelda, oleks see tõepoolest representatiivne.

Tagamaks, et antud populatsiooni keerukat korraldust saab täpselt kajastada ja teatud kindlus, et kavandatud protseduurid on selleks võimelised, pöörduvad teadlased statistiliste meetodite poole. Kuid nad tegutsevad kahes suunas. Esiteks otsustavad teadlased teatud reegleid (sisemist loogikat) kasutades küsimuse, milliseid konkreetseid objekte nad peaksid uurima, mida täpselt konkreetsesse valimisse kaasama. Teiseks otsustavad nad väga erinevaid reegleid kasutades, kui palju objekte valida. Me ei hakka neid arvukaid reegleid üksikasjalikult uurima, kaalume ainult nende rolli riigiteaduste uurimisel. Alustame tüüpiliste valimite objektide valimise strateegiatega.