Pasitikėjimo intervalas

Kas yra pasitikėjimo intervalas:

Tai statistikoje naudojamas intervalas, kuriame yra populiacijos parametras. Šis nežinomas populiacijos parametras randamas imties modeliu, apskaičiuotu iš surinktų duomenų .

Pavyzdys: ̅ surinkto mėginio vidurkis gali neatitikti tikrosios gyventojų vidurkio μ. Tam galima apsvarstyti įvairias imties priemones, kuriose galima apriboti šios populiacijos vidurkį. Kuo ilgesnis šis intervalas, tuo didesnė tikimybė, kad tai įvyksta.

Patikimumo intervalas išreiškiamas procentais, išreikštas pasitikėjimo lygiu, 90%, 95% ir 99% yra labiausiai nurodytas. Žemiau esančiame paveikslėlyje, pavyzdžiui, turime 90% pasikliautinąjį intervalą tarp viršutinių ir apatinių ribų (a ir -a ).

90% patikimumo intervalo tarp viršutinių (a) ir žemesnių (-a) ribų pavyzdys.

Pasitikėjimo intervalas yra viena iš svarbiausių hipotezės testavimo sąvokų statistikoje, nes ji naudojama kaip neapibrėžtumo matas. Šį terminą 1937 m. Pristatė lenkų matematikas ir statistikas Jerzy Neyman .

Kokia yra pasitikėjimo intervalo svarba?

Patikimumo intervalas yra svarbus, norint nurodyti neapibrėžties ribą (arba netikslumą) pagal atliktą skaičiavimą. Šiame skaičiavime naudojamas tyrimo pavyzdys, siekiant įvertinti faktinį rezultato dydį šaltinio populiacijoje.

Pasitikėjimo intervalo apskaičiavimas yra strategija, kurioje atsižvelgiama į klaidų ėmimą. Tyrimo rezultato dydis ir pasitikėjimo intervalas apibūdina numatomas pradinės populiacijos vertes.

Kuo siauresnis pasikliautinasis intervalas, tuo didesnė tikimybė, kad tyrimo populiacijos procentinė dalis atitinka tikrąjį šaltinio populiacijos skaičių, suteikiant didesnį tikrumo objekto rezultatui tikrumą.

Kaip interpretuoti pasitikėjimo intervalą?

Teisingas pasitikėjimo intervalo aiškinimas tikriausiai yra sudėtingiausias šio statistinės sąvokos aspektas. Labiausiai paplitusio sąvokos aiškinimo pavyzdys yra toks:

Yra 95% tikimybė, kad ateityje tikroji populiacijos parametro vertė (pvz., Vidurkis) patenka į intervalą X (apatinė riba) ir Y (viršutinė riba).

Taigi, pasikliautinasis intervalas aiškinamas taip: 95% yra įsitikinęs, kad intervalas tarp X (apatinė riba) ir Y (viršutinė riba) turi tikrąją populiacijos parametro vertę.

Būtų visiškai neteisinga teigti, kad: yra 95% tikimybė, kad intervalas tarp X (apatinė riba) ir Y (viršutinė riba) turi tikrąją populiacijos parametro vertę.

Anksčiau pateiktas teiginys yra labiausiai paplitęs klaidingas supratimas apie pasitikėjimo intervalą. Apskaičiuojant statistinį intervalą, jis gali būti tik populiacijos parametras arba ne.

Tačiau intervalai gali skirtis tarp mėginių, o tikrasis populiacijos parametras yra tas pats, nepriklausomai nuo mėginio.

Todėl pasitikėjimo intervalo pasitikėjimo patvirtinimą galima pateikti tik tuo atveju, kai patikimumo intervalai perskaičiuojami mėginių skaičiui.

Pasitikėjimo intervalo apskaičiavimo etapai

Diapazonas apskaičiuojamas pagal šiuos veiksmus:

  • Surinkite imties duomenis: n ;
  • Apskaičiuokite mėginio vidurkį x̅;
  • Nustatykite, ar populiacijos standartinis nuokrypis ( σ ) yra žinomas ar nežinomas;
  • Jei žinomas populiacijos standartinis nuokrypis, atitinkamam patikimumo lygiui gali būti naudojamas z taškas;
  • Jei populiacijos standartinis nuokrypis nežinomas, mes galime naudoti statistiką t atitinkamam patikimumo lygiui;
  • Taigi, apatinės ir viršutinės pasitikėjimo intervalo ribos nustatomos naudojant šias formules:

a) Žinomo populiacijos standartinis nuokrypis :

Žinomos populiacijos standartinio nuokrypio apskaičiavimo formulė.

b) Nežinomos populiacijos standartinis nuokrypis :

Nežinomos populiacijos standartinio nuokrypio apskaičiavimo formulė.

Praktinis pasitikėjimo intervalo pavyzdys

Klinikinis tyrimas įvertino ryšį tarp astmos buvimo ir obstrukcinio miego apnėjos atsiradimo rizikos suaugusiems.

Kai kurie suaugusieji buvo atsitiktinai įdarbinti iš valstybės pareigūnų sąrašo, kurį ketverius metus reikia stebėti.

Dalyviams, sergantiems astma, lyginant su tais, kuriems nėra astmos, buvo didesnis pavojus susirgti apnėja per ketverius metus.

Atliekant klinikinius tyrimus, tokius kaip šis pavyzdys, dažniausiai dominuojantis populiacijos pogrupis įdarbinamas siekiant padidinti studijų efektyvumą (mažiau išlaidų ir mažiau laiko).

Šis asmenų pogrupis, ištirtas populiacija, susideda iš tų, kurie atitinka įtraukimo kriterijus ir sutinka dalyvauti tyrime, kaip parodyta žemiau esančiame paveikslėlyje.

Pavyzdyje aprašytas gyventojų paaiškinimas.

Tada tyrimas baigtas ir apskaičiuojamas poveikio dydis (pavyzdžiui, vidutinis skirtumas arba santykinė rizika ), kad būtų atsakyta į tyrimo klausimą.

Šis procesas, vadinamas išvada, apima duomenų, surinktų iš tyrimo gyventojų, naudojimą, siekiant įvertinti faktinio poveikio populiacijai, ty kilmės gyventojams, dydį.

Pateiktame pavyzdyje mokslininkai įdarbino atsitiktinį valstybės darbuotojų (šaltinių populiacijos), kurie buvo tinkami ir sutiko dalyvauti tyrime (tyrimo populiacija), pavyzdį ir pranešė, kad astma padidina apnėjos vystymosi riziką tyrimo populiacijoje.

Kad būtų atsižvelgta į atrankos paklaidą dėl to, kad įdarbinta tik suinteresuotų gyventojų pogrupis, jie taip pat apskaičiavo 95% patikimumo intervalą (apytikslį) 1, 06–1, 82, nurodydami tikimybę 95 %, kad tikroji santykinė rizika šaltinio populiacijoje būtų nuo 1, 06 iki 1, 82 .

Vidutinio pasitikėjimo intervalas

Kai yra informacija apie populiacijos standartinį nuokrypį, galima apskaičiuoti vidurkio arba vidurkio pasitikėjimo intervalą.

Kai matuojama statistinė charakteristika (pvz., Pajamos, IQ, kaina, aukštis, kiekis ar svoris) yra skaitinė, daugeliu atvejų apskaičiuota, kad nustatyta vidutinė gyventojų vertė.

Taigi, bandome rasti populiacijos vidurkį ( μ ), naudodami imties vidurkį ( x a ), su klaidų riba. Šio skaičiavimo rezultatas vadinamas gyventojų vidurkio pasitikėjimo intervalu .

Kai populiacijos standartinis nuokrypis yra žinomas, populiacijos vidurkio patikimumo intervalo (CI) formulė yra:

Kur:

  • yra mėginio vidurkis;
  • σ yra gyventojų standartinis nuokrypis;
  • n yra mėginio dydis;
  • Ζ * atitinka atitinkamą standartinio normalaus paskirstymo vertę jūsų pageidaujamam patikimumo lygiui.

Toliau pateikiamos įvairių patikimumo lygių vertės ( Ζ * ):

Patikimumo lygisZ * vertė -
80%1.28
90%1.645 (įprastas)
95%1.96
98%2.33
99%2.58

Pirmiau pateiktoje lentelėje parodyta z * reikšmė pateiktam patikimumo lygiui. Atkreipkite dėmesį, kad šios vertės yra gaunamos pagal standartinį normalų paskirstymą (Z-).

Plotas tarp kiekvienos z * vertės ir neigiamos šios vertės yra (apytikslis) pasitikėjimo procentas. Pavyzdžiui, plotas tarp z * = 1, 28 ir z = -1, 28 yra maždaug 0, 80. Todėl ši lentelė taip pat gali būti išplėsta į kitus patikimumo procentus. Lentelėje pateikiami tik dažniausiai naudojami pasitikėjimo procentai.

Taip pat žr. Hipotezės reikšmę.