Dina statistik, interval kapercayaan (en:Confidence interval) nyaéta wangun anu ilahar tina interval estimasi. Lamun U jeung V mangrupa statistik (i.e., variabel acak nu "bisa diobservasi" ) nu mana sebaran kamungkinan gumantung kana sababaraha parameter θ nu teu katalungtik, jeung hubunganna

saterusna random interval (U,V) nyaéta "90% interval kapercayaan keur θ".

Kumaha bisa salah harti interval kapercayaan

édit

Hal nu matak kataji dina kasalahan nangtukeun kaputusan saperti nu bakal dijelaskeun. Urang ngagunakeun hurup gedé U jeung V keur variabel acak; ilaharna ngagunakeun hurup leutik u jeung v keur nilai nu ka observasi. Salah harti dina nyimpulkeun nyaéta yen

 

sanggeus data di-observasi, sebaran probabiliti kondisional θ, tina data nu diberekeun dijadikeun kasimpulan. Conto, anggap X kasebar normal mibanda nilai ekspektasi θ sarta varian 1. (Jelas pisan yén teu réalistik keur nangtukeun nilai varian, sedengkeun nilai ekspektasi kudu disimpulkeun tina data, tapi ieu ngan sakadar keur conto nu basajan). Variabel acak X ka-observasi. (Variabel acak X − θ salah sahiji conto nu teu ka-observasi, nilaina gumantung kana θ.) Mangka X - θ kasebar normal mibanda nilai ekspektasi 0 sarta varian 1; saterusna

 

Akibatna

 

mangka interval ti X − 1.645 nepi ka X + 1.645 mibanda interval kapercayaan 90% keur θ. Tapi waktu X = 82 ka-observasi, naha bisa disebutkeun yen

 

Kasimpulan éta teu nuturkeun hukum probabiliti sabab θ lain "variabel acak"; i.e., taya sebaran probabiliti nu nangtukeun hal eta. Interval kapercayaan sacara umum mangrupa métodeu frekuensi, i.e., dipaké ku anu naksir "probabilti 90%" salaku "90% kajadian dina sakabeh kasus". Conto, θ sarua jeung massa planet Neptunus, sarta sacara acak urang ngukur kasalahan rata-rata 90% tina waktu tetapan mangka massa tina wilangan ieu jeung wilangan nu bakal aya mangrupa nilai nu bener. Massa lain mangrupa hal nu acak. Sanajan kitu, mun urang boga nilai ukuran 82 satuan, urang teu bisa nyebutkeun yén hal éta aya dina 90% keur sakabéh kasus, massa antara 82 − 1.645 jeung 82 + 1.645.

Tapi lamun probabiliti ditaksir salaku tingkat kapercayaan tinimbang frekuensi relatif dina kajadian variabel acak, i.e., dina hal ieu maké Bayesians tinimbang frekuensi, bisa disebutkeun yen urang yakin 90% massa antara 82 − 1.645 jeung 82 + 1.645? Loba jawaban keur hal ieu anu diusulkeun sarta sacara filosofi kontroversial. Jawaban lain dumasar kana téorema matematik, tapi kana filosofi.

Keur nu nganut métodeu frekuensi, cara ngajelaskeun interval kapercayaan saperti kieu: "Interval kapercayaan ngagambarkeun nilai keur parameter populasi keur ngabedakeun antara estimasi parameter jeung observasi taya hartina sacara statistik dina tingkat 10%". Kritik métodeu frekuensi nyaéta nyumputkeun kaayaan nu sabenerna sarta pamahaman kana ieu métodeu bisa dijelaskeun saperti kieu: "Lamun populasi parameter aya di jero interval kapercayaan, mangka probiliti nu di estimasi bakal milu ka observasi atawa bakal deukeut kana parameter, hartina kurang atawa sarua jeung 90%". Nu maké métodeu Bayesian, lamun maranéhna ngahasilkeun interval kapercayaan, sacara jelas bakal ngomong "Kuring percaya yen parameter di kanyataanna dina interval kapercayaan 90%".

Conto praktis kongkrit

édit

Dina kaca ieu salah sahiji conto nu leuwih ilahar dipake. Anggap X1, ..., Xn mangrupa sampel bebas tina populasi sebaran normal nu mibanda méan μ sarta variance σ2. Tempo

 
 

Mangka

 

mibanda sebaran-t student nu mana n − 1 nyaéta tingkat kabebasan. Catetan yén ieu sebaran teu gumantung kana nilai paraméter μ and σ2 nu teu ka-observasi; i.e., mangrupa pivotal quantity. Lamun c mangrupa persentil nu ka-95 tina ieu sebaran, mangka

 

(Catetan: "95" sarta "90" bener; ieu sering dipaké keur ngurangan kasalahan.)

Akibatna

 

sarta urang mibanda confidence interval 90% keur μ.

Tempo oge

édit