Errors and residuals in statistics
Dina statistik, konsep kasalahan jeung sesa gampang silih bingungkeun.
Kasalahan nyaéta hal nu salah; kasalahan nyaéta loba beda nu kapanggih tina nilai ekspektasi; saterusna bakal dumasar kana sakabéh populasi tina satuan statistik nu dipilih sacara acak. Nilai ekspektasi, nilai rata-rata tina populasi nu ditempo, sacara tipikil teu katempo. Lamun rata-rata jangkung lalaki nu umurna 21 taun nyaéta 5 kaki 9 inci, sarta kapilih sacara acak lalaki nu jangkungna 5 kaki 11 inci, mangka "kasalahan" nyaéta 2 inci; lamun sacara acak kapilih lalaki nu jangkungna 5 kaki 7 inci, mangka "kasalahan" nyaéta −2 inci. Istilah ieu diwangun tina ukuran kasalahan acak dina astronomi. Saperti dina ukuran jangkung lalaki tadi nu mana diukur tina rata-rata populasi, mangka beda antara jangkung lalaki jeung ukuran rata-rata mangrupa ukuran kasalahan.
Sesa nyaéta estimasi nu katempo tina kasalahan nu teu katempo. Pasualan nu gampang dina sampel acak jangkung lalaki n nyaéta ukuranna. Rata-rata sampel dipaké keur ngira-ngira rata-rata populasi. Mangka:
- Beda antara unggal jangkung lalaki jeung rata-rata populasi nu teu katempo disebut kasalahan, sarta
- Beda antara jangkung lalaki jeung rata-rata sampel disebut sesa.
- Sesa bisa katempo; kasalahan henteu.
Catetan: jumlah sesa sarua jeung nol, mangka sesa henteu mandiri. Jumlah kasalahan teu sarua jeung nol; kasalahan mangrupa variabel acak mandiri lamun dicokot tina populasi nu mandiri.
- Kasalahan ilaharna masing-masing mandiri; sesa ilaharna henteu mandiri tinu sejen.
Conto
éditLamun urang nganggap populasi nu kasebar normal mibanda méan μ sarta simpangan baku σ, sarta individu nu dipilih bébas, mangka
sarta sampel méan mangrupa sebaran variabel random:
Mangka kasalahan nyaéta
sedengkeun sesa nyaéta
(Saperti nu ilahar dipaké, tanda "topi" di handapeun aksara ε nunjukkeun estimasi observasi tina kuantitas nu teu kaobservasi disebut ε.)
Jumlah kuadrat kasalahan, dibagi ku σ2, mibanda sebaran chi-kuadrat mibanda n tingkat kebébasan:
Nilai ieu teu bisa kapanggih, sedengkeun kuadrat jumlah sesa, bisa kapanggih. Bagi ieu jumlah ku σ2 nu mibanda sebaran chi-kuadrat ngan ku n − 1 tingkat kabébasan:
Hal ieu bisa ditandaan yén variabel acak jeung sampel méan nembongkeun kamandirian sewang-sewangan. Ieu kanyataan sebaran normal jeung chi-kuadrat nembongkeun yén itungan bentuk dasar di luhur dumasar kana interval kapercayaan dina sebaran-t student. Batalna σ tina nu ngabagi jeung nu dibagi dina éta itungan nembongkeun yén aya kateujelasan nu nyababkeun ayana anggapan yén σ2 teu méré pangaruh nanaon.
Tempo ogé
éditArtikel ieu mangrupa taratas, perlu disampurnakeun. Upami sadérék uninga langkung paos perkawis ieu, dihaturan kanggo ngalengkepan. |