Errors and residuals in statistics

Dina statistik, konsep kasalahan jeung sesa gampang silih bingungkeun.

Kasalahan nyaéta hal nu salah; kasalahan nyaéta loba beda nu kapanggih tina nilai ekspektasi; saterusna bakal dumasar kana sakabéh populasi tina satuan statistik nu dipilih sacara acak. Nilai ekspektasi, nilai rata-rata tina populasi nu ditempo, sacara tipikil teu katempo. Lamun rata-rata jangkung lalaki nu umurna 21 taun nyaéta 5 kaki 9 inci, sarta kapilih sacara acak lalaki nu jangkungna 5 kaki 11 inci, mangka "kasalahan" nyaéta 2 inci; lamun sacara acak kapilih lalaki nu jangkungna 5 kaki 7 inci, mangka "kasalahan" nyaéta −2 inci. Istilah ieu diwangun tina ukuran kasalahan acak dina astronomi. Saperti dina ukuran jangkung lalaki tadi nu mana diukur tina rata-rata populasi, mangka beda antara jangkung lalaki jeung ukuran rata-rata mangrupa ukuran kasalahan.

Sesa nyaéta estimasi nu katempo tina kasalahan nu teu katempo. Pasualan nu gampang dina sampel acak jangkung lalaki n nyaéta ukuranna. Rata-rata sampel dipaké keur ngira-ngira rata-rata populasi. Mangka:

  • Beda antara unggal jangkung lalaki jeung rata-rata populasi nu teu katempo disebut kasalahan, sarta
  • Beda antara jangkung lalaki jeung rata-rata sampel disebut sesa.
Sesa bisa katempo; kasalahan henteu.

Catetan: jumlah sesa sarua jeung nol, mangka sesa henteu mandiri. Jumlah kasalahan teu sarua jeung nol; kasalahan mangrupa variabel acak mandiri lamun dicokot tina populasi nu mandiri.

Kasalahan ilaharna masing-masing mandiri; sesa ilaharna henteu mandiri tinu sejen.

Conto

édit

Lamun urang nganggap populasi nu kasebar normal mibanda méan μ sarta simpangan baku σ, sarta individu nu dipilih bébas, mangka

 

sarta sampel méan mangrupa sebaran variabel random:

 

Mangka kasalahan nyaéta

 

sedengkeun sesa nyaéta

 

(Saperti nu ilahar dipaké, tanda "topi" di handapeun aksara ε nunjukkeun estimasi observasi tina kuantitas nu teu kaobservasi disebut ε.)

Jumlah kuadrat kasalahan, dibagi ku σ2, mibanda sebaran chi-kuadrat mibanda n tingkat kebébasan:

 

Nilai ieu teu bisa kapanggih, sedengkeun kuadrat jumlah sesa, bisa kapanggih. Bagi ieu jumlah ku σ2 nu mibanda sebaran chi-kuadrat ngan ku n − 1 tingkat kabébasan:

 

Hal ieu bisa ditandaan yén variabel acak jeung sampel méan nembongkeun kamandirian sewang-sewangan. Ieu kanyataan sebaran normal jeung chi-kuadrat nembongkeun yén itungan bentuk dasar di luhur dumasar kana interval kapercayaan dina sebaran-t student. Batalna σ tina nu ngabagi jeung nu dibagi dina éta itungan nembongkeun yén aya kateujelasan nu nyababkeun ayana anggapan yén σ2 teu méré pangaruh nanaon.

Tempo ogé

édit

Studentized residual