Dina statistik, analisa canonical correlation, dimimitian ku Harold Hotelling, nyaéta turus keur nyieun matrik cross-covariance.

Harti

édit

Ditangtukeun dua kolom vektor   jeung   variabel acak momen kadua, salah sahiji hartina cross-covarian   nu bakal jadi matriks   nu mana asupan   nyaéta kovarian  .

Analisa korelasi kanonik nyobaan   sarta   saperti dina variabele acak   jeung   ngamaksimalkeun korélasi  . Variabel acak   jeung   mangrupa pasangan munggaran variabel kanonik. Saterusna vektor ngamaksimalkeun subyek korelasi nu sarua keur negeskeun yén hal ieu teu pakait jeung pasangan munggaran variabel kanonik; hasilna nyaéta pasangan kadua variabel kanonik. Ieu prosedur terus lumangsung salila   kali.

Komputasi

édit

Bukti

édit

Anggap   jeung  . Paraméter nu dimaksimalkeun nyaéta

 

léngkah kahiji nyaéta ngahartikeun parobahan basis jeung hartina

 
 

Jeung saterusna jadi

 

Ngagunakeun kateusaruaan Cauchy-Schwarz, jadi

 
 

Hal ieu sarua lamun vektor   jeung   kolinier. Tambahanna, korelasi maksimum kahontal lamun   nyaéta vektor eigen ku nilai maksimal vektor eigen keur matrik   (tempo Rayleigh quotient). Pasangan saterusna bakal kapanggih ku cara nurunkeun gedéna nilai eigen. Sacara ortogonal dijamin ku matrik korelasi nu simetri.

Solusi

édit

Solusina nyaéta:

  •   nyaéta vektoreigen  
  •   nyaéta sabanding jeung  

Papasanganna nyaéta:

  •   nyaéta vektor eigen  
  •   nyaéta sabanding jeung  

Variabel kanonik dihartikeun ku:

 
 

Uji hipotesa

édit

Unggal baris bisa diuji signifikan-na ku cara métodeu nu bakal dijéntrékeun. Lamun   observasi mandiri dina sampel sarta   nyaéta korelasi estimasi  . Keur baris ka- , uji statistik nyaéta:

 

nu deukeut kana sebaran chi-square nu mana   tingkat kabebasan keur   nu gedé.[1]

Pamakean praktis

édit

Tipe husus keur koralsi kanonik dina psikologi nyaéta nyokot dua runtuyan variabel tur nempo sabaraha ilahar di antara dua uji. Contona, anjeun nyokot dua uji personal multidimensi nu geus aya saperti MMPI jeung NEO. Ku nempo kumaha faktor MMPI pakait jeung faktor Néo, anjeun bakal meunang hal nu jéntré kumaha dimensi nu ilahar antara dua uji sarta sakumaha béda varian nu dibagikeun. Contona, anjeun bisa manggihkeun yén versi leuwih atawa neuroticis diitung keur materi nu ngabagikeun varian antara dua uji.

Rujukan jeung tumbu kaluar

édit
  1. Kanti V. Mardia, J. T. Kent and J. M. Bibby (1979). Multivariate Analysis. Academic Press.