Chi Square
Uji Chi Square
Salah satu analsis untuk membedakan anatar grup satu dengan grup yang lainnya adalah dengan uji Chi (Baca: Kai) kuadrat. dalam uji ini kita bisa memebdakan dua kelompok atau lebih mempunyai ratra-rata ang berbeda. UJi ini juga dipakai untuk beberapa modle yang lebih canggih seperti uji data panel, SEM PLS, analisis faktor dan lain-lain.
Dalam Chi Square kita akan menjumpai frekuensi atau banyaknya data. Di awal pelajaran statistik kita menegtahui kalau frekuensi menunjukkan berapa kali data yang muncul pada interval tertentu atau kategori tertentu. Begitu juga dalam chi square berapa kali data yang muncul yang merupakan pemilik kategori satu dan juga pemilik kategori dua. Tiap individu berbeda namun dalam pemilihan kategori tersebut bisa jadi mereka mempunyai kategori yang sama karena pilihan (preferensi) mereka yang sama.
Sebelum melakuan uji chi square kita buat terlebih dahulu tabel kontingensi.TAbel ini adalah tabel yang menghubungi antara dua kategori atau lebih variabel yang diteliti.
Langkah Analisis
Data yang disiapkan adalah kategori jenis kelamin yakni dua pria dan wanita serta kategori dari data pilihan parfum yakni parfum A atau Parfum B. Maka dari tiga puluh data yang sudah didapat dari pengumpulan data sebelumnya.
# Data dari dua variabel kategoris
<- data.frame(
data_chi Jenis_Kelamin = c(rep("Pria", 30), rep("Wanita", 40)),
Pilihan = c(rep("Parfum A", 20), rep("Parfum B", 10), rep("Parfum A", 15), rep("Parfum B", 25))
)
# Membuat tabel kontingensi
<- table(data_chi$Jenis_Kelamin, data_chi$Pilihan)
tabel_kontingensi print(tabel_kontingensi)
Parfum A Parfum B
Pria 20 10
Wanita 15 25
Melakukan uji chi square pada tabel kontingensi di atas
chisq.test(tabel_kontingensi)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel_kontingensi
X-squared = 4.725, df = 1, p-value = 0.02973
Hasil menunjukkan nilai p value adalah 0,02973 dan dibawah 0,05 maka artinya adalah ada perbedaan yang signifikan antara proporsi diatas.
##Contoh Lain Kalau diatas adlah menggunakan tabel kontingensi yang sudah diolah bagaiaman mengolah data dari suatu dataset (kumpulan data). Kali ini adalah contoh esoph yakni penderita penyakit kanker esophagus. data ini adalah datset dalam bentuk data.frame teridir dari agegp usia dari penderita, alcgp yakni kaitan dnegan alkohol, tobgp kaitan dnegan tembakau atau rokok, jumlah casus ncases dan juga ncontorls. PAda contoh ini saya membuat tabel kontingneis berdasarkan umur dan juga penggunnaan tembakau atau rokok.
<-table(esoph$agegp,esoph$tobgp)
kontingensi_esophprint(kontingensi_esoph)
0-9g/day 10-19 20-29 30+
25-34 4 4 3 4
35-44 4 4 4 3
45-54 4 4 4 4
55-64 4 4 4 4
65-74 4 4 4 3
75+ 4 4 1 2
Kemudian saya lakukan uji chi square seperti dibawah ini
chisq.test(kontingensi_esoph)
Warning in chisq.test(kontingensi_esoph): Chi-squared approximation may be
incorrect
Pearson's Chi-squared test
data: kontingensi_esoph
X-squared = 2.4, df = 15, p-value = 0.9999
fisher.test(kontingensi_esoph)
Fisher's Exact Test for Count Data
data: kontingensi_esoph
p-value = 0.9999
alternative hypothesis: two.sided
Dari haasilchi square menunjukan nilainya yang mendekati satu dan ada satu warning kalau perhitungan tidak akurat. Oleh karena itu menggunakan fisher. test dan menunjukkan kalau tidak ada perbedaan yang nyata anatara usia dengan kategori penggunaan tembakau.
baca juga: Uji Anova Satu Arah