Rabu, 27 Agustus 2025

Uji Chi Square

 

Chi Square

Chi Square

Uji Chi Square

Salah satu analsis untuk membedakan anatar grup satu dengan grup yang lainnya adalah dengan uji Chi (Baca: Kai) kuadrat. dalam uji ini kita bisa memebdakan dua kelompok atau lebih mempunyai ratra-rata ang berbeda. UJi ini juga dipakai untuk beberapa modle yang lebih canggih seperti uji data panel, SEM PLS, analisis faktor dan lain-lain.

Dalam Chi Square kita akan menjumpai frekuensi atau banyaknya data. Di awal pelajaran statistik kita menegtahui kalau frekuensi menunjukkan berapa kali data yang muncul pada interval tertentu atau kategori tertentu. Begitu juga dalam chi square berapa kali data yang muncul yang merupakan pemilik kategori satu dan juga pemilik kategori dua. Tiap individu berbeda namun dalam pemilihan kategori tersebut bisa jadi mereka mempunyai kategori yang sama karena pilihan (preferensi) mereka yang sama.

Sebelum melakuan uji chi square kita buat terlebih dahulu tabel kontingensi.TAbel ini adalah tabel yang menghubungi antara dua kategori atau lebih variabel yang diteliti.

Langkah Analisis

Data yang disiapkan adalah kategori jenis kelamin yakni dua pria dan wanita serta kategori dari data pilihan parfum yakni parfum A atau Parfum B. Maka dari tiga puluh data yang sudah didapat dari pengumpulan data sebelumnya.

# Data dari dua variabel kategoris
data_chi <- data.frame(
  Jenis_Kelamin = c(rep("Pria", 30), rep("Wanita", 40)),
  Pilihan = c(rep("Parfum A", 20), rep("Parfum B", 10), rep("Parfum A", 15), rep("Parfum B", 25))
)

# Membuat tabel kontingensi
tabel_kontingensi <- table(data_chi$Jenis_Kelamin, data_chi$Pilihan)
print(tabel_kontingensi)
        
         Parfum A Parfum B
  Pria         20       10
  Wanita       15       25

Melakukan uji chi square pada tabel kontingensi di atas

chisq.test(tabel_kontingensi)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel_kontingensi
X-squared = 4.725, df = 1, p-value = 0.02973

Hasil menunjukkan nilai p value adalah 0,02973 dan dibawah 0,05 maka artinya adalah ada perbedaan yang signifikan antara proporsi diatas.

##Contoh Lain Kalau diatas adlah menggunakan tabel kontingensi yang sudah diolah bagaiaman mengolah data dari suatu dataset (kumpulan data). Kali ini adalah contoh esoph yakni penderita penyakit kanker esophagus. data ini adalah datset dalam bentuk data.frame teridir dari agegp usia dari penderita, alcgp yakni kaitan dnegan alkohol, tobgp kaitan dnegan tembakau atau rokok, jumlah casus ncases dan juga ncontorls. PAda contoh ini saya membuat tabel kontingneis berdasarkan umur dan juga penggunnaan tembakau atau rokok.

kontingensi_esoph<-table(esoph$agegp,esoph$tobgp)
print(kontingensi_esoph)
       
        0-9g/day 10-19 20-29 30+
  25-34        4     4     3   4
  35-44        4     4     4   3
  45-54        4     4     4   4
  55-64        4     4     4   4
  65-74        4     4     4   3
  75+          4     4     1   2

Kemudian saya lakukan uji chi square seperti dibawah ini

chisq.test(kontingensi_esoph)
Warning in chisq.test(kontingensi_esoph): Chi-squared approximation may be
incorrect

    Pearson's Chi-squared test

data:  kontingensi_esoph
X-squared = 2.4, df = 15, p-value = 0.9999
fisher.test(kontingensi_esoph)

    Fisher's Exact Test for Count Data

data:  kontingensi_esoph
p-value = 0.9999
alternative hypothesis: two.sided

Dari haasilchi square menunjukan nilainya yang mendekati satu dan ada satu warning kalau perhitungan tidak akurat. Oleh karena itu menggunakan fisher. test dan menunjukkan kalau tidak ada perbedaan yang nyata anatara usia dengan kategori penggunaan tembakau.

baca juga: Uji Anova Satu Arah

Membuat Data Tabulasi Silang

Jenis Data Statistik

Peramalan menggunakan Simple Extropolation Smoothing pada data drivers

  Simple exptrapolating Smoothing Simple exptrapolating Smoothing ...