Tampilkan postingan dengan label non paramterik. Tampilkan semua postingan
Tampilkan postingan dengan label non paramterik. Tampilkan semua postingan

Minggu, 17 Agustus 2025

Uji Mann Whitney: Alternatif uji independent sample untuk data tidak terdistribusi normal

 

Mann Whitney

Mann Whitney

Apakah Itu Uji Mann Whitney

Pada artikel atau pos sebelumnya kita menguji dua sample dari sample berpasangan yang berarti sesudah dan sebelum perlakukan. Maka bagaiamana kalau ada sample yang tidak terkait dengan kelompok lainnya atau sampel merdeka (independent)? Maka tentu saja perhitungannya adalah perhitungan yang lain dan berbeda dari sample yang masih dalam pasangan (paired).

Tentu kita harus mengidentifikasi dulu yang mana yang termasuk independen dan yang mana termasuk dependen. Kasus ketika sebuah perusahaan ingin melihat kelompok pembelian yang berada di pulau Jawa dan pulau Sumatra. Tentu dua kelompok ini adalah kelompok yang independen. Penduduk Jawa mempunyai pereferensi konsumen yang beda dan juga pulau Sumatra. Dalam kasus ini berbeda.

Bisa juga penjualan di counter A dan counter B yang berbeda satu sama lainnya.

Melakukan Uji Mann Whitney

Jika sudah siap dengan data yang kita miliki maka kita bisa segera upload data yang sudah kita buat di spreadhseet. Adapun data ini terdiri dari tiga kolom pertama adalah nomor identitas dari data atau pasangan. kemudian yang kolom kedua adalah data dari grup yang dalam contoh ini adalah data kelompok satu dan kelompok dua dan kemudian data kolom ketiga adalah nilai dari penjualannya. penyusunan mode data seperti ini agar memudahkan dalam analisis. kalau menyusun dalam dua kolom yakni nilai penjualan di kolom kedua dan nilai stok di kolom ketiga maka ada penggunaan rumus yang lain. Kita akan menggelompokkan dua kelompok itu terlebih dahulu namun dengan cara ini maka saya akan lebih mudah untuk melakukan analisis.

library(readxl)
salesgroup<- read_excel("C:/Users/HP/Documents/stat campur/Mann Whitney.xlsx", col_types = c("skip", "numeric", "numeric"))

hasil dari upload ini adalah tibble. mungkin kalau anda menggunakan rstudio anda hasil datanya adalah data.frame. FYI, tibble adalah bentuk data frame yang lebih canggih. sesudah itu kita bisa masukkan analisis. Sebelum uji kita bisa melakukan bartlet test untuk memastikan data tidak terdistribusi normal

bartlett.test(salesgroup$`Sales`,salesgroup$'Retail Store',centre=mean)

    Bartlett test of homogeneity of variances

data:  salesgroup$Sales and salesgroup$"Retail Store"
Bartlett's K-squared = 0.0010458, df = 1, p-value = 0.9742

KIta bisa melihat nilai p value 0,9742 menunjukkan data tidak terdistribusi normal maka kita bisa lakukan uji non parametrik.

Kemudian kita uji dengan Mann Whitney test. Mann Whitney test serupa dengan Wilcoxon sum Rank bedakan dengan Wilcoxon Sign rank yang menguji sample berpasangan. Saya lebih memilih judul artikel dengan Mann Whitney agar tidak terjadi kekeliruan antara yang satu dengan yang lainnya.

wilcox.test(salesgroup$Sales~ salesgroup$`Retail Store`)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  salesgroup$Sales by salesgroup$`Retail Store`
W = 63.5, p-value = 0.3237
alternative hypothesis: true location shift is not equal to 0

hasilnya menunjukkan ternyata tidak ada perbedaan yang nyata atau signifikan antara toko retail (retail store) satu dengan dua.

Kita bisa menampilkan data descriptive sebagai berikut dan juga plotnya. tampilkan dulu package psych dan kemudian kita menggunakan fungsi describe.by karena bentuk tabel kita yang membagi tabel dalam kolom grup dan kolom nilai variabel. kalau dua kolom menggunakan nilai variabel dari dua kelompok maka gunakan fungsi describe.

library(psych)
describe.by(salesgroup$Sales,salesgroup$`Retail Store`)
Warning in describe.by(salesgroup$Sales, salesgroup$`Retail Store`):
describe.by is deprecated.  Please use the describeBy function

 Descriptive statistics by group 
group: 1
   vars  n mean    sd median trimmed   mad min max range skew kurtosis   se
X1    1 10   68 29.36     70    67.5 25.95  20 120   100 0.06    -1.12 9.29
------------------------------------------------------------ 
group: 2
   vars  n mean    sd median trimmed   mad min max range skew kurtosis   se
X1    1 10   51 29.04     55      50 40.77  10 100    90 0.27    -1.31 9.18
boxplot(salesgroup$Sales~salesgroup$`Retail Store`,col=c("red","cyan"))

Dari box plot kita bisa melihat kalau nilai dari toko retail satu yang diwarnai merah adalah lebih tinggi dari toko retail kedua yang berwarna nila. Meskipun demikian uji tetap menyimpulkan kalau ternata tidak ada perbedaan yang signifikan dalam box plot tersebut. Baca Juga Uji Wilcoxon Sign Test

Membuat Box Plot

Uji Independen t samples

Peramalan menggunakan Simple Extropolation Smoothing pada data drivers

  Simple exptrapolating Smoothing Simple exptrapolating Smoothing ...