Mann Whitney
Apakah Itu Uji Mann Whitney
Pada artikel atau pos sebelumnya kita menguji dua sample dari sample berpasangan yang berarti sesudah dan sebelum perlakukan. Maka bagaiamana kalau ada sample yang tidak terkait dengan kelompok lainnya atau sampel merdeka (independent)? Maka tentu saja perhitungannya adalah perhitungan yang lain dan berbeda dari sample yang masih dalam pasangan (paired).
Tentu kita harus mengidentifikasi dulu yang mana yang termasuk independen dan yang mana termasuk dependen. Kasus ketika sebuah perusahaan ingin melihat kelompok pembelian yang berada di pulau Jawa dan pulau Sumatra. Tentu dua kelompok ini adalah kelompok yang independen. Penduduk Jawa mempunyai pereferensi konsumen yang beda dan juga pulau Sumatra. Dalam kasus ini berbeda.
Bisa juga penjualan di counter A dan counter B yang berbeda satu sama lainnya.
Melakukan Uji Mann Whitney
Jika sudah siap dengan data yang kita miliki maka kita bisa segera upload data yang sudah kita buat di spreadhseet. Adapun data ini terdiri dari tiga kolom pertama adalah nomor identitas dari data atau pasangan. kemudian yang kolom kedua adalah data dari grup yang dalam contoh ini adalah data kelompok satu dan kelompok dua dan kemudian data kolom ketiga adalah nilai dari penjualannya. penyusunan mode data seperti ini agar memudahkan dalam analisis. kalau menyusun dalam dua kolom yakni nilai penjualan di kolom kedua dan nilai stok di kolom ketiga maka ada penggunaan rumus yang lain. Kita akan menggelompokkan dua kelompok itu terlebih dahulu namun dengan cara ini maka saya akan lebih mudah untuk melakukan analisis.
library(readxl)
<- read_excel("C:/Users/HP/Documents/stat campur/Mann Whitney.xlsx", col_types = c("skip", "numeric", "numeric")) salesgroup
hasil dari upload ini adalah tibble. mungkin kalau anda menggunakan rstudio anda hasil datanya adalah data.frame. FYI, tibble adalah bentuk data frame yang lebih canggih. sesudah itu kita bisa masukkan analisis. Sebelum uji kita bisa melakukan bartlet test untuk memastikan data tidak terdistribusi normal
bartlett.test(salesgroup$`Sales`,salesgroup$'Retail Store',centre=mean)
Bartlett test of homogeneity of variances
data: salesgroup$Sales and salesgroup$"Retail Store"
Bartlett's K-squared = 0.0010458, df = 1, p-value = 0.9742
KIta bisa melihat nilai p value 0,9742 menunjukkan data tidak terdistribusi normal maka kita bisa lakukan uji non parametrik.
Kemudian kita uji dengan Mann Whitney test. Mann Whitney test serupa dengan Wilcoxon sum Rank bedakan dengan Wilcoxon Sign rank yang menguji sample berpasangan. Saya lebih memilih judul artikel dengan Mann Whitney agar tidak terjadi kekeliruan antara yang satu dengan yang lainnya.
wilcox.test(salesgroup$Sales~ salesgroup$`Retail Store`)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: salesgroup$Sales by salesgroup$`Retail Store`
W = 63.5, p-value = 0.3237
alternative hypothesis: true location shift is not equal to 0
hasilnya menunjukkan ternyata tidak ada perbedaan yang nyata atau signifikan antara toko retail (retail store) satu dengan dua.
Kita bisa menampilkan data descriptive sebagai berikut dan juga plotnya. tampilkan dulu package psych dan kemudian kita menggunakan fungsi describe.by karena bentuk tabel kita yang membagi tabel dalam kolom grup dan kolom nilai variabel. kalau dua kolom menggunakan nilai variabel dari dua kelompok maka gunakan fungsi describe.
library(psych)
describe.by(salesgroup$Sales,salesgroup$`Retail Store`)
Warning in describe.by(salesgroup$Sales, salesgroup$`Retail Store`):
describe.by is deprecated. Please use the describeBy function
Descriptive statistics by group
group: 1
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 10 68 29.36 70 67.5 25.95 20 120 100 0.06 -1.12 9.29
------------------------------------------------------------
group: 2
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 10 51 29.04 55 50 40.77 10 100 90 0.27 -1.31 9.18
boxplot(salesgroup$Sales~salesgroup$`Retail Store`,col=c("red","cyan"))
Dari box plot kita bisa melihat kalau nilai dari toko retail satu yang diwarnai merah adalah lebih tinggi dari toko retail kedua yang berwarna nila. Meskipun demikian uji tetap menyimpulkan kalau ternata tidak ada perbedaan yang signifikan dalam box plot tersebut. Baca Juga Uji Wilcoxon Sign Test