Minggu, 21 Juli 2024

Uji Kendal Tau statistik non parametrik

 

Dalam buku Andi Hakim Nasution, korelasi Kendal tau dimasikkkan pada bagian statistic non parametrik yang tentu berbeda. Kalau dalam regresi Kendal tau kita mencari hubungan antara korelasi yang positif dengan nilai yang positif positif sementara untuk Regresi Spearman kita harus mencari dulu peringkat atau ordinal atau rank yang akan melihat terlebih dahulu adakah hubungan antara kedua variable tersebut.

Kjuga memeriksa apakah itu yang Namanya Kendal Tau. Ini adalah sebuah koerlasi yang dibangun atas dasar adanya data yang tidak tersebar dengan normal.

Kendal Tau juga mengukur seberapa besar hubungan anatara data ordinal yang telah disiapkan. Maka jika ada data yang ada makakita bisa membuat korelasi seperti ini . Berikut perhitungan dalam Korelasi Kendal Tau adalah seperti ini:

Tau = (Nc-Nd)/1/2n(n-1)

 

Dimana

Nc = Nomor Concordant

Nd = Nomor Discordant

N =  jumlah pasangan

Hasil dari Kendal Tau akan seperti ini : nilai mendekati positif satu adalah korleasi yang sempurna sedngkan negative mendekati satu adalah nilai hubungan yang tidak sempurna.



#Uji Non Paramterik Kendall Tau
# Larger sample data
f
<- c(12, 14, 22, 10, 8, 25, 16, 18, 20, 30)
g
<- c(3, 5, 7, 1, 2, 6, 4, 8, 9, 10)

# Perform Kendall's Tau test
result
<- cor.test(f, g, method = "kendall")

# Print the result
print(result)

##
##  Kendall's rank correlation tau
##
## data:  f and g
## T = 38, p-value = 0.004687
## alternative hypothesis: true tau is not equal to 0
## sample estimates:
##       tau
## 0.6888889

# Load the ggplot2 library for visualization
library(ggplot2)

## Warning: package 'ggplot2' was built under R version 4.3.1

# Create a data frame
data
<- data.frame(f, g)

# Scatter plot
ggplot(data, aes(x=f, y=g)) +
 
geom_point() +
 
geom_smooth(method = "lm", se = FALSE, color = "blue") +
 
labs(title = "Scatter Plot with Kendall's Tau",
      
f = "Variable X",
      
g = "Variable Y")

## `geom_smooth()` using formula = 'y ~ x'

Jumat, 19 Juli 2024

Membuat Diagram dahan atau Grafik Daun di Rstudio

 Grafik daun adalah suatu grafik yang digunakan dalam ilmu statistik ia melihat atau mewakilkan sumbu x dengan sumbu y di mana sumbu x itu adalah nilai dari frekuensi suatu kategori yang diwakilkan oleh nilai y. Grafik ini disusun berdasarkan nilai-nilai dari data yang tersusun rapi menurut distribusi dan grafik ini digunakan untuk suatu distribusi yang kompleks. Biasanya penggunaan grafik ini hanya untuk distribusi nilai yang kompleks dan juga untuk analisis regresi dan juga analisis frekuensi.


Adapun grafik daun ini mempunyai keuntungan yaitu memudahkan visualisasi dari data yang telah kita tampilkan tersebut tetapi ia mempunyai beberapa keterangan yaitu seperti sulit untuk melihat jangkauan dari data titik kelebihan itu lainnya adalah dia bisa melihat nilai minimum kemudian juga nilai maksimum dan juga modus dan juga bagus untuk perbandingan dari dua pasangan data. Kekurangan lain dari data ini adalah kartu grafik ini adalah kalau penggunaan pada jumlah data yang banyak.

Grafik ini juga terdiri dari dua komponen yaitu batang dan daun yang menjadi batang itu adalah yang menunjukkan golongan dari data frekuensi tersebut nah kemudian juga yang menjadi daun adalah nilai dari belakang golongan tersebut titiknya karenanya mungkin sebagian dari kita agak merasa aneh dengan grafik tersebut kemudian kalau kita ingin membuat data tersebut kita akan lakukan dengan menyusun terlebih dahulu batang batang jadi kalau seperti di pohon itu batang itu merupakan hal yang utama terlebih dahulu tetapi dalam grafik ini tidak ada cabang atau ranting tetapi melainkan hanya Batang dari daun kemudian dari batang daun itu akan terdiri dari nilai-nilai akhir dari si grafik tersebut sehingga muncul disusun dari batang yang paling angkanya kecil di atas di pucuk sampai yang di belakang yang berada di bawah titik nah Anda bisa lihat kalau anda bayangkan jumlah data tersebut yang banyak maka akan semakin sulit untuk menggambarkan data tersebut.

Wa kalau dalam penggunaan regresi maka tentu berbeda dengan nilai frekuensi tersebut dalam prinsip ini juga bisa dilakukan pembuatan grafik daun cuma agak unik terlebih dahulu menggunakan sesuatu yang manual apalagi regresinya bisa lebih dari dua variabel tentu ini akan merepotkan Anda nah yang menjadi batang dalam grafik daun regresi adalah nilai prediksi yang dihasilkan oleh regresi tersebut kemudian yang menjadi daun itu adalah nilai dari residu yaitu yang merupakan selisih antara prediksi dengan nilai yang sebenarnya. Tentu setiap daun hanya memiliki satu helai saja kekurangan karena hanya ada satu residu untuk satu nilai prediksi.

> #membuat vector data nilai kelas statistika
> nilaistatistika = c(78,45,67,76,55,68,59,42,74,64)
>#membuat perintah grafik daun 
> stem(nilaistatistika)

  The decimal point is 1 digit(s) to the right of the |

  4 | 25
  5 | 59
  6 | 478
  7 | 468

dapat kita lihat nilai tersebut adalah 4 nilai dari puluhan yang merupakan nilai dari stataistika sendagnkan 2 dan 5 adalah mewakili nilia 42 dan 45 dan seterusnya ke bawag 

Senin, 08 Juli 2024

Uji Tanda atau Sign Test pada RStudio

 salah satu uji parametrik tabgf kita ketahui adalah uji tanda atau sign test . Dalam uji ini kita bisa memberikan penialain dengan tanda karenanya uji ini dinamakan uji tanda. Kita memberikan nilai teresbeut untuk membedakan antara nilai yang ada dan menguji apakah nilai tersebut 

menurut hipotesis tersebut dalam kasus ini kita menentukan terlebih dahulu nilai mediannya . Mungkin ini yang sulit karena harsu mengetahui datanya mengenai median itu sendiri. JIka anda ingin melakukan uji ini maka hal seperti ini bisa dilakukan 

#uji Sign Test R Studio

height <- c(158, 162, 159, 161, 160, 157, 163, 160, 164, 159)

median_hypothesis <- 160

signs <- sign(height - median_hypothesis)

positive_signs <- sum(signs == 1)

negative_signs <- sum(signs == -1)



Hipotesis nol adalah nilai median tinngi badan sebesar 160 

Ha Nilai mmedian tinggi badan bukan 160 


Dari perhtiungan nilai p leboh dari 0,5 maka kita menerima Ho bahwa tinggi badan sebesar 160 cm


Analisis Faktor Rstudio

  Analisis Faktor ...