Senin, 23 Juni 2025

Analisis PCA dengan Rstudio

 

Langkah PCA

1.       Normalisasi data untuk menyakana skala karena tanpa skala yang sama akan membuat perhitungan menjadi bias

2.       Covaiance matrix . Ini menyatakan hubungan anatara kedua variabel tersebut

3.       Eguinvalue yang secarha harfiah tegak lurus atau 90 derajat

4.       Memilih PCA dengan mlihat euginvector yang sama tingginya sednagkan komponen yang kedua adalah yang menjadi berikutnya.

5.       Mentransformasi dalam bentuk data yang baru. Mungkin binggung dengan komponen yang akan digunakan untuk menggunakan hal ini.

 

Dalam PCA kita bisa menggunakan untuk aplikasi sepeti

Keuangan kita bisa mengurangi dimesni dari faktor untuk meralam harga saham dan lain-lain

Pada keamanan hal ini bisa kita aplikasikan dengan cara yang mengenai sidik jari dan juga

Kesehatan hal ini untuk menduga

 

 

# Gunakan data bawaan

data("USArrests")

 

# Lihat ringkasan data

summary(USArrests)

 

# Cek apakah ada nilai yang hilang

anyNA(USArrests)

# Standardisasi data

USArrests_scaled <- scale(USArrests)

# Lakukan PCA

pca_result <- prcomp(USArrests_scaled, center = TRUE, scale. = TRUE)

 

# Lihat hasil ringkasan PCA

summary(pca_result)

Importance of components:

                          PC1    PC2     PC3

Standard deviation     1.5749 0.9949 0.59713

Proportion of Variance 0.6201 0.2474 0.08914

Cumulative Proportion  0.6201 0.8675 0.95664

                           PC4

Standard deviation     0.41645

Proportion of Variance 0.04336

Cumulative Proportion  1.00000

 

# Scree plot

screeplot(pca_result, type = "lines", main = "Scree Plot")



library(factoextra)

 

# Visualisasi eigenvalue

fviz_eig(pca_result)

# Melihat loadings (hubungan antar variabel dan komponen)

pca_result$rotation

Dalam dimesni ini kalau kita menjumlahkan kedua pc1 + pc2 yakni 62+24.7 artinya 86%.

 


# Komponen mana menjelaskan variabel apa?

# Biplot: visualisasi individu dan variabel

fviz_pca_biplot(pca_result, repel = TRUE)



Dalam PCA ini kita bisa menentukan kalau dua variabel baik assault maupun Murder adalah dua variabel yang mempunyai korelasi positif. Sedangkan rape menjadi lebi rendah sedangkan urban pop membentuk sudut yang besar dan menyebabkan korelasi menjadi rendah.


Tidak ada komentar:

Posting Komentar

SEM PLS with moderation using seminr package

semplscorp semplscorp SEM PLS Structural Equation Model Partial Least...