Andri Faisal R Stat

Rabu, 25 Juni 2025

Analisis Faktor Rstudio

Analisis Faktor

0.1 Analisis Faktor

Dalam analisis faktor kita melihat faktor-faktor dalam statsitik. Dalam ilmu statistik kalau kita melihat bahwa ada pengaruh dalam suatu faktor. maka kalau kita bandingkan dengan beberapa faktor maka kita kan melihat faktor yang mempegaruhinya. Tujuan dari Analisis faktor adalah beberapa hal yang ada di bawah ini: 1. Menyederhanakan bentuk faktor. ada dugaan banyak sekali faktor yang berhubungan maka dengan mencari yang lebih penting akan membuat faktor tersebut lebih penting. 2. Mengelompokkan variabel. Ada faktor yang mungkin akan bisa mengelompokkan ke dalam kelompok 3. Identifikasi struktur menjelaskan hubungan antara beberapa variabel.

Untuk memahami contoh dalam analisis faktor ini kita akan menggunakan data atau set data yang bernama Swiss. Ini sudah ada di Rstudio dan kita tinggal menampilkan saja data ini. Langkah-langkahnya adalah seperti ini.

data("swiss")
head(swiss)

##              Fertility Agriculture Examination
## Courtelary        80.2        17.0          15
## Delemont          83.1        45.1           6
## Franches-Mnt      92.5        39.7           5
## Moutier           85.8        36.5          12
## Neuveville        76.9        43.5          17
## Porrentruy        76.1        35.3           9
##              Education Catholic Infant.Mortality
## Courtelary          12     9.96             22.2
## Delemont             9    84.84             22.2
## Franches-Mnt         5    93.40             20.2
## Moutier              7    33.77             20.3
## Neuveville          15     5.16             20.6
## Porrentruy           7    90.57             26.6

str(swiss)

## 'data.frame':    47 obs. of  6 variables:
##  $ Fertility       : num  80.2 83.1 92.5 85.8 76.9 76.1 83.8 92.4 82.4 82.9 ...
##  $ Agriculture     : num  17 45.1 39.7 36.5 43.5 35.3 70.2 67.8 53.3 45.2 ...
##  $ Examination     : int  15 6 5 12 17 9 16 14 12 16 ...
##  $ Education       : int  12 9 5 7 15 7 7 8 7 13 ...
##  $ Catholic        : num  9.96 84.84 93.4 33.77 5.16 ...
##  $ Infant.Mortality: num  22.2 22.2 20.2 20.3 20.6 26.6 23.6 24.9 21 24.4 ...

# Memilih variabel untuk analisis faktor
swiss_subset <- swiss[, c("Fertility", "Agriculture", "Examination", "Education")]

0.2 Langkah Utama

Pada dasarnya kita bisa melakukan beberapa hal dalam analisis faktor seperti :

Ekstaksi Faktor : MEnemukan faktor dari beberapa faktor atau mengesktraknya
Rotasi FAktor: Dengan menggunakan VArimax atau oblimin untuk mempermudah interrestasi faktor
Interprestasi faktor menentukan nama atau makna faktor yang memili loading tinggi

Kemudian kita memeriksa kelengkapan data. setelah melakukan standarisasi data

# Memeriksa data yang hilang
summary(swiss_subset)

##    Fertility      Agriculture     Examination   
##  Min.   :35.00   Min.   : 1.20   Min.   : 3.00  
##  1st Qu.:64.70   1st Qu.:35.90   1st Qu.:12.00  
##  Median :70.40   Median :54.10   Median :16.00  
##  Mean   :70.14   Mean   :50.66   Mean   :16.49  
##  3rd Qu.:78.45   3rd Qu.:67.65   3rd Qu.:22.00  
##  Max.   :92.50   Max.   :89.70   Max.   :37.00  
##    Education    
##  Min.   : 1.00  
##  1st Qu.: 6.00  
##  Median : 8.00  
##  Mean   :10.98  
##  3rd Qu.:12.00  
##  Max.   :53.00

# Standarisasi data
swiss_standardized <- scale(swiss_subset)
summary(cars)

##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

0.3 Analisis Faktor FA

Melakukan analisis faktor FA dan menggunakan rotasi Varimax

library(psych)

## Warning: package 'psych' was built under R version
## 4.3.2

## 
## Attaching package: 'psych'

## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha

factor_analysis <- fa(swiss_standardized, nfactors = 2, rotate = "varimax")

Setelah itu kita bisa menampilkan hasil analisis seperti dibawah ini Hasilnya menunjukkan dari struktur tersebut Variabel Fertility dan Agriculture cenderung berkorelasi positif dengan faktor 1, sementara variabel Examination dan Education cenderung berkorelasi positif dengan faktor 2.

# Tampilkan hasil analisis faktor
print(factor_analysis)

## Factor Analysis using method =  minres
## Call: fa(r = swiss_standardized, nfactors = 2, rotate = "varimax")
## Standardized loadings (pattern matrix) based upon correlation matrix
##               MR1   MR2   h2   u2 com
## Fertility   -0.19 -0.92 0.88 0.12 1.1
## Agriculture -0.93 -0.19 0.90 0.10 1.1
## Examination  0.62  0.57 0.72 0.28 2.0
## Education    0.57  0.60 0.69 0.31 2.0
## 
##                       MR1  MR2
## SS loadings           1.6 1.58
## Proportion Var        0.4 0.39
## Cumulative Var        0.4 0.79
## Proportion Explained  0.5 0.50
## Cumulative Proportion 0.5 1.00
## 
## Mean item complexity =  1.5
## Test of the hypothesis that 2 factors are sufficient.
## 
## df null model =  6  with the objective function =  2.22 with Chi Square =  97.29
## df of  the model are -1  and the objective function was  0 
## 
## The root mean square of the residuals (RMSR) is  0 
## The df corrected root mean square of the residuals is  NA 
## 
## The harmonic n.obs is  47 with the empirical chi square  0  with prob <  NA 
## The total n.obs was  47  with Likelihood Chi Square =  0  with prob <  NA 
## 
## Tucker Lewis Index of factoring reliability =  1.068
## Fit based upon off diagonal values = 1
## Measures of factor score adequacy             
##                                                    MR1
## Correlation of (regression) scores with factors   0.94
## Multiple R square of scores with factors          0.89
## Minimum correlation of possible factor scores     0.78
##                                                    MR2
## Correlation of (regression) scores with factors   0.94
## Multiple R square of scores with factors          0.88
## Minimum correlation of possible factor scores     0.76

# Tampilkan loadings faktor
print(factor_analysis$loadings)

## 
## Loadings:
##             MR1    MR2   
## Fertility   -0.191 -0.919
## Agriculture -0.927 -0.191
## Examination  0.623  0.573
## Education    0.565  0.605
## 
##                  MR1   MR2
## SS loadings    1.602 1.575
## Proportion Var 0.401 0.394
## Cumulative Var 0.401 0.794

# Plot scree plot
plot(factor_analysis$values, type = "b", 
     main = "Scree Plot", xlab = "Factor", ylab = "Eigenvalue", col = "red")

Senin, 23 Juni 2025

Analisis PCA dengan Rstudio

Langkah PCA

1. Normalisasi data untuk menyakana skala karena tanpa skala yang sama akan membuat perhitungan menjadi bias

2. Covaiance matrix . Ini menyatakan hubungan anatara kedua variabel tersebut

3. Eguinvalue yang secarha harfiah tegak lurus atau 90 derajat

4. Memilih PCA dengan mlihat euginvector yang sama tingginya sednagkan komponen yang kedua adalah yang menjadi berikutnya.

5. Mentransformasi dalam bentuk data yang baru. Mungkin binggung dengan komponen yang akan digunakan untuk menggunakan hal ini.

Dalam PCA kita bisa menggunakan untuk aplikasi sepeti

Keuangan kita bisa mengurangi dimesni dari faktor untuk meralam harga saham dan lain-lain

Pada keamanan hal ini bisa kita aplikasikan dengan cara yang mengenai sidik jari dan juga

Kesehatan hal ini untuk menduga

# Gunakan data bawaan

data("USArrests")

# Lihat ringkasan data

summary(USArrests)

# Cek apakah ada nilai yang hilang

anyNA(USArrests)

# Standardisasi data

USArrests_scaled <- scale(USArrests)

# Lakukan PCA

pca_result <- prcomp(USArrests_scaled, center = TRUE, scale. = TRUE)

# Lihat hasil ringkasan PCA

summary(pca_result)

Importance of components:

PC1 PC2 PC3

Standard deviation 1.5749 0.9949 0.59713

Proportion of Variance 0.6201 0.2474 0.08914

Cumulative Proportion 0.6201 0.8675 0.95664

PC4

Standard deviation 0.41645

Proportion of Variance 0.04336

Cumulative Proportion 1.00000

# Scree plot

screeplot(pca_result, type = "lines", main = "Scree Plot")

library(factoextra)

# Visualisasi eigenvalue

fviz_eig(pca_result)

# Melihat loadings (hubungan antar variabel dan komponen)

pca_result$rotation

Dalam dimesni ini kalau kita menjumlahkan kedua pc1 + pc2 yakni 62+24.7 artinya 86%.

# Komponen mana menjelaskan variabel apa?

# Biplot: visualisasi individu dan variabel

fviz_pca_biplot(pca_result, repel = TRUE)

Dalam PCA ini kita bisa menentukan kalau dua variabel baik assault maupun Murder adalah dua variabel yang mempunyai korelasi positif. Sedangkan rape menjadi lebi rendah sedangkan urban pop membentuk sudut yang besar dan menyebabkan korelasi menjadi rendah.

Sabtu, 26 Oktober 2024

Membuat List dalam Rstudio

Membuat LIst di Rstudio

Apa Itu List

List adalah salah satu bentuk data dalam Rstudio. Dengan ada LIst kita mengelola data. Keuntungan dari menggunakan list ini adalah kita bisa menyimpan dalam data yang berbeda seperti vektor, data frame, model, fungsi, dan lain-lain. Dengan adanya list kita bisa mudah mengakses ke suatu data tersebut.

# Membuat list sederhana
listku <- list(
  angka = 47,                   # elemen dengan tipe data numerik
  teks = "Halo, dunia!",        # elemen dengan tipe data karakter
  vektor = c(3, 1, 2, 4),       # elemen dengan tipe data vektor numerik
  matrix = matrix(1:4, 2, 2),   # elemen dengan tipe data matriks
  data = data.frame(A = 1:3, B = c("a", "b", "c"))  # elemen dengan tipe data data frame
)

# Menampilkan isi list
print(listku)

$angka
[1] 47

$teks
[1] "Halo, dunia!"

$vektor
[1] 3 1 2 4

$matrix
     [,1] [,2]
[1,]    1    3
[2,]    2    4

$data
  A B
1 1 a
2 2 b
3 3 c

Senin, 14 Oktober 2024

Uji Anova Satu Arah dengan Rstudio

Uji Anova satu arah

Author

Andri Faisal

Anova Satu Arah

Anova adalah salah satu uji dalam analisis statistik yang bertujuan mencari perbedaan antara dua kelompok atau lebih. Dalam uji anova kita dapat menyimpulkan bahwa dalam beberapa kelompok tersebut ada satu kelompok yang berbeda dengan kelompok lainnya.

dataku <- data.frame(group = factor(c("A", "A", "A", "A", "B", "B", "B", "B", "C", "C", "C","C","C")),value = c(7,5,4,3,5,5,6,5,6,6,7,5,7)
)

Setelah itu kita tampilkan dataku

dataku

   group value
1      A     7
2      A     5
3      A     4
4      A     3
5      B     5
6      B     5
7      B     6
8      B     5
9      C     6
10     C     6
11     C     7
12     C     5
13     C     7

Kemudian kita bisa memerintahkan untuk mencari nilai dari ANOVA dengan cara mengetikan perintah aov

anova_result <- aov(value ~ group, data = dataku)
summary(anova_result)

            Df Sum Sq Mean Sq F value Pr(>F)
group        2  4.931   2.465   2.004  0.185
Residuals   10 12.300   1.230

Dalam perhitungan manual kita akan mendapatkan nilai dari F hitung adalah dua sedangkan kalau nilai F tabelnya adalah 4,10 kalau kita bandingkan maka nilainya itu lebih kecil daripada nilai table Fhit<Ftab maka bisa kita simpulkan bahwa tidak ada perbedaan antara ketiga kelompok tersebut.