Kamis, 18 September 2025

Regresi Time Series Pada Data Drivers Data Set

regresi time series

regresi time series

Regresi Time Series

Hal ini diperlukan untuk suatu metode regresi yang neggunakan data time series atau data berkala. Kita ingin menguji bebebrapa variabel dalam data berkala. tentu regresi dengan data yang sama yakni Autoregresi juga bisa dilakukan namun pada bahasan ini adalah mengenai data time series. saya sebelumnya gak yakin sampai saya ketemukan artikel Wei (2011) menunjukkan adanya data deret waktu yang menjadi time series. Dengan adanya ini pasti ada sutu perlakuan yang bisa digunakan. untuk memprediksi hubungan antara variabel tidak bebas atau dpendedn dengan variabel bebas. Apakah mungkin ada data time series untuk regresi. Jelas ada. Hal itu id dukung oleh beberapa refeensi baik jurnal atau buku namun yang saya temukan adalah jurnal yang mendukung itu. Seperti dataset yang namannya Drivers adalah kumpulan banyak variabel yang sevara berkala yakni banyaknya korban dalam kecelakaan berpengaruh dengan banyak variable bebas yang disisun menurut deret waktu, adapun variabel independen dalam regresi model ini adalah jumlah supir (drivers) yang meninggal karena kecelakaan lalu lintas.

Menjalankan Uji

Tampilkan beberapa package terlebih dahulu seperti yang ada di bawah ini Package yang digunakan adalah zoo, lmtest, car, CarData, dan tseries. Pastikan sudah menjalankan package tersebut agar bisa untuk menyelesaikan persoala regresi ini.

kemudian penulis akan membuat model regresi yang terdiri dari Driverskilled dengan variabel indepenndenya adalah drivers, front, rear, kms, PetrolPrice, VanKilled dan juga law untuk mode regresi yang kedua (model regresi_sb2) menghilangkan variabel front sedangkan untk regresi yang ketiga (model regresi_sb3) menghilangkan variabel rear.

Meskipun nilai hasil regresi itu tidak mengembirakan namun hasil dari beberapa asumsi adalah jasil yang baik. dari leda model tersebut kalau nilai residual lebih besar dari p >0,05 maka hasil dari model ini bias dikatakan residual dari model terdistribusi normal.

Kalau saja salah satu variabel diikutkan maka terjadi multikolinearitas maka ada penghilangan variabel tersebut sehingga tidak terjadi multikolinearitas. oilihan untuk menyelesaikannya adalah dengan membuang salah satu variabel variabel rear dan variabel front.

Pada bagian hetersokedtatisitas dengan uji bresuch pagan yang menunjukkan nilai p nya lebih besar dari 0,05 (P>0,05). Nilai ini menunjukkan kalau tidak terjadi heteroskedatisitas. Kedua model baik model regresi_sb2 dan regresi_sb3 tidak mengalami heteroskedatisitas.

library(zoo)

Attaching package: 'zoo'
The following objects are masked from 'package:base':

    as.Date, as.Date.numeric
library(lmtest)
library(carData)
library(car)
regresi_sb2<-lm(DriversKilled~drivers+rear+kms+PetrolPrice+VanKilled+law,data=Seatbelts)
vif(regresi_sb2)  
    drivers        rear         kms PetrolPrice   VanKilled         law 
   2.120980    1.808985    2.467789    1.398300    1.591006    1.503707 
shapiro.test(residuals(regresi_sb2))

    Shapiro-Wilk normality test

data:  residuals(regresi_sb2)
W = 0.99183, p-value = 0.3548
bptest(regresi_sb2)

    studentized Breusch-Pagan test

data:  regresi_sb2
BP = 3.7453, df = 6, p-value = 0.7111
dwtest(regresi_sb2)

    Durbin-Watson test

data:  regresi_sb2
DW = 1.9878, p-value = 0.35
alternative hypothesis: true autocorrelation is greater than 0
summary(regresi_sb2)

Call:
lm(formula = DriversKilled ~ drivers + rear + kms + PetrolPrice + 
    VanKilled + law, data = Seatbelts)

Residuals:
    Min      1Q  Median      3Q     Max 
-29.482  -7.792  -0.591   7.788  34.370 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.485e+01  1.293e+01  -1.922   0.0561 .  
drivers      8.247e-02  4.204e-03  19.616   <2e-16 ***
rear         5.810e-04  1.353e-02   0.043   0.9658    
kms          6.381e-04  4.470e-04   1.427   0.1551    
PetrolPrice -9.821e+00  8.119e+01  -0.121   0.9038    
VanKilled    6.273e-02  2.899e-01   0.216   0.8290    
law          4.644e+00  3.149e+00   1.475   0.1420    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.55 on 185 degrees of freedom
Multiple R-squared:  0.7993,    Adjusted R-squared:  0.7928 
F-statistic: 122.8 on 6 and 185 DF,  p-value: < 2.2e-16
regresi_sb3<-lm(DriversKilled~drivers+front+rear+kms+PetrolPrice+VanKilled,data=Seatbelts)
summary(regresi_sb3)

Call:
lm(formula = DriversKilled ~ drivers + front + rear + kms + PetrolPrice + 
    VanKilled, data = Seatbelts)

Residuals:
    Min      1Q  Median      3Q     Max 
-28.363  -7.729  -0.476   6.770  35.914 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -1.972e+01  1.427e+01  -1.381    0.169    
drivers      8.494e-02  5.284e-03  16.075   <2e-16 ***
front       -1.472e-02  1.335e-02  -1.103    0.272    
rear         1.882e-02  2.063e-02   0.912    0.363    
kms          5.109e-04  4.966e-04   1.029    0.305    
PetrolPrice -2.368e+01  8.611e+01  -0.275    0.784    
VanKilled    2.228e-02  2.887e-01   0.077    0.939    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.58 on 185 degrees of freedom
Multiple R-squared:  0.7982,    Adjusted R-squared:  0.7917 
F-statistic:   122 on 6 and 185 DF,  p-value: < 2.2e-16
vif(regresi_sb3)
    drivers       front        rear         kms PetrolPrice   VanKilled 
   3.334063    7.776736    4.185670    3.029954    1.564792    1.569653 
dwtest(regresi_sb3)

    Durbin-Watson test

data:  regresi_sb3
DW = 1.9784, p-value = 0.3364
alternative hypothesis: true autocorrelation is greater than 0
bptest(regresi_sb3) 

    studentized Breusch-Pagan test

data:  regresi_sb3
BP = 2.9159, df = 6, p-value = 0.8193
shapiro.test(residuals(regresi_sb3))

    Shapiro-Wilk normality test

data:  residuals(regresi_sb3)
W = 0.99201, p-value = 0.3737

Dalam hasil mode regresi_sb2 terlihat bahwa hanya variabel indepnden saja yang drivers saja yang signifikan. Dalam regresi sb 2 variabel front dhilangkan karena terindikasi adanya multikoloibearitas yang nilai vifnya lebih besar daripada 12, . sedangkan pada model regresisb_3 juga mengilangkan variabel rear sehingga model ini juga lolos daripada asumsi terjadinya multikolinearitas.

par(mar=c(4,4,2,1))  # margin lebih ramping
qqnorm(residuals(regresi_sb2))
qqline(residuals(regresi_sb2), col = "red")

Data residual menunjukkan kalau model regresi tersbeut normal.


Daftar Pustaka

References

Wei, William W S. 2011. Time Series Regression.” International Encyclopedia of Statistical Science, no. January 2011: 3–6. https://doi.org/10.1007/978-3-642-04898-2.

Tidak ada komentar:

Posting Komentar

Regresi Time Series Pada Data Drivers Data Set

regresi time series regresi time series Regresi Time Series Hal ini diperl...