regresi time series
Regresi Time Series
Hal ini diperlukan untuk suatu metode regresi yang neggunakan data time series atau data berkala. Kita ingin menguji bebebrapa variabel dalam data berkala. tentu regresi dengan data yang sama yakni Autoregresi juga bisa dilakukan namun pada bahasan ini adalah mengenai data time series. saya sebelumnya gak yakin sampai saya ketemukan artikel Wei (2011) menunjukkan adanya data deret waktu yang menjadi time series. Dengan adanya ini pasti ada sutu perlakuan yang bisa digunakan. untuk memprediksi hubungan antara variabel tidak bebas atau dpendedn dengan variabel bebas. Apakah mungkin ada data time series untuk regresi. Jelas ada. Hal itu id dukung oleh beberapa refeensi baik jurnal atau buku namun yang saya temukan adalah jurnal yang mendukung itu. Seperti dataset yang namannya Drivers adalah kumpulan banyak variabel yang sevara berkala yakni banyaknya korban dalam kecelakaan berpengaruh dengan banyak variable bebas yang disisun menurut deret waktu, adapun variabel independen dalam regresi model ini adalah jumlah supir (drivers) yang meninggal karena kecelakaan lalu lintas.
Menjalankan Uji
Tampilkan beberapa package terlebih dahulu seperti yang ada di bawah ini Package yang digunakan adalah zoo, lmtest, car, CarData, dan tseries. Pastikan sudah menjalankan package tersebut agar bisa untuk menyelesaikan persoala regresi ini.
kemudian penulis akan membuat model regresi yang terdiri dari Driverskilled dengan variabel indepenndenya adalah drivers, front, rear, kms, PetrolPrice, VanKilled dan juga law untuk mode regresi yang kedua (model regresi_sb2) menghilangkan variabel front sedangkan untk regresi yang ketiga (model regresi_sb3) menghilangkan variabel rear.
Meskipun nilai hasil regresi itu tidak mengembirakan namun hasil dari beberapa asumsi adalah jasil yang baik. dari leda model tersebut kalau nilai residual lebih besar dari p >0,05 maka hasil dari model ini bias dikatakan residual dari model terdistribusi normal.
Kalau saja salah satu variabel diikutkan maka terjadi multikolinearitas maka ada penghilangan variabel tersebut sehingga tidak terjadi multikolinearitas. oilihan untuk menyelesaikannya adalah dengan membuang salah satu variabel variabel rear dan variabel front.
Pada bagian hetersokedtatisitas dengan uji bresuch pagan yang menunjukkan nilai p nya lebih besar dari 0,05 (P>0,05). Nilai ini menunjukkan kalau tidak terjadi heteroskedatisitas. Kedua model baik model regresi_sb2 dan regresi_sb3 tidak mengalami heteroskedatisitas.
library(zoo)
Attaching package: 'zoo'
The following objects are masked from 'package:base':
as.Date, as.Date.numeric
library(lmtest)
library(carData)
library(car)
<-lm(DriversKilled~drivers+rear+kms+PetrolPrice+VanKilled+law,data=Seatbelts)
regresi_sb2vif(regresi_sb2)
drivers rear kms PetrolPrice VanKilled law
2.120980 1.808985 2.467789 1.398300 1.591006 1.503707
shapiro.test(residuals(regresi_sb2))
Shapiro-Wilk normality test
data: residuals(regresi_sb2)
W = 0.99183, p-value = 0.3548
bptest(regresi_sb2)
studentized Breusch-Pagan test
data: regresi_sb2
BP = 3.7453, df = 6, p-value = 0.7111
dwtest(regresi_sb2)
Durbin-Watson test
data: regresi_sb2
DW = 1.9878, p-value = 0.35
alternative hypothesis: true autocorrelation is greater than 0
summary(regresi_sb2)
Call:
lm(formula = DriversKilled ~ drivers + rear + kms + PetrolPrice +
VanKilled + law, data = Seatbelts)
Residuals:
Min 1Q Median 3Q Max
-29.482 -7.792 -0.591 7.788 34.370
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.485e+01 1.293e+01 -1.922 0.0561 .
drivers 8.247e-02 4.204e-03 19.616 <2e-16 ***
rear 5.810e-04 1.353e-02 0.043 0.9658
kms 6.381e-04 4.470e-04 1.427 0.1551
PetrolPrice -9.821e+00 8.119e+01 -0.121 0.9038
VanKilled 6.273e-02 2.899e-01 0.216 0.8290
law 4.644e+00 3.149e+00 1.475 0.1420
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 11.55 on 185 degrees of freedom
Multiple R-squared: 0.7993, Adjusted R-squared: 0.7928
F-statistic: 122.8 on 6 and 185 DF, p-value: < 2.2e-16
<-lm(DriversKilled~drivers+front+rear+kms+PetrolPrice+VanKilled,data=Seatbelts)
regresi_sb3summary(regresi_sb3)
Call:
lm(formula = DriversKilled ~ drivers + front + rear + kms + PetrolPrice +
VanKilled, data = Seatbelts)
Residuals:
Min 1Q Median 3Q Max
-28.363 -7.729 -0.476 6.770 35.914
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.972e+01 1.427e+01 -1.381 0.169
drivers 8.494e-02 5.284e-03 16.075 <2e-16 ***
front -1.472e-02 1.335e-02 -1.103 0.272
rear 1.882e-02 2.063e-02 0.912 0.363
kms 5.109e-04 4.966e-04 1.029 0.305
PetrolPrice -2.368e+01 8.611e+01 -0.275 0.784
VanKilled 2.228e-02 2.887e-01 0.077 0.939
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 11.58 on 185 degrees of freedom
Multiple R-squared: 0.7982, Adjusted R-squared: 0.7917
F-statistic: 122 on 6 and 185 DF, p-value: < 2.2e-16
vif(regresi_sb3)
drivers front rear kms PetrolPrice VanKilled
3.334063 7.776736 4.185670 3.029954 1.564792 1.569653
dwtest(regresi_sb3)
Durbin-Watson test
data: regresi_sb3
DW = 1.9784, p-value = 0.3364
alternative hypothesis: true autocorrelation is greater than 0
bptest(regresi_sb3)
studentized Breusch-Pagan test
data: regresi_sb3
BP = 2.9159, df = 6, p-value = 0.8193
shapiro.test(residuals(regresi_sb3))
Shapiro-Wilk normality test
data: residuals(regresi_sb3)
W = 0.99201, p-value = 0.3737
Dalam hasil mode regresi_sb2 terlihat bahwa hanya variabel indepnden saja yang drivers saja yang signifikan. Dalam regresi sb 2 variabel front dhilangkan karena terindikasi adanya multikoloibearitas yang nilai vifnya lebih besar daripada 12, . sedangkan pada model regresisb_3 juga mengilangkan variabel rear sehingga model ini juga lolos daripada asumsi terjadinya multikolinearitas.
par(mar=c(4,4,2,1)) # margin lebih ramping
qqnorm(residuals(regresi_sb2))
qqline(residuals(regresi_sb2), col = "red")
Data residual menunjukkan kalau model regresi tersbeut normal.
Tidak ada komentar:
Posting Komentar