Tampilkan postingan dengan label dataset. Tampilkan semua postingan
Tampilkan postingan dengan label dataset. Tampilkan semua postingan

Kamis, 21 Agustus 2025

Mencari Dataset di Rstudio untuk latihan beberapa metode analisis statistik

 Ketika kita mau mencari data untuk pelatihan mungkin kita masih bingung. Atau kita ingin mencoba satu metode yang lain dalam statistik mungkin kita terbatas dengan data yang ada. Kebanyakan kita ini yang sebagai dosen seringnya hanaya metode yang umum saja seperti regresi. Kalau ada yang lebih canggih itu SEM. Atau metode yang paling mudah adalah uji non parametrik. 


Maka kalau anda mau untuk melakukan beberapa uji atau mau belajar membutuhkan data. data ini juga kebanyakan gratis dan bisa dipakai. Tetapi anda juga harus hati-hati mengenai lisensi data tersebut. Dengan adanya data ini anda akan bisa mendapatkan banyak data. 


Data yang sering dipakai seperti iris yakni data bunga iris. mtcars berisikan data mobil dan mesinnya. Data Lynx yang berisikan jumlah kucing lynx yang tertangkap di Kanada. dan banyak lainnya untuk mengeceknya anda bisa ketika perintah 


data() maka anda akan menemui data seperti Air Passengers, BJSales, BOD, CO2 DNase. Eurostock, Formalhyde dan banyak lagi. untuk menampiklan data anda bisa melakukan perintah seperti ini tulis langsung namanya datanya seperti langsung nama datanya yakni 

> data()
> iris
    Sepal.Length Sepal.Width Petal.Length
1            5.1         3.5          1.4
2            4.9         3.0          1.4
3            4.7         3.2          1.3
4            4.6         3.1          1.5
5            5.0         3.6          1.4
6            5.4         3.9          1.7
7            4.6         3.4          1.4
8            5.0         3.4          1.5
9            4.4         2.9          1.4
10           4.9         3.1          1.5

    Petal.Width    Species
1           0.2     setosa
2           0.2     setosa
3           0.2     setosa
4           0.2     setosa
5           0.2     setosa
6           0.4     setosa
7           0.3     setosa
8           0.2     setosa
9           0.2     setosa
10          0.1     setosa

sebanarnya datanya sampai 150. saya potong untuk menghemat pos kemudian kita bisa menulis perintah dibawah untuk melihat struktur data dari iris

> str(iris)
'data.frame':	150 obs. of  5 variables:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
 $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
 $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
Kalau kita ingin melihat bagian awal saja dari tabel seperti menggunakan perintah head(data)
> head(iris)
  Sepal.Length Sepal.Width Petal.Length Petal.Width
1          5.1         3.5          1.4         0.2
2          4.9         3.0          1.4         0.2
3          4.7         3.2          1.3         0.2
4          4.6         3.1          1.5         0.2
5          5.0         3.6          1.4         0.2
6          5.4         3.9          1.7         0.4
  Species
1  setosa
2  setosa
3  setosa
4  setosa
5  setosa
6  setosa

KAlau kita ingin menampilkan bagian bawah kita bisa mengetikkan perintah tail(data)

> tail(iris)
    Sepal.Length Sepal.Width Petal.Length
145          6.7         3.3          5.7
146          6.7         3.0          5.2
147          6.3         2.5          5.0
148          6.5         3.0          5.2
149          6.2         3.4          5.4
150          5.9         3.0          5.1
    Petal.Width   Species
145         2.5 virginica
146         2.3 virginica
147         1.9 virginica
148         2.0 virginica
149         2.3 virginica
150         1.8 virginica
> View(iris)

iris maka akan muncul banyak nilai data. apalahi kalau data setnya kebanyakan. anda bisa memeriksa jenis data tersebut dengan perintah str(data) maka di situ akan menjelaskan data apa.misalnya dalam iris itu adalah data frame yang merupakan kumpulan dari data yang terdiri dari beberapa variabel yang di sana. Kemudian anda juga bisa menggunakan data dari package lain. kalau menggunakan package lain anda harus menjalankan perintah masuk ke package tersebut seperti dalam package MASS


>library(MASS)

>data(package="MASS)


maka anda akan mendapatkan banyak data di sini. ada beberapa package yang mempunyai data tertentu. sialahkan mencari data sesuai dengan kebutuhan anda, 

Peramalan menggunakan Simple Extropolation Smoothing pada data drivers

  Simple exptrapolating Smoothing Simple exptrapolating Smoothing ...