Ketika kita mau mencari data untuk pelatihan mungkin kita masih bingung. Atau kita ingin mencoba satu metode yang lain dalam statistik mungkin kita terbatas dengan data yang ada. Kebanyakan kita ini yang sebagai dosen seringnya hanaya metode yang umum saja seperti regresi. Kalau ada yang lebih canggih itu SEM. Atau metode yang paling mudah adalah uji non parametrik.
Maka kalau anda mau untuk melakukan beberapa uji atau mau belajar membutuhkan data. data ini juga kebanyakan gratis dan bisa dipakai. Tetapi anda juga harus hati-hati mengenai lisensi data tersebut. Dengan adanya data ini anda akan bisa mendapatkan banyak data.
Data yang sering dipakai seperti iris yakni data bunga iris. mtcars berisikan data mobil dan mesinnya. Data Lynx yang berisikan jumlah kucing lynx yang tertangkap di Kanada. dan banyak lainnya untuk mengeceknya anda bisa ketika perintah
data() maka anda akan menemui data seperti Air Passengers, BJSales, BOD, CO2 DNase. Eurostock, Formalhyde dan banyak lagi. untuk menampiklan data anda bisa melakukan perintah seperti ini tulis langsung namanya datanya seperti langsung nama datanya yakni
> data() > iris Sepal.Length Sepal.Width Petal.Length 1 5.1 3.5 1.4 2 4.9 3.0 1.4 3 4.7 3.2 1.3 4 4.6 3.1 1.5 5 5.0 3.6 1.4 6 5.4 3.9 1.7 7 4.6 3.4 1.4 8 5.0 3.4 1.5 9 4.4 2.9 1.4 10 4.9 3.1 1.5 Petal.Width Species 1 0.2 setosa 2 0.2 setosa 3 0.2 setosa 4 0.2 setosa 5 0.2 setosa 6 0.4 setosa 7 0.3 setosa 8 0.2 setosa 9 0.2 setosa 10 0.1 setosa
sebanarnya datanya sampai 150. saya potong untuk menghemat pos kemudian kita bisa menulis perintah dibawah untuk melihat struktur data dari iris
> str(iris) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
Kalau kita ingin melihat bagian awal saja dari tabel seperti menggunakan perintah head(data) > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.1 3.5 1.4 0.2 2 4.9 3.0 1.4 0.2 3 4.7 3.2 1.3 0.2 4 4.6 3.1 1.5 0.2 5 5.0 3.6 1.4 0.2 6 5.4 3.9 1.7 0.4 Species 1 setosa 2 setosa 3 setosa 4 setosa 5 setosa 6 setosa
KAlau kita ingin menampilkan bagian bawah kita bisa mengetikkan perintah tail(data)
> tail(iris) Sepal.Length Sepal.Width Petal.Length 145 6.7 3.3 5.7 146 6.7 3.0 5.2 147 6.3 2.5 5.0 148 6.5 3.0 5.2 149 6.2 3.4 5.4 150 5.9 3.0 5.1 Petal.Width Species 145 2.5 virginica 146 2.3 virginica 147 1.9 virginica 148 2.0 virginica 149 2.3 virginica 150 1.8 virginica > View(iris)
iris maka akan muncul banyak nilai data. apalahi kalau data setnya kebanyakan. anda bisa memeriksa jenis data tersebut dengan perintah str(data) maka di situ akan menjelaskan data apa.misalnya dalam iris itu adalah data frame yang merupakan kumpulan dari data yang terdiri dari beberapa variabel yang di sana. Kemudian anda juga bisa menggunakan data dari package lain. kalau menggunakan package lain anda harus menjalankan perintah masuk ke package tersebut seperti dalam package MASS
>library(MASS)
>data(package="MASS)
maka anda akan mendapatkan banyak data di sini. ada beberapa package yang mempunyai data tertentu. sialahkan mencari data sesuai dengan kebutuhan anda,