R berbeda dengan Excel yang menyusun data bagai dengan
kolom dan juga harus. Untuk memasukkan data dalam R memang menggunakan dara
Excel baik csv dan txt. Ada beberapa macam cara untuk mengolah data dalam R
tidak seperti software stataistik lainnya yang hanya menumpulkan data dalam
bentuk table dan kemudian mengelolanya.
Terkadang kalau kita menggunakan tipe data dan
menggunakan maka kita tidak akan bisa mendaptkan hasilnya yang tidka kita
inginkan. Bahkan kalau sebelum belajr R ada baiknya kita mengetahui tipe dan
struktur data dari R agar bisa untuk bisa mengetahui untuk belajar lebih banyak
lagi mengenai R.
Ada berbagai jenia data namun untuk dasar kita perkenalkan seperti dibawah ini
:
1. Data
Frame
Data frame data frame adalah suatu data yang sering dipakai karena ini adalah
kumpulan dari vector yakni data yang sederhana saja yang ditulis dalam bentuk
koma.
Data frame seperti halnya kumpulan data saja yang bisa misalnya kita
mengumpulkan dari berbagai jenis vector saja dengan karakteristik dengan satu
saja atau univariate.denganenggabungkan data kita bisa membuat sebuah data
frame. Untuk membuat maka kita bisa untuk menjadi data frame.
Data frame setidaknya ada data yang biasa yang memuat data cross section. Dan
juga data time series (dijelaskan dalam data). Ada juga data gabungan campuran
data dari vector. Jika kita mau untuk membandingkan vector yang satu dengan
vector yang lain bisa kita gabungkan
Dari sini sesuai dengan buku ini kita bisa mengelola dalam bentuk analisis
lainnya baik descriptive dan analisis inferensial. Dalam buku ini kita akan membutuhkan
data frame untuk time series dan analisis regresi/
Contoh Membuat data frame dengan gabungan vector.
Contoh di sini membuat vector yang terdiri dari id, saving, dan juga income :
untuk id saya memlih huruf dari huruf keempat hingga huruf ke sepulh
> id<-(letters[4:10])
> id
[1] "d" "e" "f"
"g" "h" "i" "j"
> saving<-c(100,200,150,130,120,200)
> income<-c(1000,1200,1300,1100,1500,1250,1150)
Setelah selesai, saya akan
> datcoba<-data.frame(id,saving,income)
Error in data.frame(id, saving, income) :
arguments
imply differing number of rows: 7, 6
Di sini terlihat saya salah karena untuk saving saya
hanya memasukkan 6 data saja. Jangan khawatir saya akan tambahkan sehingga saya
akan mendapatkan data seperti dibawah ini.
> saving<-c(saving,250)
> datcoba<-data.frame(id,saving,income)
> datcoba
id saving
income
1 d 100
1000
2 e 200
1200
3 f 150
1300
4 g 130
1100
5 h 120
1500
6 i 200
1250
7 j 250
1150
Kita bisa mengelola dari membuat tabel dan grafik yang tidak bisa digunakan
oleh data yang lain.
Data frame dapat langsung di copy dari data file excel
yang berupa ext csv atau txt (caranaya akan diterangkan selanjutnya).
2. Vector
atomic
Sesuai dengan namanay vector adalah sekumpulan data
yang terdiri dari beberapa elemen. Untuk mmebuat vector tidak sulit hanya
memberi nama vector bisa berupa sebuah kata, huruf dan campuran huruf angka.
Jangan menggunakan tanda spasi atau tanda baca yang lainnya seperti@,#,$, dan
lain-lain yang akan menyebabkan perintah tersendiri.
Vector ini untuk digunakan bagi pengolahan data
univariate atau data yang tunggal. Vector dapat diterapkan untuk membuat grafik.
Untuk membuat data seperti ini kita
mmebuat nama data dn Menyusun dari isi data. Cara ini untuk data yang tidak
terlalu banyak kalau sudah terlalu banyak maka cara copy lebih baik disamping
lebih sederhana dan kita dapat menyimpan datanya ke dalam file lain yakni excel
.
Untuk membuat Vector kita bisa melalukan penulisan
Nama file<-c(data,data,data..)
Data bisa berupa angak atau numeris jika kita ingin
atau menggunakan data kuantitafi maka kita bisa harus membuat tanda kutip.
>
coba<-c(100,200,300)
> coba
[1] 100 200 300
>
cobax<-c("Macan","Singa","Serigala")
> cobax
[1] "Macan" "Singa" "Serigala"
R juga dapat membantu kita untuk menambah data yang
sudah kita buat seperti fungsi
Typeof(namavektor) – fungsi ini untuk menunjukkan tipe
data dari vektor
length(namavektor) – fungsi ini untuk menunjukkan
berapa banyak data
Class(namavektor) – fungsi ini untuk mengetahui jenis
data
str(namavektor) – fungsi ini adalah untuk mengetahui
jenis struktur data yang sudah kita buat
> typeof(coba)
[1] "double"
> length(coba)
[1] 3
> class(coba)
[1] "numeric"
> str(coba)
num [1:3] 100
200 300
Untuk menamabah data, kita bisa masukkan data seperti
ini
> coba<-c(coba,400)
> coba
[1] 100 200 300 400
Jika hendak menampilkan data berturut kita bisa
membuat seperti ini
> seq(7)
[1] 1 2 3 4 5 6 7
> seri<-(1:7)
> seri
[1] 1 2 3 4 5 6 7
Data coba sudah ditambahkan 400, dan kalau untuk data
non numerik kita bisa lakukan seperti dibawah ini. Perhatikan Ketika kita
memanggil vector coba angka 400 sudah masuk ke dalamnya dan vector sebelumnya
yang mmeuta tiga anggota saja sudah terhapus
> cobax<-c(cobax,"Macan Tutul")
> cobax
[1] "Macan" "Singa" "Serigala" "Macan Tutul"
Pentingnya
Matrix
Matrix adalah sekumpulan angka yang menempati dalam
dua dimenis yakni baik dimensi kolom maupun dimensi baris. Dimensi kolom adalah
dimensi yang kebawah sedangkan dimensi baris yang mendatar.
Matriix ini adalah hal yang paling
penting dalam pelajaran matematika pada umunya dan aljebar linear pada
khususnya. Tentu untuk pada pengolahan data yang lain bentuk data seperti ini
juga digunakan>
Untuk membuat Matrix kita bisa lakukan seperti ini
Namamatrix<-matrixc(data,nrow=n,ncol=n)
Dalam contoh matriks n dengan dimensi 3x3 dengan isi
angka 1 s.d 9
> n<-matrix(1:9,nrow=3,ncol=3)
> n
[,1] [,2]
[,3]
[1,] 1 4
7
[2,] 2 5
8
[3,] 3 6
9
Kita juga bis amnegisi matriks dengan huruf seperti
dibawah ini
List
Penggunaan List jarang digunakan pada statistic
sederhana dan tidak akan digunakan. Namun untuk pengetahuan dan mungkin bagi
yang mau belajar. List adlah sekumpulan data yang beragam tipe data bik itu
vector, matrix, dan lain-lain
Untuk mmebuat list maka kita bisa menggunakan formula
seperti ini
> ylist<-list(a=mdat,b=1:7,head(sample51))
Namalist<-list(kumpulan data1, kumpulan data 2,….)
> ylist
$a
[,1] [,2]
[,3]
[1,] 1 2
3
[2,] 11 12
13
$b
[1] 1 2 3 4 5 6 7
[[3]]
perusahaan
tahun cr eps
roe shm
1
AGRO 2016 121.73 6.72
7.31 5.88
2
BBCA 2016 105.13 835.76 20.50 9.65
3
BBKP 2016 107.10 119.58
4.56 6.46
4
BBMD 2016 121.71 43.83
6.95 7.31
5
BBRI 2016 95.58 1061.88 23.08 7.76
6 BDMN 2016
99.59 278.52 8.00 8.06