R berbeda dengan Excel yang menyusun data bagai dengan kolom dan juga harus. Untuk memasukkan data dalam R memang menggunakan dara Excel baik csv dan txt. Ada beberapa macam cara untuk mengolah data dalam R tidak seperti software stataistik lainnya yang hanya menumpulkan data dalam bentuk table dan kemudian mengelolanya.
Terkadang kalau kita menggunakan tipe data dan
menggunakan maka kita tidak akan bisa mendaptkan hasilnya yang tidka kita
inginkan. Bahkan kalau sebelum belajr R ada baiknya kita mengetahui tipe dan
struktur data dari R agar bisa untuk bisa mengetahui untuk belajar lebih banyak
lagi mengenai R.
Ada berbagai jenia data namun untuk dasar kita perkenalkan seperti dibawah ini
:
1. Data
Frame
Data frame data frame adalah suatu data yang sering dipakai karena ini adalah
kumpulan dari vector yakni data yang sederhana saja yang ditulis dalam bentuk
koma.
Data frame seperti halnya kumpulan data saja yang bisa misalnya kita
mengumpulkan dari berbagai jenis vector saja dengan karakteristik dengan satu
saja atau univariate.denganenggabungkan data kita bisa membuat sebuah data
frame. Untuk membuat maka kita bisa untuk menjadi data frame.
Data frame setidaknya ada data yang biasa yang memuat data cross section. Dan
juga data time series (dijelaskan dalam data). Ada juga data gabungan campuran
data dari vector. Jika kita mau untuk membandingkan vector yang satu dengan
vector yang lain bisa kita gabungkan
Dari sini sesuai dengan buku ini kita bisa mengelola dalam bentuk analisis
lainnya baik descriptive dan analisis inferensial. Dalam buku ini kita akan membutuhkan
data frame untuk time series dan analisis regresi/
Contoh Membuat data frame dengan gabungan vector. Contoh di sini membuat vector yang terdiri dari id, saving, dan juga income : untuk id saya memlih huruf dari huruf keempat hingga huruf ke sepulh
> id<-(letters[4:10])
> id
[1] "d" "e" "f" "g" "h" "i" "j"
> saving<-c(100,200,150,130,120,200)
> income<-c(1000,1200,1300,1100,1500,1250,1150)
Setelah selesai, saya akan
> datcoba<-data.frame(id,saving,income)
Error in data.frame(id, saving, income) :
arguments imply differing number of rows: 7, 6
Di sini terlihat saya salah karena untuk saving saya hanya memasukkan 6 data saja. Jangan khawatir saya akan tambahkan sehingga saya akan mendapatkan data seperti dibawah ini.
> saving<-c(saving,250)
> datcoba<-data.frame(id,saving,income)
> datcoba
id saving income
1 d 100 1000
2 e 200 1200
3 f 150 1300
4 g 130 1100
5 h 120 1500
6 i 200 1250
7 j 250 1150
Kita bisa mengelola dari membuat tabel dan grafik yang tidak bisa digunakan
oleh data yang lain.
Data frame dapat langsung di copy dari data file excel yang berupa ext csv atau txt (caranaya akan diterangkan selanjutnya).
2. Vector atomic
Sesuai dengan namanay vector adalah sekumpulan data yang terdiri dari beberapa elemen. Untuk mmebuat vector tidak sulit hanya memberi nama vector bisa berupa sebuah kata, huruf dan campuran huruf angka. Jangan menggunakan tanda spasi atau tanda baca yang lainnya seperti@,#,$, dan lain-lain yang akan menyebabkan perintah tersendiri.
Vector ini untuk digunakan bagi pengolahan data univariate atau data yang tunggal. Vector dapat diterapkan untuk membuat grafik. Untuk membuat data seperti ini kita mmebuat nama data dn Menyusun dari isi data. Cara ini untuk data yang tidak terlalu banyak kalau sudah terlalu banyak maka cara copy lebih baik disamping lebih sederhana dan kita dapat menyimpan datanya ke dalam file lain yakni excel .
Untuk membuat Vector kita bisa melalukan penulisan
Nama file<-c(data,data,data..)
Data bisa berupa angak atau numeris jika kita ingin atau menggunakan data kuantitafi maka kita bisa harus membuat tanda kutip.
> coba<-c(100,200,300)
> coba
[1] 100 200 300
> cobax<-c("Macan","Singa","Serigala")
> cobax
[1] "Macan" "Singa" "Serigala"
R juga dapat membantu kita untuk menambah data yang sudah kita buat seperti fungsi
Typeof(namavektor) – fungsi ini untuk menunjukkan tipe data dari vektor
length(namavektor) – fungsi ini untuk menunjukkan berapa banyak data
Class(namavektor) – fungsi ini untuk mengetahui jenis data
str(namavektor) – fungsi ini adalah untuk mengetahui jenis struktur data yang sudah kita buat
> typeof(coba)
[1] "double"
> length(coba)
[1] 3
> class(coba)
[1] "numeric"
> str(coba)
num [1:3] 100 200 300
Untuk menamabah data, kita bisa masukkan data seperti ini
> coba<-c(coba,400)
> coba
[1] 100 200 300 400
Jika hendak menampilkan data berturut kita bisa membuat seperti ini
> seq(7)
[1] 1 2 3 4 5 6 7
> seri<-(1:7)
> seri
[1] 1 2 3 4 5 6 7
Data coba sudah ditambahkan 400, dan kalau untuk data non numerik kita bisa lakukan seperti dibawah ini. Perhatikan Ketika kita memanggil vector coba angka 400 sudah masuk ke dalamnya dan vector sebelumnya yang mmeuta tiga anggota saja sudah terhapus
> cobax<-c(cobax,"Macan Tutul")
> cobax
[1] "Macan" "Singa" "Serigala" "Macan Tutul"
Pentingnya
Matrix
Matrix adalah sekumpulan angka yang menempati dalam dua dimenis yakni baik dimensi kolom maupun dimensi baris. Dimensi kolom adalah dimensi yang kebawah sedangkan dimensi baris yang mendatar.
Matriix ini adalah hal yang paling penting dalam pelajaran matematika pada umunya dan aljebar linear pada khususnya. Tentu untuk pada pengolahan data yang lain bentuk data seperti ini juga digunakan>
Untuk membuat Matrix kita bisa lakukan seperti ini
Namamatrix<-matrixc(data,nrow=n,ncol=n)
Dalam contoh matriks n dengan dimensi 3x3 dengan isi angka 1 s.d 9
> n<-matrix(1:9,nrow=3,ncol=3)
> n
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
Kita juga bis amnegisi matriks dengan huruf seperti dibawah ini
List
Penggunaan List jarang digunakan pada statistic sederhana dan tidak akan digunakan. Namun untuk pengetahuan dan mungkin bagi yang mau belajar. List adlah sekumpulan data yang beragam tipe data bik itu vector, matrix, dan lain-lain
Untuk mmebuat list maka kita bisa menggunakan formula seperti ini
> ylist<-list(a=mdat,b=1:7,head(sample51))
Namalist<-list(kumpulan data1, kumpulan data 2,….)
> ylist
$a
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 11 12 13
$b
[1] 1 2 3 4 5 6 7
[[3]]
perusahaan tahun cr eps roe shm
1 AGRO 2016 121.73 6.72 7.31 5.88
2 BBCA 2016 105.13 835.76 20.50 9.65
3 BBKP 2016 107.10 119.58 4.56 6.46
4 BBMD 2016 121.71 43.83 6.95 7.31
5 BBRI 2016 95.58 1061.88 23.08 7.76
6 BDMN 2016 99.59 278.52 8.00 8.06
Tidak ada komentar:
Posting Komentar