Selasa, 31 Januari 2023

Membuat Grafik Garis (line) dengan RStudio

 

Jika sudah memahami data yang akan dimaksukkan maka kita bisa mulai dengan grafik. Grafik adalah salah satu dalam penyajian data yang dapat kita bisa gunakan untuk menyingkat data. Dalam grafik kita bisa untuk menjelaskan dalam waktu yang singkat. Lain halnya dengan tabel yang perlu membutuhkan untuk meleiti satu persatua sehingga kita bisa menarik kesimpulan. GRafik dalam RStudio banyak sekali karenanya kita berkreasi dengan grafik tersebut. 


GRafik penting dalam statistik karena ia adalah sarana atau wahana yang dapat menyampaikan dari hasil pengolahan data yang kita lakukan.

Dalm grafik ada bagian yakni grafik data dan judul dalam perangkat lunak Rstuido kita dapat juga untuk membuat. Secara sederhana kita dapat membuat grafik dari Vector juga (baca Struktur data R). Bisa juga dalam data frame untuk dibuatkan grafik. 


Berikut ini dibawah adalah jenis grafik yang digunakan dalam pengolahan data statistik. Berikut ini adalah grafik

Untuk membuat grafik kita buat terlebih dahulu vector.  Saya ambil contoh tembakan roket ke Ukraina di sebuah kota (data fiktif)

 

> roket=c(2,3,5,6,7,10,13,3,4)

> plot(roket)

Hasilnya seperti ini

 

Dalam contoh ini saya belum menetapkan apakah maksud dari tabel karena ada judul dibawah index.

Scatter chart

Description automatically generated

Tipe dari grafik ini polot yang berupa bulataan seperti kecil . Jika mau memberi garis maka bisa kita gunakan seperti ini.

> plot(roket,type="o",col="blue")

> title=(main="Jumlah Roket Jatuh",col.main="red",font.main=4)

> title(main="Jumlah Roket Jatuh",col.main="red",font.main=4)

Chart, line chart

Description automatically generated

GRafik ini adalah grafik yang sederhana dan namanya grafik garis karena yang menunjukkan angka tersebut disambung dengan garis. Untuk grafik garis yang paling cocok adalah data time series karena hal itu mengambarkan data yang berkembang dari waktu ke waktu. Tentu masih banyak lagi grafik yang bisa kita gunakan seperti halnya grafik batang:

Kamis, 19 Januari 2023

Struktur Data dan Cara Membuat Data di RStudio

 

R berbeda dengan Excel yang menyusun data bagai dengan kolom dan juga harus. Untuk memasukkan data dalam R memang menggunakan dara Excel baik csv dan txt. Ada beberapa macam cara untuk mengolah data dalam R tidak seperti software stataistik lainnya yang hanya menumpulkan data dalam bentuk table dan kemudian mengelolanya.

Terkadang kalau kita menggunakan tipe data dan menggunakan maka kita tidak akan bisa mendaptkan hasilnya yang tidka kita inginkan. Bahkan kalau sebelum belajr R ada baiknya kita mengetahui tipe dan struktur data dari R agar bisa untuk bisa mengetahui untuk belajar lebih banyak lagi mengenai R.

Ada berbagai jenia data namun untuk dasar kita perkenalkan seperti dibawah ini :

 

1.      Data Frame

Data frame data frame adalah suatu data yang sering dipakai karena ini adalah kumpulan dari vector yakni data yang sederhana saja yang ditulis dalam bentuk koma.

Data frame seperti halnya kumpulan data saja yang bisa misalnya kita mengumpulkan dari berbagai jenis vector saja dengan karakteristik dengan satu saja atau univariate.denganenggabungkan data kita bisa membuat sebuah data frame. Untuk membuat maka kita bisa untuk menjadi data frame.

Data frame setidaknya ada data yang biasa yang memuat data cross section. Dan juga data time series (dijelaskan dalam data). Ada juga data gabungan campuran data dari vector. Jika kita mau untuk membandingkan vector yang satu dengan vector yang lain bisa kita gabungkan

Dari sini sesuai dengan buku ini kita bisa mengelola dalam bentuk analisis lainnya baik descriptive dan analisis inferensial. Dalam buku ini kita akan membutuhkan data frame untuk time series dan analisis regresi/

Contoh Membuat data frame dengan gabungan vector. Contoh di sini membuat vector yang terdiri dari id, saving, dan juga income : untuk id saya memlih huruf dari huruf keempat hingga huruf ke sepulh

 

> id<-(letters[4:10])

> id

[1] "d" "e" "f" "g" "h" "i" "j"

> saving<-c(100,200,150,130,120,200)

> income<-c(1000,1200,1300,1100,1500,1250,1150)

Setelah selesai, saya akan

> datcoba<-data.frame(id,saving,income)

Error in data.frame(id, saving, income) :

  arguments imply differing number of rows: 7, 6

Di sini terlihat saya salah karena untuk saving saya hanya memasukkan 6 data saja. Jangan khawatir saya akan tambahkan sehingga saya akan mendapatkan data seperti dibawah ini.

> saving<-c(saving,250)

> datcoba<-data.frame(id,saving,income)

> datcoba

  id saving income

1  d    100   1000

2  e    200   1200

3  f    150   1300

4  g    130   1100

5  h    120   1500

6  i    200   1250

7  j    250   1150


Kita bisa mengelola dari membuat tabel dan grafik yang tidak bisa digunakan oleh data yang lain.

Data frame dapat langsung di copy dari data file excel yang berupa ext csv atau txt (caranaya akan diterangkan selanjutnya).

 

2.      Vector atomic

Sesuai dengan namanay vector adalah sekumpulan data yang terdiri dari beberapa elemen. Untuk mmebuat vector tidak sulit hanya memberi nama vector bisa berupa sebuah kata, huruf dan campuran huruf angka. Jangan menggunakan tanda spasi atau tanda baca yang lainnya seperti@,#,$, dan lain-lain yang akan menyebabkan perintah tersendiri.

Vector ini untuk digunakan bagi pengolahan data univariate atau data yang tunggal. Vector dapat diterapkan untuk membuat grafik. Untuk membuat  data seperti ini kita mmebuat nama data dn Menyusun dari isi data. Cara ini untuk data yang tidak terlalu banyak kalau sudah terlalu banyak maka cara copy lebih baik disamping lebih sederhana dan kita dapat menyimpan datanya ke dalam file lain yakni excel .

Untuk membuat Vector kita bisa melalukan penulisan

Nama file<-c(data,data,data..)

Data bisa berupa angak atau numeris jika kita ingin atau menggunakan data kuantitafi maka kita bisa harus membuat tanda kutip.

 > coba<-c(100,200,300)

> coba

[1] 100 200 300

> cobax<-c("Macan","Singa","Serigala")

> cobax

[1] "Macan"    "Singa"    "Serigala"

R juga dapat membantu kita untuk menambah data yang sudah kita buat seperti fungsi

Typeof(namavektor) – fungsi ini untuk menunjukkan tipe data dari vektor

length(namavektor) – fungsi ini untuk menunjukkan berapa banyak data

Class(namavektor) – fungsi ini untuk mengetahui jenis data

str(namavektor) – fungsi ini adalah untuk mengetahui jenis struktur data yang sudah kita buat

> typeof(coba)

[1] "double"

> length(coba)

[1] 3

> class(coba)

[1] "numeric"

> str(coba)

 num [1:3] 100 200 300

Untuk menamabah data, kita bisa masukkan data seperti ini

> coba<-c(coba,400)

> coba

[1] 100 200 300 400

Jika hendak menampilkan data berturut kita bisa membuat seperti ini

> seq(7)

[1] 1 2 3 4 5 6 7

> seri<-(1:7)

> seri

[1] 1 2 3 4 5 6 7

Data coba sudah ditambahkan 400, dan kalau untuk data non numerik kita bisa lakukan seperti dibawah ini. Perhatikan Ketika kita memanggil vector coba angka 400 sudah masuk ke dalamnya dan vector sebelumnya yang mmeuta tiga anggota saja sudah terhapus

> cobax<-c(cobax,"Macan Tutul")

> cobax

[1] "Macan"       "Singa"       "Serigala"    "Macan Tutul"

 

Pentingnya

 

Matrix

Matrix adalah sekumpulan angka yang menempati dalam dua dimenis yakni baik dimensi kolom maupun dimensi baris. Dimensi kolom adalah dimensi yang kebawah sedangkan dimensi baris yang mendatar.

Matriix ini adalah hal yang paling penting dalam pelajaran matematika pada umunya dan aljebar linear pada khususnya. Tentu untuk pada pengolahan data yang lain bentuk data seperti ini juga digunakan>

Untuk membuat Matrix kita bisa lakukan seperti ini

Namamatrix<-matrixc(data,nrow=n,ncol=n)

Dalam contoh matriks n dengan dimensi 3x3 dengan isi angka 1 s.d 9

> n<-matrix(1:9,nrow=3,ncol=3)

> n

     [,1] [,2] [,3]

[1,]    1    4    7

[2,]    2    5    8

[3,]    3    6    9

Kita juga bis amnegisi matriks dengan huruf seperti dibawah ini

List

Penggunaan List jarang digunakan pada statistic sederhana dan tidak akan digunakan. Namun untuk pengetahuan dan mungkin bagi yang mau belajar. List adlah sekumpulan data yang beragam tipe data bik itu vector, matrix, dan lain-lain

Untuk mmebuat list maka kita bisa menggunakan formula seperti ini

 

> ylist<-list(a=mdat,b=1:7,head(sample51))

Namalist<-list(kumpulan data1, kumpulan data 2,….)

 

> ylist

$a

     [,1] [,2] [,3]

[1,]    1    2    3

[2,]   11   12   13

 

$b

[1] 1 2 3 4 5 6 7

 

[[3]]

  perusahaan tahun     cr     eps   roe  shm

1       AGRO  2016 121.73    6.72  7.31 5.88

2       BBCA  2016 105.13  835.76 20.50 9.65

3       BBKP  2016 107.10  119.58  4.56 6.46

4       BBMD  2016 121.71   43.83  6.95 7.31

5       BBRI  2016  95.58 1061.88 23.08 7.76

6       BDMN  2016  99.59  278.52  8.00 8.06

Membuat diagram scatter

 Untuk mengetahui hubungan antara dua variabel baik antara variabel dependend dan independen maupun variabel independen adalah menggunakan s...