num <- 2
num[1] 2
class(num)[1] "numeric"
Sebelum mengkaji lebih lanjut mengenai statistika, kita perlu memahami jenis data. Jenis data statistika dapat dibagi menjadi dua, yaitu data kualitatif dan data kuantitatif. Data kualitatif adalah data yang dapat diukur secara tidak langsung, seperti warna, rasa, bentuk, dan lain-lain. Sedangkan data kuantitatif adalah data yang dapat diukur secara langsung, seperti tinggi, berat, dan jumlah.
Data nominal adalah jenis data kualitatif yang tidak memiliki urutan atau peringkat tertentu. Contoh data nominal antara lain jenis kelamin, warna, dan status perkawinan. Data nominal biasa digunakan untuk menngetahui aspek demografis yang melekat pada individu. Data rasio adalah jenis data kuantitatif yang memiliki angka, satuan ukuran, dan titik nol yang bermakna. Contoh data rasio antara lain tinggi badan, berat badan, dan usia. Data ordinal adalah jenis data kualitatif yang memiliki urutan atau peringkat tertentu. Contoh data ordinal antara lain tingkat pendidikan, jabatan, dan kelas sosial. Data interval adalah jenis data kuantitatif yang memiliki satuan ukuran tetapi tidak memiliki titik nol yang bermakna. Contoh data interval antara lain waktu, IQ, nilai siswa, dan skor tes.


Salah satu referensi yang dapat digunakan (Wickham2017R?).
Data berbeda dengan skala, karena data hanya berbicara bentuk dan tipe sedangkan skala berkaitan dengan tingkat.
Ketika mengenali data kita sebaiknya memperhatikan bagaimana data tersebut dibuat atau berasal
Pemahaman data yang baik dapat membantu kita untuk menentukan jenis atau teknik analisis yang sesuai.
Tipe dan struktur data adalah hal yang paling dasar untuk memahami data dan bagaimana cara mengolahnya. R memiliki cara sendiri dalam me
R memiliki beberapa jenis tipe data yang masing-masing merepresentasikan data berbeda. Fungsi class dapat digunakan untuk mengecek tipe dari suatu data. Tipe data dapat dikonversi ke tipe lain jika data sesuai dengan tipe data yang dituju.
| Tipe | Deskripsi |
|---|---|
| Numerik | Data angka yang dapat dilakukan operasi matematika |
| Karakter | Data teks yang dapat mengandung huruf dan simbol |
| Integer | Data angka bilangan bulat untuk mempercepat proses komputasi |
| Logical | Data yang hanya terdiri dari TRUE dan FALSE |
| Complex | Data angka yang mengandung bilangan imajiner |
Data numerik berisi angka dan bilangan desimal atau kontinu.
Contoh data numerik
Operasi matematika sederhana
Data karakter adalah data teks yang dapat mengandung huruf, simbol, dan angka. Data karakter dibuat dengan menggunakan tanda petik dua (“…”).
Data integer adalah data bilangan bulat atau diskrit dan dapat dilakukan operasi matematika seperti data numerik. Data integer memiliki ukuran data yang lebih kecil daripada data numerik sehingga dapat meringankan dan mempercepat proses komputasi.
Data logical hanya terdiri dari dua elemen saja yakni TRUE dan FALSE.
Data kompleks adalah data yang mengandung bilangan imajiner (i).
| Struktur | Deskripsi |
|---|---|
| Vektor | Data yang disusun memanjang, semua data memiliki tipe yang sama |
| Matriks | Data yang disusun dalam dimensi kolom dan baris, semua data memiliki tipe yang sama |
| Dataframe | Data yang disusun dalam dimensi kolom dan baris, tipe data bisa berbeda-beda setiap kolom |
| List | Data yang dapat diisi data tunggal, vektor, matriks, ataupun dataframe |
| Factor | Data yang sama seperti vektor namun memiliki urutan level pada datanya |
What’s vector
Membuat vektor yang diisi secara manual
Mengambil data dari vektor
Vektor jika tipe data yang dimasukkan tidak sama
Membuat vektor yang berisi nomor urut
Membuat vektor yang berisi nomor urut dengan kelipatan tertentu
Membuat vektor yang isinya berulang-ulang
Membuat matriks: cbind, rbind, matrix
Mengambil data dari matriks
vek1 vek2
[1,] 1 1
[2,] 2 2
[3,] 3 3
[1] "matrix" "array"
[1] "double"
num [1:3, 1:2] 1 2 3 1 2 3
- attr(*, "dimnames")=List of 2
..$ : NULL
..$ : chr [1:2] "vek1" "vek2"
Membuat dataframe
Melihat struktur dari dataframe
Melihat ringkasan data
Mengambil data dari dataframe
Membuat list sederhana
Membuat list yang berisi matriks atau dataframe
Mengambil data dari list
Faktor memiliki sifat yang sama seperti vektor, namun memiliki urutan level pada datanya. Faktor digunakan untuk merepresentasikan data ordinal.
Membuat faktor dengan fungsi factor .
vek <- c("tinggi", "tinggi", "sedang", "tinggi", "sedang", "rendah", "tinggi")
fac <- factor(vek)
fac[1] tinggi tinggi sedang tinggi sedang rendah tinggi
Levels: rendah sedang tinggi
factor secara otomatis akan mengurutkan level berdasarkan urutan abjad. Untuk menentukan urutan level secara manual, tambahkan argumen levels.
[1] tinggi tinggi sedang tinggi sedang rendah tinggi
Levels: tinggi sedang rendah
Fungsi levels dan nlevels dapat digunakan untuk melihat hanya level faktor saja dan jumlah level yang ada dalam faktor.