Statistik Deskriptif

Menggambarkan suatu data hasil penelitian secara sederhana biasanya menggunakan statistik deskriptif, seperti rerata (mean), modus (mode), nilai tengah (median), simpangan (deviation standard), variansi (variance), dan lain-lain. statistik deskriptif dapat saja digunakan untuk mengetahui ukuran pemusatan dan penyebaran data. Setiap ukuran tersebut memiliki fungsi yang berbeda, sesuai dengan tujuan dari penyajian data. Pengolahan data dapat dilakukan secara manual, yaitu menghitung menggunakan rumus (formula) yang sudah baku, dapat juga menggunakan MS. Excel, atau bantuan SPSS.

Pada data kelompok, mungkin saja diantara kedua cara tersebut menunjukkan hasil perhitungan dengan presisi yang berbeda pada ukuran tertentu, misalnya median, dan modus. Hal ini disebabkan oleh faktor ketelitian (human error), dan pembulatan angka. Pada kasus data kelompok, ketepatan hasil perhitungan dapat diperoleh dengan kemampuan menyusun distribusi frekuensi yang tepat.

Menyusun distribusi frekuensi biasanya menggunakan aturan Sturges, apalagi untuk ukuran data ≥ 200.  Misalnya kita akan membuat distribusi frekuensi dari data dengan jumlah 80 dan menyajikan statistik desktiptif:

contoh-data

Berikut langkah-langkah membuat distribusi frekuensi:

  1. Menentukan rentang, yaitu jarak antara data tertinggi dengan data terendah. Selisih antara data terbesar dengan data terkecil.

rentang

2. Menentukan banyak kelas, dengan menggunakan rumus:

kelas

Berdasarkan hasil tersebut, banyak kelas dapat diambil 7 atau 8. Pengambilan jumlah kelas dapat menentukan kualitas atau ketepatan distribusi frekuensi. Kita bisa lakukan pendekatan atau pembulatan, sehingga kita dapat ambil 7.

3. Menentukan panjang kelas (p):

pnjang-kelas

Bilangan panjang kelas sebaiknya dibulatkan, untuk memudahkan dalam menyusun kelas interval. Panjang kelas interval dapat kita diambil 9 atau 10, ambil yang terbesar, yaitu 10. Hal ini didasarkan pada jumlah kelas yang diambil, biasanya jika jumlah kelas kecil atau sedikit, dengan mengambil panjang kelas yang besar, dengan rasio proporsional.

4. Menyusun kelas-kelas interval atau dapat dikatakan kelompok data. Tahap ini juga menentukan kualitas dan ketepatan distribusi frekuensi. Tidak ada aturan yang baku dalam menyusun interval kelas, khususnya pada batas bawah interval kelas pertama. Namun demikian, lazimnya dimulai dari data terkecil sebagai batas bawah interval kelas pertama. Untuk contoh data di atas, data terkecil yaitu 35, dan ambil panjang kelas yaitu 10, maka interval kelas yaitu batas bawah interval kelas ditambah , sehingga bisa kita susun interval kelas sebagai berikut:

Tabel 1. Interval Kelas

intervl-kelas

Interval kelas disusun berdasarkan data terendah 35 menunjukkan pergeseran (kelebihan) batas kelas atas 104, bergeser 5 angka dari data tertinggi yaitu 99. Hal ini lazim terjadi, yang terpenting adalah jumlah kelas interval dapat mencakup seluruh data.  Pada kasus tertentu mungkin saja dapat terjadi, data tertendah adalah batas bawah pada kelas interval pertama, sedangkan batas atas kelas interval yang terahir merupakan data teringgi, yang menunjukkan tidak terjadi pergeseran data, baik data terendah maupun data tertinggi.

5. Tabulasi data sebagai dasar untuk menyusun distribusi frekuensi:

Proses ini memang tidak efektif jika dilakukan secara manual, apalagi jumlah data yang sangat banyak, akan merepotkan. Sebaiknya kita gunakan bantuan Ms. Excel atau SPSS untuk mempercepat waktu.

Tabel 2. Tabulasi Data

tabulasi-data

Tabel distribusi frekuensi dapat dilengkapi dengan kolom frekuensi relatif  dan frekuensi kumulatif , batas atas, batas bawah untuk membuat histogram. Komponen tabel distribusi frekuensi  disusun sesuai dengan kebutuhan.

Tabel 3. Distribusi Frekuensi Berdasarkan Data Terendah

disfrek-data-rendah

Referensi lain menyebutkan bahwa kelas interval dapat juga disusun berdasarkan data tertinggi sebagai batas atas kelas pertama. Data tertinggi kelas pertama dikurangi panjang kelas interval (p-1)=9, sehingga tabel distribusinya adalah:

Tabel 4. Distribusi Frekuensi Berdasarkan Data Tertinggi

disfrek-dta-tinggi

Interval kelas model tersebut juga menunjukan pergeseran data (kekurangan) terendah pada interval kelas terakhir, dari 35 juga bergeser 5 angka menjadi 30. Dari kedua model interval kelas yang dibuat baik berdasarkan data terendah maupun data tertinggi, akan menentukan ketepatan (presisi) hasil perhitungan ukuran atau gelaja terpusat (central tendency) dan penyebaran data, baik menggunakan rumus, Ms. Excel, maupun software statistik SPSS.

Penjelasan Tabel Distribusi Frekuensi

Kita dapat memberikan deskripsi atau penjelasan berdasarkan tabel 3 di atas sesuai dengan kebutuhan informasi yang ingin disajikan, agar dapat diketahui, dan dipahami oleh pembaca.

Tabel 5. Deskripsi Distribusi Frekuensi

deskripsi-disfrek

Kita dapat memberikan penjelasan berdasarkan tabel distribusi frekuensi yang disajikan di atas, misalnya mulai dari frekuensi kumulatif responden, persentase responden pada kelas-kelas interval. Jika batas kriteria kita ambil 75, maka sekitar 52,50% (42 responden) memiliki skor di bawah atau kurang dari 75, dan 47,5% (38 responden) memiliki skor di atas atau sama dengan 75.

Penentuan kriteria sesuai dengan informasi yang ingin disampaikan, misalnya ingin mengetahui data pada interval rendah, sedang, dan tinggi yang menunjukkan gejala atau fenomena yang wajar (normal). Kita dapat menggunakan ukuran rerata (mean) sebagai acuan. Dari tabel yang disajikan dapat diketahuai persentase frekeunsi di bawah rata-rata (mean), tepat di posisi rata-rata, dan di atas rata-rata.

Distribusi frekuensi yang simetris, menunjukkan gejala terpusat yaitu rerata, modus, dan median berada pada posisi yang berhimpitan. Oleh karena itu, maka dalam statistika dikenal dengan istilah distribusi normal.

Perhitungan gejala pemusatan data (central tendency), berdasarkan distribusi frekuensi adalah sebagai berikut:

Tabel 6. Distribusi frekuensi perhitungan rerata, median, dan modus

perhitungan-disfrek

a. Menghitung Rata-rata (mean)

hitung-rerata

b. Menghitung Median

hitung-median

c. Modus (mode)

hitung-modus

Ukuran modus berbeda dengan ukuran rerata dan median, sekumpulan data dapat memiliki lebih dari satu buah modus. Modus biasanya berada pada interval kelas dengan frekuensi terbanyak, dalam contoh ini adalah interval 65-74. Pada interval tersebut, modusnya adalah 70, 71, 72, dan 74.

Berikut hasil perhitungan mean, median, mode dengan menggunakan IBM SPSS Statisctics 22:

hasil-spss

Demikian, semoga bermanfaat…

Referensi

Sudjana. Metoda Statistika. Bandung: Tarsito, 2005.

R. Partino dan M. Idrus. Statistik Deskriptif. Yogyakarta: Safria Insania Press, 2009.

Pengantar

Blog ini berisi tentang seputar hasil-hasil penelitian dan evaluasi bidang pendidikan Fisika. Penelitian tidak terlepas dari metode dan statistik, sehingga pembahasan tentang statistika melengkapi blog ini. Di sisi lain, mutu pendidikan diantaranya ditentukan oleh proses evaluasi yang berkualitas, termasuk di dalamnya penilaian, pengukuran, dan tes. Proses tersebut didukung dengan instrumen yang berkualitas, valid dan reliabel, sehingga pengembangan instrumen menjadi bagian yang tak terpisahkan.

Semoga bermanfaat…