RSS

Artikel Statistik 8 Halaman

29 May

STATISTIKA DESKRIPTIF

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Pengklasifikasian menjadi statistika deskriptif dan statistika inferensia dilakukan berdasarkan aktivitas yang dilakukan.

Statistika deskriptif hanya memberikan informasi mengenai data yang dipunyai dan sama sekali tidak menarik inferensia atau kesimpulan apapun tentang gugus induknya yang lebih besar. Contoh statistika deskriptif yang sering muncul adalah, tabel, diagram, grafik, dan besaran-besaran lain di majalah dan koran-koran. Dengan Statistika deskriptif, kumpulan data yang diperoleh akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari kumpulan data yang ada. Informasi yang dapat diperoleh dari statistika deskriptif ini antara lain ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data.

Klasifikasi, Jenis dan Macam Data – Pembagian Data Dalam Ilmu Eksak Sains Statistik / Statistika

Wed, 21/06/2006 – 12:23pm — godam64

 

A. Jenis Data Menurut Cara Memperolehnya

1. Data Primer

Data primer adalah secara langsung diambil dari objek / obyek penelitian oleh peneliti perorangan maupun organisasi. Contoh : Mewawancarai langsung penonton bioskop 21 untuk meneliti preferensi konsumen bioskop.

2. Data Sekunder

Data sekunder adalah data yang didapat tidak secara langsung dari objek penelitian. Peneliti mendapatkan data yang sudah jadi yang dikumpulkan oleh pihak lain dengan berbagai cara atau metode baik secara komersial maupun non komersial. Contohnya adalah pada peneliti yang menggunakan data statistik hasil riset dari surat kabar atau majalah.

 

B. Macam-Macam Data Berdasarkan Sumber Data

1. Data Internal

Data internal adalah data yang menggambarkan situasi dan kondisi pada suatu organisasi secara internal. Misal : data keuangan, data pegawai, data produksi, dsb.

2. Data Eksternal

Data eksternal adalah data yang menggambarkan situasi serta kondisi yang ada di luar organisasi. Contohnya adalah data jumlah penggunaan suatu produk pada konsumen, tingkat preferensi pelanggan, persebaran penduduk, dan lain sebagainya.

C. Klasifikasi Dara Berdasarkan Jenis Datanya

1. Data Kuantitatif

Data kuantitatif adalah data yang dipaparkan dalam bentuk angka-angka. Misalnya adalah jumlah pembeli saat hari raya idul adha, tinggi badan siswa kelas 3 ips 2, dan lain-lain.

2. Data Kualitatif

Data kualitatif adalah data yang disajikan dalam bentuk kata-kata yang mengandung makna. Contohnya seperti persepsi konsumen terhadap botol air minum dalam kemasan, anggapan para ahli terhadap psikopat dan lain-lain.

D. Pembagian Jenis Data Berdasarkan Sifat Data

1. Data Diskrit

Data diskrit adalah data yang nilainya adalah bilangan asli. Contohnya adalah berat badan ibu-ibu pkk sumber ayu, nilai rupiah dari waktu ke waktu, dan lain-sebagainya.

2. Data Kontinyu

Data kontinyu adalah data yang nilainya ada pada suatu interval tertentu atau berada pada nilai yang satu ke nilai yang lainnya. Contohnya penggunaan kata sekitar, kurang lebih, kira-kira, dan sebagainya. Dinas pertanian daerah mengimpor bahan baku pabrik pupuk kurang lebih 850 ton.

E. Jenis-jenis Data Menurut Waktu Pengumpulannya

1. Data Cross Section

Data cross-section adalah data yang menunjukkan titik waktu tertentu. Contohnya laporan keuangan per 31 desember 2006, data pelanggan PT. angin ribut bulan mei 2004, dan lain sebagainya.

2. Data Time Series / Berkala

Data berkala adalah data yang datanya menggambarkan sesuatu dari waktu ke waktu atau periode secara historis. Contoh data time series adalah data perkembangan nilai tukar dollar amerika terhadap euro eropa dari tahun 2004 sampai 2006, jumlah pengikut jamaah nurdin m. top dan doktor azahari dari bulan ke bulan, dll.

DISTRIBUSI FREKUENSI


Pengertian Distribusi Frekuensi

            Seringkali data yang telah terkumpul tersedia dalam jumlah yang besar sehingga kita mengalami kesulitan untuk mengenali ciri-cirinya. Oleh karena itu, data yang jumlahnya besar perlu ditata atau diorganisir dengan cara meringkas data tersebut ke dalam bentuk kelompok data sehingga dengan segera dapat diketahui ciri-cirinya dan dapat dengan mudah di analisis sesuai dengan kepentingan kita. Pengelompokan data tersebut dilakukan dengan cara mendistribusikan data dalam kelas atau selang dan menetapkan banyaknya nilai yang termasuk dalam kelas yang disebut frekuensi kelas.

            Jadi untuk dapat memahami data dengan mudah, maka baik data kualitatif maupun data kuantitatif harus disajikan dalam bentuk yang ringkas dan jelas. Salah satu cara untuk meringkas data adalah distribusi frekuensi, yaitu pengelompokkan data ke dalam beberapa kelompok (kelas) dan kemudian dihitung banyaknya data yang masuk ke dalam tiap kelas. Dengan kata lain, distribusi frekuensi merupakan suatu cara untuk meringkas serta menyusun sekelompok data mentah (raw data) yang diperoleh dari penelitian, dengan didasarkan pada distribusi (penyebaran) nilai variabel dan frekuensi (banyaknya) individu yang terdapat pada nilai variabel tersebut. Jadi distribusi frekuensi adalah susunan data menurut kelas-kelas interval tertentu atau menurut kategori tertentu dalam sebuah daftar. Distribusi frekuensi digambarkan melalui yang disebut tabel distribusi frekuensi. Dari distribusi frekuensi, dapat diperoleh keterangan atau gambaran sederhana dan sistematis dari data yang diperoleh.

DISTRIBUSI FREKUENSI DATA KUANTITATIF

            Definisi tentang distribusi frekuensi adalah sama baik untuk data kualitatif maupun kuantitatif. Meskipun demikian, kita harus lebih hati-hati dalam menentukan kelas yang digunakan pada distribusi frekuensi. Ada tiga hal yang perlu diperhatikan dalam menentukan kelas bagi distribusi frekuensi untuk data kuantitatif, yaitu jumlah kelas, lebar kelas, dan batas kelas.

Ringkasan

            Data yang dikumpulkan perlu disusun atau disajikan dalam bentuk tertentu. Bentuk-bentuk penyajian data meliputi: (1) tabel yang terdiri atas tabel biasa, tabel distribusi frekuensi, tabel distribusi frekuensi relative, tabel distribusi frekuensi kumulatif, dan distribusi frekuensi relative kumulatif, (2) histrogram, (3) poligon frekuensi, dan (3) ogif.

            Tabel biasa sangat cocok untuk menyajikan data yang terdiri atas beberapa variabel dengan beberapa kategori. Tabel distribusi frekuensi sangat cocok untuk menyajikan data dalam beberapa kelompok. Tabel distribusi frekuensi relatif, nilai frekuensi dinyatakan dalam persen (%) yang disingkat f (%) atau f (rel). Tabel distribusi frekuensi kumulatif adalah distribusi frekuensi biasa yang nilai frekuensi kumulatifnya diperoleh dengan jalan menjumlahkan frekuensi demi frekuensi. Tabel distribusi frekuensi kumulatif ada dua macam yaitu: kumulatif kurang dari dan kumulatif lebih dari. Daftar distribusi frekuensi kumulatif relative adalah apabila nilai f kumulatif dalam frekuensi kumulatif diubah dalam persen.

            Histogram adalah penyajian data distribusi frekuensi yang diubah menjadi diagram batang. Ogif adalah distribusi frekuensi kumulatif yang diagramnya dalam sumbu tegak dan mendatar. Ogif kurang dari adalah diagram dari distribusi frekuensi kumulatif kurang dari. Dan ogif lebih dari adalah diagram dari distribusi frekuensi kumulatif lebih dari.

 

UKURAN PEMUSATAN

 

Pendahuluan

            Meskipun data telah disusun ke dalam distribusi frekuensi, ternyata data yang disajikan itu belum dapat memberikan gambaran tentang variabel-variabel penelitian secara ringkas. Dalam banyak hal, pengumpulan data maupun penyusunan data ke dalam ke dalam distribusi frekuensi tidak semata-mata dibutuhkan bagi tujuan yang sedemikian sederhana yaitu memperoleh gambaran tentang jumlah data. Analisa mengenai perbandingan antara 2 kelompok hasil observasi, persoalan indeks, deret berkala, regresi dan sebagainya membutuhkan data untuk analisa yang bersifat lebih kompleks. Dalam hal demikian itu, pengumpulan data atau penyusunan data ke dalam distribusi frekuensi hanya merupakan tahap permulaan bagi analisa kuantitatif yang lebih lanjut.

Penyajian data ke dalam bentuk grafik juga bertujuan memberi gambaran yang jelas tentang suatu peristiwa kuantitatif secara visual.  Gambaran ringkas tentang variabel penelitian ini menjadi penting karena memungkinkan peneliti dengan mudah dan cepat dapat membaca dan menggambarkan keadaan suatu variabel penelitiah secara menyeluruh. Gambaran ringkas suatu variabel ini seringkali digunakan untuk membandingkan variabel satu dengan variabel lain. Gambaran ringkas tentang suatu variabel di peroleh dengan jalan menghitung ukuran kecenderungan memusat atau ukuran tendensi sentral (central tendency) atau sering disebut ukuran pemusatan data.

Definisi Ukuran Pemusatan

            Dalam beberapa hal, ahli statistik menganggap rata-rata (average) dapat merupakan nilai yang cukup representatif bagi penggambaran nilai-nilai yang terdapat dalam data yang bersangkutan. Rata-rata sedemikian itu dapat dianggap sebagai nilai sentral dan dapat digunakan sebagai pengukuran lokasi sebuah distribusi frekuensi. Namun demikian, apakah rata-rata tersebut cukup representatif bagi penggambaran nilai-nilai keseluruhan data itu sendiri sangat bergantung pada cara nilai-nilai itu sendiri bervariasi. Penilaian terhadap rata-rata berhubungan erat dengan variasi atau dispersi datanya dari mana rata-rata tersebut dihitung. Pada hakekatnya, pengertian tentang rata-rata itu sendiri cukup membi ngungkan bagi sebagian besar orang yang belum pernah mempelajari statistik. Bagi mereka, metode menghitung rata-rata hanya satu macam saja. Padahal, para ahli statistik mengenal berbagai macam rata-rata dengan nama yang khas pula.

Ukuran kecenderungan memusat merupakan suatu bilangan yang menunjukkan tendensi (kecenderungan) memusatnya bilangan-bilangan dalam suatu distribusi. Ukuran kecenderungan memusat juga dapat digunakan untuk merangkum data dan mendeskripsikan suatu kelompok variabel dengan cara mencari suatu angka (indeks) yang dapat mewakili seluruh kelompok tersebut. Rata-rata (average) adalah nilai yang mewakili himpunan atau sekelompok data (a set of data). Nilai rata-rata umumnya cenderung terletak ditengah suatu kelompok data yang disusun menurut besar kecilnya nilai.

Dengan perkataan lain, ia mempunyai kecenderungan memusat, sehingga sering disebut ukuran kecenderungan memusat (measures of central tendency). Beberapa jenis rata-rata yang sering digunakan adalah rata-rata hitung (arithmetic mean atau sering disingkat mean saja), rata-rata ukur (geometric mean), dan rata-rata harmonis (harmonic mean). Setiap rata-rata tersebut selain mempunyai keunggulan juga memiliki kelemahan, dan ketepatan penggunaannya sangat bergantung pada sifat dari data dan tujuannya (misalnya untuk melakukan analisis). Dalam modul ini, yang dimaksudkan dengan rata-rata adalah rata-rata hitung, kecualai kalau ada keterangan atau penjelasan lain. Dalam kehidupan sehari-hari, rata-rata ini lebih banyak dikenal.

Misalnya rata-rata gaji atau upah karyawan Perguruan Tinggi Raharja per bulan, rata-rata produksi beras per tahun, rata-rata harga beras per kilogram, rata-rata umur karyawan suatu departemen, rata-rata hasil penjualan televisi per minggu, rata-rata modal perusahaan nasional, rata-rata hasil ujian seorang mahasiswa, rata-rata permintaan kredit per nasabah dan lain sebagainya. Rata-rata hitung sering digunakan sebagai dasar perbandingan antara dua kelompok nilai atau lebih. Misalnya ada dua mahasiswa, yaitu Ageng dan Fadly dari Jurusan Sistem Komputer STMIK Raharja, yang menempuh ujian lima macam mata kuliah, yaitu: Matematika Diskrit, Kalkulus, Fisika, Statistik Deskriptif, dan Aljabar Linear. Untuk menentukan mana yang lebih pandai antara Ageng atau Fadly, dapat dipergunakan nilai rata-rata.

Rata-Rata Hitung atau Nilai Tengah (Mean)

            Rata-rata hitung atau nilai tengah, dengan lambing µ untuk populasi dan  untuk sampel, merupakan salah satu ukuran pemusatan. Karena sifat-sifatnya yang mudah untuk dipelajari, nilai tengah ini memegang peranan penting dalam statistik inferensial. Nilai tengah yang akan kita pelajari dapat dibedakan menjadi dua bagian, yaitu nilai tengah untuk data tunggal dan nilai tengah untuk data yang telah dikelompokkan dalam table distribusi frekuensi. Bila data sampel terdiri dari sejumlah nilai-nilai hasil pengamatan yang tidak terlalu besar, rata-rata hitungnya (arithmetic mean) dapat langsung dicari dari data yang besangkutan tanpa harus terlebih dahulu menyusunnya ke dalam distribusi frekuensi.

Mean  atau disebut juga dengan rata-rata adalah angka yang diperoleh dengan membagi jumlah nilai-nilai (X) dengan jumlah individu (N). Misalnya untuk membandingkan tingkat gaji atau upah per bulan karyawan perusahaan Unilever  dan perusahaan Argopantes, mana yang lebih tinggi, maka dapat dilakukan wawancara terhadap 10 karyawan perusahaan Unilever dan 10 karyawan perusahaan Argopantes.

Median (Mdn)

Median atau disebut juga rata-rata letak. Perhitungan median dapat dijelaskan, bahwa apabila ada sejumlah atau sekelompok data dan kemudian diurutkan mulai dari yang terkecil sampai yang terbesar, lalu dibagi menjadi dua kelompok; separuh termasuk kelompok tinggi dan separuhnya lagi termasuk kelompok rendah. Maka titik tengah yang memisahkan kedua kelompok tersebut diberi nama median. Dengan kata lain, median adalah nilai pengamatan yang terletak di tengah-tengah data hasil observasi yang telah diurutkan dari kecil ke besar atau sebaliknya. Untuk menentukan nilai median suatu data maka data pengamatan bergantung pada n, apakah n tersebut ganjil atau genap.

Untuk sebaran data yang terbatas jumlahnya, median dapat ditemukan dengan memeriksa urutan dan jumlah nilai atau sebagai berikut: 70, 60, 50, 40, 30, 20, 10. Median dari data tersebut adalah 40 karena angka tersebut merupakan titik tengah yang dapat membagi secara sama nilai-nilai yang terletak dikelompok atas maupun kelompok bawah.

Modus

Untuk menyatakan gejala yang paling sering terjadi atau paling banyak muncul digunakan ukuran pemusatan data yang disebut modus. Tanpa disadari dalam percakapan sehari-hari sesungguhnya modu banyak digunakan untuk menen-tukan rata-rata dari data yang bersifat kualitatif. Ungkapan seperti Dian jarang masuk pada semester yang lalu merupakan ukuran modus. Begitu juga ungkapan, penyebab orang sakit paru-paru adalah karena merokok, merupakan ukuran pemusatan data dengan modus. Pada kasus pertama, jarang masuk merupakan modus, dan pada kasus kedua, karena merokok merupakan modus dari ungkapan tersebut.

Untuk data kuantitatif, modus adalah nilai data yang paling banyak muncul atau nilai data yang mempunyai frekuensi paling besar. Suatu kelompok data mungkin mempunyai modus, tetapi mungkin juga tidak mempunyai modus. Artinya modus suatu kelompok data tidak selalu ada. Bila suatu kelompok data mempunyai modus, maka modusnya bisa lebih dari satu, atau dikatakan modusnya tidak tunggal. Berbeda dengan cara menentukan median, untuk menentukan modus suatu kelompok data, data tersebut tidak perlu diurutkan, tetapi bila data telah diurutkan akan sangat mempermudah menentukan modusnya.

  • Kelompok data: 3,4,4,5,6,8,8,8,9 mempunyai satu modus, yaitu 8.
  • Kelompok data: 3,4,4,6,8,8,9,10 mempunyai dua modus, yaitu 4 dan 8

Bila data telah dikelompokkan menjadi tabel distribusi frekuensi, maka modusnya dapat dihitung dengan rumus berikut:

NILAI KUARTIL, DESIL DAN PERSENTIL

            Dengan menggunakan dasar-dasar median, kita dapat meneruskan kepada perhitungan-perhitungan statistik yang dimaksudkan untuk membuat suatu ukuran atau norma yang digunakan sebagai pedoman untuk membuat kategori-kategori kualitas sekelompok individu. Berdasarkan suatu norma tertentu, seorang peneliti dapat memisahkan individu menjadi bermacam-macam kategori sesuai dengan keperluannya. Misalnya dengan membagi distribusi menjadi 2 kategori yaitu individu yang diterima dan ditolak dalam seleksi suatu pekerjaan. Dengan 4 kategori didapatkan kategori-kategori seperti baik sekali, baik, sedang dan tidak baik. Peneliti bisa mengembangkan sampai menjadi 10 bahkan 100 kategori. Pembuatan kategori ini penting terutama apabila peneliti akan membuat suatu kualifikasi, mengenai subyek penelitian. Misalnya subyek penelitian akan dibagi menjadi 4 bagian yang setiap bagiannya memiliki jumlah individu yang sama, dimana dasar pembagiannya adalah nilai yang dapat menjadi batas dari kelompok yang terdapat dalam distribusi.

            Tatacara yang digunakan untuk membuat norma dengan kategori disebut median (Me) dengan 4 kategori disebut Kuartil (K) dengan 10 kategori disebut desil (D) dan dengan 100 kategori disebut persentil (P). Apabila menghendaki pembagian jumlah kategori diluar macam-macam jumlah kategori tersebut, misalnya menginginkan pembagian kategori menjadi 3, 5, 9, 20 atau yang lainnya, maka dapat menggunakan rumus persentil. Cara perhitungan median tidak akan dibahas lagi dalam pembagian ini karena sudah dikaji panjang lebar pada bagian sebelumnya.

Kuartil

            Kita telah mengetahui bahwa median adalah nilai tengah data. Dengan kata lain, median membagi kelompok data menjadi dua bagian sama banyak, yaitu 50 % data berada di bawah median dan 50 % data berada di atas median. Konsep median dapat diperluas, yaitu kelompok data yang telah diurutkan (membesar atau mengecil) dibagi menjadi empat bagian yang sama banyak. Bilangan pembagian ada tiga, masing-masing disebut kuartil. Kuartil adalah suatu indeks yang dapat membagi suatu distribusi data menjadi 4 bagian atau kategori. Untuk membagi 4 bagian tersebut dibutuhkan 3 titik kuartil (K), dimana masing-masing titik kuartil diberi nama kuartil satu (K1), Kuartil dua (K2) dan kuartil tiga (K3). Kuartil pertama disebut juga kuartil bawah, kuartil kedua disebut juga kuartil tengah, dan kuartil ketiga disebut juga kuartil atas.

Kuartil Satu (K1)

            Kuartil satu (K1) adalah suatu nilai dalam distribusi yang membatasi 25% frekuensi di bagian bawah dan 75% frekuensi di bagian atas distribusi.

Kuartil Dua (K2)

            Kuarti dua (K2) adalah suatu nilai dalam distribusi yang membatasi 50% frekuensi dibawah distribusi dan 50% di atas distribusi. Oleh karena (K2) membagi distribusi menjadi dua bagian secara sama, maka sebenarnya (K2) tidak lain adalah median.

Kuartil Tiga (K3)

            Kuartil tiga (K3) adalah suatu nilai dalam distribusi yang membatasi 75% frekuensi di bagian bawah dan 25% frekuensi di bagian atas.

Desil (D)

            Desil (D) adalah suatu indeks yang membagi suatu distribusi data menjadi 10 bagian atau kategori. Jika suatu distribusi dibagi menjadi 10 kategori maka diperlukan 9 titik batas desil, yaitu D1, D2, D3, D4, D5, D6, D7, D8, dan D9. Dasar perhitungan desil adalah menggunakan angka persepuluhan. D1 = 1/10 N, D2 = 2/10 N, D5 = 5/10 N, D9 = 9/10 N dan seterusnya.

Persentil (P)

            Pengertian-pengertian pada median, kuartil dan desil dapat digunakan untuk memahami pengertian yang terdapat pada persentil. Bedanya, jika median distribusinya dibagi menjadi 2 kategori, kuartil dibagi menjadi 4 kategori, desil dibagi menjadi 10 kategori, maka persentil distribusinya dibagi menjadi 100 kategori. Sehingga dalam perhitungannya nanti akan dijumpai sebanyak 99 titik persentil. Dari P1, P2 sampai dengan P99.

            Angka dasar yang digunakan dalam persentil adalah perseratusan, misalnya untuk P1 = 1/100.N, P25 = 25/100.N (atau ¼ . N seperti angka dasar K1, sehingga P25 = K1). Demikian juga untuk P50 = 50/100.N (= ½.N, yang berarti bahwa P50 = Mdn = K2 = D5). Kesamaan-kesamaan pada macam-macam pengukuran ini mudah dipahami karena angka dasar yang digunakan seringkali menghasilkan nilai yang sama meskipun penampakannya berbeda, hal ini akan kita temukan lagi misalnya: D1 = P10, D2 = P20, K3 = P75, dan sebagainya.

            Melalui persentil seorang peneliti dapat dengan leluasa membagi distribusi data yang dimilikinya kedalam jumlah-jumlah kategori yang dikehendakinya. Misalnya jika penelitian ingin membagi distribusi data tentang skor-skor stress kerja (yang masih berupa data interval) menjadi 5 kategori data ordinal (misalnya tinggi sekali, tinggi, sedang, rendah dan rendah sekali) maka peneliti harus menemukan 4 titik persentil dengan jalan melakukan pembagian, 100/5 = 20. Angka 20 ini nanti akan berfungsi sebagai kelipatan yang digunakan untuk menentukan dasar pembuatan kategori. Maka 5 kategori yang digunakan tersebut akan dibatasi oleh titik-titik P20, P40, P60, dan P80. Untuk pembagian ke dalam jumlah-jumlah kategori yang lain dapat dikembangkan oleh para pembaca sendiri

UKURAN DISPERSI DATA

 

Pengertian Dispersi

 

            Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Rata-rata upah karyawan perusahaan Rp.2.000.0000 per bulan, rata-rata jumlah mahasiswa baru Raharja 1000 mahasiswa per tahun ajaran baru. Setiap kali kita mendengar rata-rata, maka secara otomatis kita membayangkan sekelompok nilai di sekitar rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan kata lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya. Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya.

            Ukuran variabilitas adalah sebuah ukuran derajat penyebaran nilai-nilai variabel dari suatu ukuran pemusatan data dalam sebuah distribusi. Dua kelompok distribusi data dapat memiliki nilai ukuran pemusatan yang sama, akan tetapi derajat penyebarannya bisa jadi sangat berbeda. Misalnya kita memiliki data yang berasal dari dua kelompok individu yang berbeda. Data kelompok individu A : 24, 24, 25, 25, 25, 26, 26, diperoleh mean sebesar 25. Dan data dari kelompok individu B : 16, 19, 22, 25, 28, 30, 35, diperoleh mean sebesar 25.

            Nilai tendensi sentral dalam dua distribusi A dan B tersebut di atas adalah sama yaitu keduanya memiliki harga rata-rata = 25. Namun demikian apabila dilihat dari keragaman dan penyebaran nilai dari kedua distribussi tersebut tampak sangat berbeda. Dimana penyebaran nilai-nilai dalam distribusi A terlihat lebih homogen dibanding distribusi B. Sebaliknya penyebaran nilai dalam distribusi B lebih beragam atau heterogen dibanding penyebaran nilai dalam distribusi A. Hal ini diperlukan suatu indeks yang tidak saja dapat memberikan gambaran ringkas mengenai suatu distribusi (melalui suatu ukuran pemusatan data atau ukuran tendensi sentral), melainkan juga diperlukan suatu ukuran yang dapat memberikan gambaran berdasarkan keragaman nilai-nilai dalam suatu distribusi.

Ukuran dispersi pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran dispersi maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), koefisien variasi (coefficient of variation), ukuran kemencengan kurva (skewness), dan ukuran keruncingan kurva (kurtosis). Di antara ukuran variasi atau disperse data tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data.

 

 

JENIS-JENIS UKURAN DISPERSI

 

Jangkauan (Range, R)

Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Dengan kata lain range atau disebut juga rentangan atau jarak pengukuran dapat didefinisikan sebagai jarak antara nilai tertinggi dengan nilai terendah. Besar kecilnya range dapat digunakan sebagai petunjuk untuk mengetahui taraf keragaman dan variabilitas suatu distribusi. Semakin tinggi range berarti distribusinya semakin beragam, bervariasi atau heterogen. Sebaliknya semakin kecil harga range maka distribusinya semakin tidak bervariasi, tidak beragam, sejenis atau homogen.

Walaupun prosedur yang dilalui sangat sederhana, namun penggunaan range sebagai ukuran variabilitas harus dilakukan dengan hati-hati. Karena range sangat bergantung pada data yang ekstrim (yaitu data yang kemunculan dan ketidak munculannya sangat berpengaruh pada tinggi rendahnya nilai range). Oleh karena hanya didasarkan pada dua nilai yang tertinggi dan terendah inilah, maka range merupakan indeks variabilitas yang tidak dapat diandalkan, tidak stabil atau tidak mantap (reliable) sebagai pendekatan metodologi ilmiah. Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.

 

Jangkauan data tunggal

Bila ada sekumpulan data tunggal X1, X2, …, Xn maka jangkauannya adalah

Jangkauan

Contoh :

Tentukan jangkauan data: 1, 4, 7, 8, 9, 11 !

Jawab:

X6 = 11 dan X1 = 1

Jangkauan =

 

Jangkauan data berkelompok

Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan adalah selisih tepi atas kelas tertinggi dengan tepi bawah kelas terendah.

Jangkauan  Semi Interkuartil

Jangkauan antarkuartil adalah selisih antara nilai kuartil atas  dan kuartil bawah  Dirumuskan:

Jangkauan semi interkuartil atau simpangan kuartil (deviasi kuartil) dari suatu himpunan data, disimbolkan dengan Q didefinisikan sebagai setengah dari selisih kuartil  dengan kuartil bawah . Dirumuskan:

Di mana Q1 dan Q2 adalah kuartil pertama dan kuartil ketiga dari kelompok data. Jangkauan interkuartil kadang-kadang digunakan juga meskipun jaangkauan semi interkuartil lebih umum dan sering digunakan sebagai ukuran untuk disperse data. Rumus-rumus di atas berlaku baik untuk data tunggal dan data yang telah dikelompokan dalam distribusi frekuensi

Deviasi Rata-Rata (Simpangan Rata-Rata)

Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Dengan kata lain, untuk melakukan penghitungan MD digunakan harga yang mutlak saja, yaitu dengan hanya menggunakan nilai-nilai yang bertanda positif saja sedangkan nilai-nilai yang memiliki tanda negatif tidak diperhitungkan atau diabaikan. Cara mencari deviasi rata-rata, dibedakan antara data tunggal dan data berkelompok.

Variansi (Variance)

            Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Walaupun nilai mutlak dan kuadrat sama-sama bertujuan untuk membuat nilai negatif menjadi positif, tetapi maknanya sangat berbeda dan mempunyai pengaruh yang berbeda terhadap ukuran dispersi data. Varians adalah nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-rata kuadrat. Untuk sampel, variansnya (varians sampel) disimbolkan dengan  Untuk populasi, variansnya (varians populasi) disimbolkan dengan  (baca: sigma).

Varians data berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), variansnya dapat ditemukan dengan menggunakan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.

Simpangan Baku (Standar Deviasi)

Simpangan baku (standard deviation) berhubungan langsung dengan varians. Simpangan baku adalah akar dari tengah kuadrat simpangan dari nilai tengah atau akar simpangan rata-rata kuadrat. Untuk sampel, simpangan bakunya (simpangan baku sampel) disimbolkan dengan s. Untuk populasi, simpangan bakunya (simpangan baku populasi) disimbolkan . Untuk menentukan nilai simpangan baku, caranya ialah dengan menarik akar dari varians.

Simpangan baku data berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), simpangan bakunya dapat ditentukan dengan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.

STATISTIKA DESKRIPTIF

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Pengklasifikasian menjadi statistika deskriptif dan statistika inferensia dilakukan berdasarkan aktivitas yang dilakukan.

Statistika deskriptif hanya memberikan informasi mengenai data yang dipunyai dan sama sekali tidak menarik inferensia atau kesimpulan apapun tentang gugus induknya yang lebih besar. Contoh statistika deskriptif yang sering muncul adalah, tabel, diagram, grafik, dan besaran-besaran lain di majalah dan koran-koran. Dengan Statistika deskriptif, kumpulan data yang diperoleh akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari kumpulan data yang ada. Informasi yang dapat diperoleh dari statistika deskriptif ini antara lain ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data.

Klasifikasi, Jenis dan Macam Data – Pembagian Data Dalam Ilmu Eksak Sains Statistik / Statistika

Wed, 21/06/2006 – 12:23pm — godam64

 

A. Jenis Data Menurut Cara Memperolehnya

1. Data Primer

Data primer adalah secara langsung diambil dari objek / obyek penelitian oleh peneliti perorangan maupun organisasi. Contoh : Mewawancarai langsung penonton bioskop 21 untuk meneliti preferensi konsumen bioskop.

2. Data Sekunder

Data sekunder adalah data yang didapat tidak secara langsung dari objek penelitian. Peneliti mendapatkan data yang sudah jadi yang dikumpulkan oleh pihak lain dengan berbagai cara atau metode baik secara komersial maupun non komersial. Contohnya adalah pada peneliti yang menggunakan data statistik hasil riset dari surat kabar atau majalah.

 

B. Macam-Macam Data Berdasarkan Sumber Data

1. Data Internal

Data internal adalah data yang menggambarkan situasi dan kondisi pada suatu organisasi secara internal. Misal : data keuangan, data pegawai, data produksi, dsb.

2. Data Eksternal

Data eksternal adalah data yang menggambarkan situasi serta kondisi yang ada di luar organisasi. Contohnya adalah data jumlah penggunaan suatu produk pada konsumen, tingkat preferensi pelanggan, persebaran penduduk, dan lain sebagainya.

C. Klasifikasi Dara Berdasarkan Jenis Datanya

1. Data Kuantitatif

Data kuantitatif adalah data yang dipaparkan dalam bentuk angka-angka. Misalnya adalah jumlah pembeli saat hari raya idul adha, tinggi badan siswa kelas 3 ips 2, dan lain-lain.

2. Data Kualitatif

Data kualitatif adalah data yang disajikan dalam bentuk kata-kata yang mengandung makna. Contohnya seperti persepsi konsumen terhadap botol air minum dalam kemasan, anggapan para ahli terhadap psikopat dan lain-lain.

D. Pembagian Jenis Data Berdasarkan Sifat Data

1. Data Diskrit

Data diskrit adalah data yang nilainya adalah bilangan asli. Contohnya adalah berat badan ibu-ibu pkk sumber ayu, nilai rupiah dari waktu ke waktu, dan lain-sebagainya.

2. Data Kontinyu

Data kontinyu adalah data yang nilainya ada pada suatu interval tertentu atau berada pada nilai yang satu ke nilai yang lainnya. Contohnya penggunaan kata sekitar, kurang lebih, kira-kira, dan sebagainya. Dinas pertanian daerah mengimpor bahan baku pabrik pupuk kurang lebih 850 ton.

E. Jenis-jenis Data Menurut Waktu Pengumpulannya

1. Data Cross Section

Data cross-section adalah data yang menunjukkan titik waktu tertentu. Contohnya laporan keuangan per 31 desember 2006, data pelanggan PT. angin ribut bulan mei 2004, dan lain sebagainya.

2. Data Time Series / Berkala

Data berkala adalah data yang datanya menggambarkan sesuatu dari waktu ke waktu atau periode secara historis. Contoh data time series adalah data perkembangan nilai tukar dollar amerika terhadap euro eropa dari tahun 2004 sampai 2006, jumlah pengikut jamaah nurdin m. top dan doktor azahari dari bulan ke bulan, dll.

DISTRIBUSI FREKUENSI


Pengertian Distribusi Frekuensi

            Seringkali data yang telah terkumpul tersedia dalam jumlah yang besar sehingga kita mengalami kesulitan untuk mengenali ciri-cirinya. Oleh karena itu, data yang jumlahnya besar perlu ditata atau diorganisir dengan cara meringkas data tersebut ke dalam bentuk kelompok data sehingga dengan segera dapat diketahui ciri-cirinya dan dapat dengan mudah di analisis sesuai dengan kepentingan kita. Pengelompokan data tersebut dilakukan dengan cara mendistribusikan data dalam kelas atau selang dan menetapkan banyaknya nilai yang termasuk dalam kelas yang disebut frekuensi kelas.

            Jadi untuk dapat memahami data dengan mudah, maka baik data kualitatif maupun data kuantitatif harus disajikan dalam bentuk yang ringkas dan jelas. Salah satu cara untuk meringkas data adalah distribusi frekuensi, yaitu pengelompokkan data ke dalam beberapa kelompok (kelas) dan kemudian dihitung banyaknya data yang masuk ke dalam tiap kelas. Dengan kata lain, distribusi frekuensi merupakan suatu cara untuk meringkas serta menyusun sekelompok data mentah (raw data) yang diperoleh dari penelitian, dengan didasarkan pada distribusi (penyebaran) nilai variabel dan frekuensi (banyaknya) individu yang terdapat pada nilai variabel tersebut. Jadi distribusi frekuensi adalah susunan data menurut kelas-kelas interval tertentu atau menurut kategori tertentu dalam sebuah daftar. Distribusi frekuensi digambarkan melalui yang disebut tabel distribusi frekuensi. Dari distribusi frekuensi, dapat diperoleh keterangan atau gambaran sederhana dan sistematis dari data yang diperoleh.

DISTRIBUSI FREKUENSI DATA KUANTITATIF

            Definisi tentang distribusi frekuensi adalah sama baik untuk data kualitatif maupun kuantitatif. Meskipun demikian, kita harus lebih hati-hati dalam menentukan kelas yang digunakan pada distribusi frekuensi. Ada tiga hal yang perlu diperhatikan dalam menentukan kelas bagi distribusi frekuensi untuk data kuantitatif, yaitu jumlah kelas, lebar kelas, dan batas kelas.

Ringkasan

            Data yang dikumpulkan perlu disusun atau disajikan dalam bentuk tertentu. Bentuk-bentuk penyajian data meliputi: (1) tabel yang terdiri atas tabel biasa, tabel distribusi frekuensi, tabel distribusi frekuensi relative, tabel distribusi frekuensi kumulatif, dan distribusi frekuensi relative kumulatif, (2) histrogram, (3) poligon frekuensi, dan (3) ogif.

            Tabel biasa sangat cocok untuk menyajikan data yang terdiri atas beberapa variabel dengan beberapa kategori. Tabel distribusi frekuensi sangat cocok untuk menyajikan data dalam beberapa kelompok. Tabel distribusi frekuensi relatif, nilai frekuensi dinyatakan dalam persen (%) yang disingkat f (%) atau f (rel). Tabel distribusi frekuensi kumulatif adalah distribusi frekuensi biasa yang nilai frekuensi kumulatifnya diperoleh dengan jalan menjumlahkan frekuensi demi frekuensi. Tabel distribusi frekuensi kumulatif ada dua macam yaitu: kumulatif kurang dari dan kumulatif lebih dari. Daftar distribusi frekuensi kumulatif relative adalah apabila nilai f kumulatif dalam frekuensi kumulatif diubah dalam persen.

            Histogram adalah penyajian data distribusi frekuensi yang diubah menjadi diagram batang. Ogif adalah distribusi frekuensi kumulatif yang diagramnya dalam sumbu tegak dan mendatar. Ogif kurang dari adalah diagram dari distribusi frekuensi kumulatif kurang dari. Dan ogif lebih dari adalah diagram dari distribusi frekuensi kumulatif lebih dari.

 

UKURAN PEMUSATAN

 

Pendahuluan

            Meskipun data telah disusun ke dalam distribusi frekuensi, ternyata data yang disajikan itu belum dapat memberikan gambaran tentang variabel-variabel penelitian secara ringkas. Dalam banyak hal, pengumpulan data maupun penyusunan data ke dalam ke dalam distribusi frekuensi tidak semata-mata dibutuhkan bagi tujuan yang sedemikian sederhana yaitu memperoleh gambaran tentang jumlah data. Analisa mengenai perbandingan antara 2 kelompok hasil observasi, persoalan indeks, deret berkala, regresi dan sebagainya membutuhkan data untuk analisa yang bersifat lebih kompleks. Dalam hal demikian itu, pengumpulan data atau penyusunan data ke dalam distribusi frekuensi hanya merupakan tahap permulaan bagi analisa kuantitatif yang lebih lanjut.

Penyajian data ke dalam bentuk grafik juga bertujuan memberi gambaran yang jelas tentang suatu peristiwa kuantitatif secara visual.  Gambaran ringkas tentang variabel penelitian ini menjadi penting karena memungkinkan peneliti dengan mudah dan cepat dapat membaca dan menggambarkan keadaan suatu variabel penelitiah secara menyeluruh. Gambaran ringkas suatu variabel ini seringkali digunakan untuk membandingkan variabel satu dengan variabel lain. Gambaran ringkas tentang suatu variabel di peroleh dengan jalan menghitung ukuran kecenderungan memusat atau ukuran tendensi sentral (central tendency) atau sering disebut ukuran pemusatan data.

Definisi Ukuran Pemusatan

            Dalam beberapa hal, ahli statistik menganggap rata-rata (average) dapat merupakan nilai yang cukup representatif bagi penggambaran nilai-nilai yang terdapat dalam data yang bersangkutan. Rata-rata sedemikian itu dapat dianggap sebagai nilai sentral dan dapat digunakan sebagai pengukuran lokasi sebuah distribusi frekuensi. Namun demikian, apakah rata-rata tersebut cukup representatif bagi penggambaran nilai-nilai keseluruhan data itu sendiri sangat bergantung pada cara nilai-nilai itu sendiri bervariasi. Penilaian terhadap rata-rata berhubungan erat dengan variasi atau dispersi datanya dari mana rata-rata tersebut dihitung. Pada hakekatnya, pengertian tentang rata-rata itu sendiri cukup membi ngungkan bagi sebagian besar orang yang belum pernah mempelajari statistik. Bagi mereka, metode menghitung rata-rata hanya satu macam saja. Padahal, para ahli statistik mengenal berbagai macam rata-rata dengan nama yang khas pula.

Ukuran kecenderungan memusat merupakan suatu bilangan yang menunjukkan tendensi (kecenderungan) memusatnya bilangan-bilangan dalam suatu distribusi. Ukuran kecenderungan memusat juga dapat digunakan untuk merangkum data dan mendeskripsikan suatu kelompok variabel dengan cara mencari suatu angka (indeks) yang dapat mewakili seluruh kelompok tersebut. Rata-rata (average) adalah nilai yang mewakili himpunan atau sekelompok data (a set of data). Nilai rata-rata umumnya cenderung terletak ditengah suatu kelompok data yang disusun menurut besar kecilnya nilai.

Dengan perkataan lain, ia mempunyai kecenderungan memusat, sehingga sering disebut ukuran kecenderungan memusat (measures of central tendency). Beberapa jenis rata-rata yang sering digunakan adalah rata-rata hitung (arithmetic mean atau sering disingkat mean saja), rata-rata ukur (geometric mean), dan rata-rata harmonis (harmonic mean). Setiap rata-rata tersebut selain mempunyai keunggulan juga memiliki kelemahan, dan ketepatan penggunaannya sangat bergantung pada sifat dari data dan tujuannya (misalnya untuk melakukan analisis). Dalam modul ini, yang dimaksudkan dengan rata-rata adalah rata-rata hitung, kecualai kalau ada keterangan atau penjelasan lain. Dalam kehidupan sehari-hari, rata-rata ini lebih banyak dikenal.

Misalnya rata-rata gaji atau upah karyawan Perguruan Tinggi Raharja per bulan, rata-rata produksi beras per tahun, rata-rata harga beras per kilogram, rata-rata umur karyawan suatu departemen, rata-rata hasil penjualan televisi per minggu, rata-rata modal perusahaan nasional, rata-rata hasil ujian seorang mahasiswa, rata-rata permintaan kredit per nasabah dan lain sebagainya. Rata-rata hitung sering digunakan sebagai dasar perbandingan antara dua kelompok nilai atau lebih. Misalnya ada dua mahasiswa, yaitu Ageng dan Fadly dari Jurusan Sistem Komputer STMIK Raharja, yang menempuh ujian lima macam mata kuliah, yaitu: Matematika Diskrit, Kalkulus, Fisika, Statistik Deskriptif, dan Aljabar Linear. Untuk menentukan mana yang lebih pandai antara Ageng atau Fadly, dapat dipergunakan nilai rata-rata.

Rata-Rata Hitung atau Nilai Tengah (Mean)

            Rata-rata hitung atau nilai tengah, dengan lambing µ untuk populasi dan  untuk sampel, merupakan salah satu ukuran pemusatan. Karena sifat-sifatnya yang mudah untuk dipelajari, nilai tengah ini memegang peranan penting dalam statistik inferensial. Nilai tengah yang akan kita pelajari dapat dibedakan menjadi dua bagian, yaitu nilai tengah untuk data tunggal dan nilai tengah untuk data yang telah dikelompokkan dalam table distribusi frekuensi. Bila data sampel terdiri dari sejumlah nilai-nilai hasil pengamatan yang tidak terlalu besar, rata-rata hitungnya (arithmetic mean) dapat langsung dicari dari data yang besangkutan tanpa harus terlebih dahulu menyusunnya ke dalam distribusi frekuensi.

Mean  atau disebut juga dengan rata-rata adalah angka yang diperoleh dengan membagi jumlah nilai-nilai (X) dengan jumlah individu (N). Misalnya untuk membandingkan tingkat gaji atau upah per bulan karyawan perusahaan Unilever  dan perusahaan Argopantes, mana yang lebih tinggi, maka dapat dilakukan wawancara terhadap 10 karyawan perusahaan Unilever dan 10 karyawan perusahaan Argopantes.

Median (Mdn)

Median atau disebut juga rata-rata letak. Perhitungan median dapat dijelaskan, bahwa apabila ada sejumlah atau sekelompok data dan kemudian diurutkan mulai dari yang terkecil sampai yang terbesar, lalu dibagi menjadi dua kelompok; separuh termasuk kelompok tinggi dan separuhnya lagi termasuk kelompok rendah. Maka titik tengah yang memisahkan kedua kelompok tersebut diberi nama median. Dengan kata lain, median adalah nilai pengamatan yang terletak di tengah-tengah data hasil observasi yang telah diurutkan dari kecil ke besar atau sebaliknya. Untuk menentukan nilai median suatu data maka data pengamatan bergantung pada n, apakah n tersebut ganjil atau genap.

Untuk sebaran data yang terbatas jumlahnya, median dapat ditemukan dengan memeriksa urutan dan jumlah nilai atau sebagai berikut: 70, 60, 50, 40, 30, 20, 10. Median dari data tersebut adalah 40 karena angka tersebut merupakan titik tengah yang dapat membagi secara sama nilai-nilai yang terletak dikelompok atas maupun kelompok bawah.

Modus

Untuk menyatakan gejala yang paling sering terjadi atau paling banyak muncul digunakan ukuran pemusatan data yang disebut modus. Tanpa disadari dalam percakapan sehari-hari sesungguhnya modu banyak digunakan untuk menen-tukan rata-rata dari data yang bersifat kualitatif. Ungkapan seperti Dian jarang masuk pada semester yang lalu merupakan ukuran modus. Begitu juga ungkapan, penyebab orang sakit paru-paru adalah karena merokok, merupakan ukuran pemusatan data dengan modus. Pada kasus pertama, jarang masuk merupakan modus, dan pada kasus kedua, karena merokok merupakan modus dari ungkapan tersebut.

Untuk data kuantitatif, modus adalah nilai data yang paling banyak muncul atau nilai data yang mempunyai frekuensi paling besar. Suatu kelompok data mungkin mempunyai modus, tetapi mungkin juga tidak mempunyai modus. Artinya modus suatu kelompok data tidak selalu ada. Bila suatu kelompok data mempunyai modus, maka modusnya bisa lebih dari satu, atau dikatakan modusnya tidak tunggal. Berbeda dengan cara menentukan median, untuk menentukan modus suatu kelompok data, data tersebut tidak perlu diurutkan, tetapi bila data telah diurutkan akan sangat mempermudah menentukan modusnya.

  • Kelompok data: 3,4,4,5,6,8,8,8,9 mempunyai satu modus, yaitu 8.
  • Kelompok data: 3,4,4,6,8,8,9,10 mempunyai dua modus, yaitu 4 dan 8

Bila data telah dikelompokkan menjadi tabel distribusi frekuensi, maka modusnya dapat dihitung dengan rumus berikut:

NILAI KUARTIL, DESIL DAN PERSENTIL

            Dengan menggunakan dasar-dasar median, kita dapat meneruskan kepada perhitungan-perhitungan statistik yang dimaksudkan untuk membuat suatu ukuran atau norma yang digunakan sebagai pedoman untuk membuat kategori-kategori kualitas sekelompok individu. Berdasarkan suatu norma tertentu, seorang peneliti dapat memisahkan individu menjadi bermacam-macam kategori sesuai dengan keperluannya. Misalnya dengan membagi distribusi menjadi 2 kategori yaitu individu yang diterima dan ditolak dalam seleksi suatu pekerjaan. Dengan 4 kategori didapatkan kategori-kategori seperti baik sekali, baik, sedang dan tidak baik. Peneliti bisa mengembangkan sampai menjadi 10 bahkan 100 kategori. Pembuatan kategori ini penting terutama apabila peneliti akan membuat suatu kualifikasi, mengenai subyek penelitian. Misalnya subyek penelitian akan dibagi menjadi 4 bagian yang setiap bagiannya memiliki jumlah individu yang sama, dimana dasar pembagiannya adalah nilai yang dapat menjadi batas dari kelompok yang terdapat dalam distribusi.

            Tatacara yang digunakan untuk membuat norma dengan kategori disebut median (Me) dengan 4 kategori disebut Kuartil (K) dengan 10 kategori disebut desil (D) dan dengan 100 kategori disebut persentil (P). Apabila menghendaki pembagian jumlah kategori diluar macam-macam jumlah kategori tersebut, misalnya menginginkan pembagian kategori menjadi 3, 5, 9, 20 atau yang lainnya, maka dapat menggunakan rumus persentil. Cara perhitungan median tidak akan dibahas lagi dalam pembagian ini karena sudah dikaji panjang lebar pada bagian sebelumnya.

Kuartil

            Kita telah mengetahui bahwa median adalah nilai tengah data. Dengan kata lain, median membagi kelompok data menjadi dua bagian sama banyak, yaitu 50 % data berada di bawah median dan 50 % data berada di atas median. Konsep median dapat diperluas, yaitu kelompok data yang telah diurutkan (membesar atau mengecil) dibagi menjadi empat bagian yang sama banyak. Bilangan pembagian ada tiga, masing-masing disebut kuartil. Kuartil adalah suatu indeks yang dapat membagi suatu distribusi data menjadi 4 bagian atau kategori. Untuk membagi 4 bagian tersebut dibutuhkan 3 titik kuartil (K), dimana masing-masing titik kuartil diberi nama kuartil satu (K1), Kuartil dua (K2) dan kuartil tiga (K3). Kuartil pertama disebut juga kuartil bawah, kuartil kedua disebut juga kuartil tengah, dan kuartil ketiga disebut juga kuartil atas.

Kuartil Satu (K1)

            Kuartil satu (K1) adalah suatu nilai dalam distribusi yang membatasi 25% frekuensi di bagian bawah dan 75% frekuensi di bagian atas distribusi.

Kuartil Dua (K2)

            Kuarti dua (K2) adalah suatu nilai dalam distribusi yang membatasi 50% frekuensi dibawah distribusi dan 50% di atas distribusi. Oleh karena (K2) membagi distribusi menjadi dua bagian secara sama, maka sebenarnya (K2) tidak lain adalah median.

Kuartil Tiga (K3)

            Kuartil tiga (K3) adalah suatu nilai dalam distribusi yang membatasi 75% frekuensi di bagian bawah dan 25% frekuensi di bagian atas.

Desil (D)

            Desil (D) adalah suatu indeks yang membagi suatu distribusi data menjadi 10 bagian atau kategori. Jika suatu distribusi dibagi menjadi 10 kategori maka diperlukan 9 titik batas desil, yaitu D1, D2, D3, D4, D5, D6, D7, D8, dan D9. Dasar perhitungan desil adalah menggunakan angka persepuluhan. D1 = 1/10 N, D2 = 2/10 N, D5 = 5/10 N, D9 = 9/10 N dan seterusnya.

Persentil (P)

            Pengertian-pengertian pada median, kuartil dan desil dapat digunakan untuk memahami pengertian yang terdapat pada persentil. Bedanya, jika median distribusinya dibagi menjadi 2 kategori, kuartil dibagi menjadi 4 kategori, desil dibagi menjadi 10 kategori, maka persentil distribusinya dibagi menjadi 100 kategori. Sehingga dalam perhitungannya nanti akan dijumpai sebanyak 99 titik persentil. Dari P1, P2 sampai dengan P99.

            Angka dasar yang digunakan dalam persentil adalah perseratusan, misalnya untuk P1 = 1/100.N, P25 = 25/100.N (atau ¼ . N seperti angka dasar K1, sehingga P25 = K1). Demikian juga untuk P50 = 50/100.N (= ½.N, yang berarti bahwa P50 = Mdn = K2 = D5). Kesamaan-kesamaan pada macam-macam pengukuran ini mudah dipahami karena angka dasar yang digunakan seringkali menghasilkan nilai yang sama meskipun penampakannya berbeda, hal ini akan kita temukan lagi misalnya: D1 = P10, D2 = P20, K3 = P75, dan sebagainya.

            Melalui persentil seorang peneliti dapat dengan leluasa membagi distribusi data yang dimilikinya kedalam jumlah-jumlah kategori yang dikehendakinya. Misalnya jika penelitian ingin membagi distribusi data tentang skor-skor stress kerja (yang masih berupa data interval) menjadi 5 kategori data ordinal (misalnya tinggi sekali, tinggi, sedang, rendah dan rendah sekali) maka peneliti harus menemukan 4 titik persentil dengan jalan melakukan pembagian, 100/5 = 20. Angka 20 ini nanti akan berfungsi sebagai kelipatan yang digunakan untuk menentukan dasar pembuatan kategori. Maka 5 kategori yang digunakan tersebut akan dibatasi oleh titik-titik P20, P40, P60, dan P80. Untuk pembagian ke dalam jumlah-jumlah kategori yang lain dapat dikembangkan oleh para pembaca sendiri

UKURAN DISPERSI DATA

 

Pengertian Dispersi

 

            Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Rata-rata upah karyawan perusahaan Rp.2.000.0000 per bulan, rata-rata jumlah mahasiswa baru Raharja 1000 mahasiswa per tahun ajaran baru. Setiap kali kita mendengar rata-rata, maka secara otomatis kita membayangkan sekelompok nilai di sekitar rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan kata lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya. Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya.

            Ukuran variabilitas adalah sebuah ukuran derajat penyebaran nilai-nilai variabel dari suatu ukuran pemusatan data dalam sebuah distribusi. Dua kelompok distribusi data dapat memiliki nilai ukuran pemusatan yang sama, akan tetapi derajat penyebarannya bisa jadi sangat berbeda. Misalnya kita memiliki data yang berasal dari dua kelompok individu yang berbeda. Data kelompok individu A : 24, 24, 25, 25, 25, 26, 26, diperoleh mean sebesar 25. Dan data dari kelompok individu B : 16, 19, 22, 25, 28, 30, 35, diperoleh mean sebesar 25.

            Nilai tendensi sentral dalam dua distribusi A dan B tersebut di atas adalah sama yaitu keduanya memiliki harga rata-rata = 25. Namun demikian apabila dilihat dari keragaman dan penyebaran nilai dari kedua distribussi tersebut tampak sangat berbeda. Dimana penyebaran nilai-nilai dalam distribusi A terlihat lebih homogen dibanding distribusi B. Sebaliknya penyebaran nilai dalam distribusi B lebih beragam atau heterogen dibanding penyebaran nilai dalam distribusi A. Hal ini diperlukan suatu indeks yang tidak saja dapat memberikan gambaran ringkas mengenai suatu distribusi (melalui suatu ukuran pemusatan data atau ukuran tendensi sentral), melainkan juga diperlukan suatu ukuran yang dapat memberikan gambaran berdasarkan keragaman nilai-nilai dalam suatu distribusi.

Ukuran dispersi pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran dispersi maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), koefisien variasi (coefficient of variation), ukuran kemencengan kurva (skewness), dan ukuran keruncingan kurva (kurtosis). Di antara ukuran variasi atau disperse data tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data.

 

 

JENIS-JENIS UKURAN DISPERSI

 

Jangkauan (Range, R)

Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Dengan kata lain range atau disebut juga rentangan atau jarak pengukuran dapat didefinisikan sebagai jarak antara nilai tertinggi dengan nilai terendah. Besar kecilnya range dapat digunakan sebagai petunjuk untuk mengetahui taraf keragaman dan variabilitas suatu distribusi. Semakin tinggi range berarti distribusinya semakin beragam, bervariasi atau heterogen. Sebaliknya semakin kecil harga range maka distribusinya semakin tidak bervariasi, tidak beragam, sejenis atau homogen.

Walaupun prosedur yang dilalui sangat sederhana, namun penggunaan range sebagai ukuran variabilitas harus dilakukan dengan hati-hati. Karena range sangat bergantung pada data yang ekstrim (yaitu data yang kemunculan dan ketidak munculannya sangat berpengaruh pada tinggi rendahnya nilai range). Oleh karena hanya didasarkan pada dua nilai yang tertinggi dan terendah inilah, maka range merupakan indeks variabilitas yang tidak dapat diandalkan, tidak stabil atau tidak mantap (reliable) sebagai pendekatan metodologi ilmiah. Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.

 

Jangkauan data tunggal

Bila ada sekumpulan data tunggal X1, X2, …, Xn maka jangkauannya adalah

Jangkauan

Contoh :

Tentukan jangkauan data: 1, 4, 7, 8, 9, 11 !

Jawab:

X6 = 11 dan X1 = 1

Jangkauan =

 

Jangkauan data berkelompok

Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan adalah selisih tepi atas kelas tertinggi dengan tepi bawah kelas terendah.

Jangkauan  Semi Interkuartil

Jangkauan antarkuartil adalah selisih antara nilai kuartil atas  dan kuartil bawah  Dirumuskan:

Jangkauan semi interkuartil atau simpangan kuartil (deviasi kuartil) dari suatu himpunan data, disimbolkan dengan Q didefinisikan sebagai setengah dari selisih kuartil  dengan kuartil bawah . Dirumuskan:

Di mana Q1 dan Q2 adalah kuartil pertama dan kuartil ketiga dari kelompok data. Jangkauan interkuartil kadang-kadang digunakan juga meskipun jaangkauan semi interkuartil lebih umum dan sering digunakan sebagai ukuran untuk disperse data. Rumus-rumus di atas berlaku baik untuk data tunggal dan data yang telah dikelompokan dalam distribusi frekuensi

Deviasi Rata-Rata (Simpangan Rata-Rata)

Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Dengan kata lain, untuk melakukan penghitungan MD digunakan harga yang mutlak saja, yaitu dengan hanya menggunakan nilai-nilai yang bertanda positif saja sedangkan nilai-nilai yang memiliki tanda negatif tidak diperhitungkan atau diabaikan. Cara mencari deviasi rata-rata, dibedakan antara data tunggal dan data berkelompok.

Variansi (Variance)

            Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Walaupun nilai mutlak dan kuadrat sama-sama bertujuan untuk membuat nilai negatif menjadi positif, tetapi maknanya sangat berbeda dan mempunyai pengaruh yang berbeda terhadap ukuran dispersi data. Varians adalah nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-rata kuadrat. Untuk sampel, variansnya (varians sampel) disimbolkan dengan  Untuk populasi, variansnya (varians populasi) disimbolkan dengan  (baca: sigma).

Varians data berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), variansnya dapat ditemukan dengan menggunakan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.

Simpangan Baku (Standar Deviasi)

Simpangan baku (standard deviation) berhubungan langsung dengan varians. Simpangan baku adalah akar dari tengah kuadrat simpangan dari nilai tengah atau akar simpangan rata-rata kuadrat. Untuk sampel, simpangan bakunya (simpangan baku sampel) disimbolkan dengan s. Untuk populasi, simpangan bakunya (simpangan baku populasi) disimbolkan . Untuk menentukan nilai simpangan baku, caranya ialah dengan menarik akar dari varians.

Simpangan baku data berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), simpangan bakunya dapat ditentukan dengan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.

 
 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: