Statistik adalah sekumpulan prosedur untuk mengumpulkan,
mengukur, mengklasifikasi, menghitung, menjelaskan, mensintesis, menganalisis,
dan menafsirkan data kuantitatif yang diperoleh secara sistematis. Secara garis
besar, statistik dibagi menjadi dua komponen utama, yaitu Statistik
Deskriptif dan Statistik inferensial. Statistik deskriptif
menggunakan prosedur numerik dan grafis dalam meringkas gugus data dengan cara
yang jelas dan dapat dimengerti, sementara Statistik inferensial
menyediakan prosedur untuk menarik kesimpulan tentang populasi berdasarkan
sampel yang kita amati. Statistik Deskriptif membantu kita untuk
menyederhanakan data dalam jumlah besar dengan cara yang logis. Data yang
banyak direduksi dan diringkas sehingga lebih sederhana dan lebih mudah diinterpretasi.
Terdapat dua metode dasar dalam statistik deskriptif, yaitu numerik
dan grafis.
- Pendekatan
numerik dapat digunakan untuk menghitung nilai statistik
dari sekumpulan data, seperti mean dan standar deviasi.
Statistik ini memberikan informasi tentang rata-rata dan informasi rinci
tentang distribusi data.
- Metode
grafis lebih sesuai daripada metode numerik untuk
mengidentifikasi pola-pola tertentu dalam data, dilain pihak, pendekatan
numerik lebih tepat dan objektif. Dengan demikian, pendekatan numerik dan
grafis satu sama lain saling melengkapi, sehingga sangatlah bijaksana
apabila kita menggunakan kedua metode tersebut secara bersamaan.
Terdapat tiga karakteristik utama dari variabel tunggal:
- Distribusi
data (distribusi frekuensi)
- Ukuran
pemusatan/tendensi sentral (Central Tendency)
- Ukuran
penyebaran (Dispersion)
Info: Bahasan
selengkapnya akan diuraikan pada topik tersendiri…
Distribusi Data
Pengaturan, penyusunan, dan peringkasan data dengan membuat tabel
seringkali membantu, terutama pada saat kita bekerja dengan sejumlah data yang
besar. Tabel tersebut berisi daftar nilai data yang mungkin berbeda (baik data
tunggal ataupun data yang sudah dikelompok-kelompokan) beserta nilai
frekuensinya. Frekuensi menunjukkan banyaknya kejadian/kemunculan nilai data
dengan kategori tertentu. Distribusi data yang sudah diatur tersebut sering
disebut dengan distribusi frekuensi. Dengan demikian, Distribusi
frekuensi didefinisikan sebagai daftar sebaran data (baik data tunggal maupun
data kelompok), yang disertai dengan nilai frekuensinya. Data dikelompokkan ke
dalam beberapa kelas sehingga ciri-ciri penting data tersebut dapat segera
terlihat.
Distribusi frekuensi yang paling sederhana adalah distribusi yang
menampilkan daftar setiap nilai dari variabel yang disertai dengan nilai
frekuensinya. Distribusi frekuensi dapat digambarkan dalam dua cara,
yaitu sebagai tabel atau sebagai grafik. Distribusi juga dapat
ditampilkan dengan menggunakan nilai persentase. Penyajian distribusi dalam
bentuk grafik lebih mempermudah dalam melihat karakteristik dan kecenderungan
tertentu dari sekumpulan data. Grafik data kuantitatif meliputi Histogram,
Poligon Frekuensi dll, sedangkan grafik untuk data kualitatif meliputi Bar
Chart, Pie Chart dll.
Distribusi frekuensi akan memudahkan kita dalam melihat pola dalam data,
namun demikian, kita akan kehilangan informasi dari nilai individunya.
Aspek penting dari “deskripsi” suatu variabel adalah bentuk distribusinya,
yang menunjukkan frekuensi dari berbagai selang nilai variabel. Biasanya,
seorang peneliti yang tertarik pada seberapa baik distribusi dapat diperkirakan
oleh distribusi normal. Statistik deskriptif sederhana dapat memberikan
beberapa informasi yang relevan dengan masalah ini. Sebagai contoh, jika
skewness (kemiringan), yang mengukur kesimetrisan distribusi data, tidak sama
dengan 0, maka distribusi dikatakan tidak simetris (a simetris), dan
apabila skewness bernilai 0 berarti data tersebut berdistribusi normal
(simetris). Jika kurtosis (keruncingan), yang mengukur keruncingan distribusi
data, tidak sama dengan 0, maka distribusi data mungkin lebih datar atau lebih
runcing dibandingkan dengan distribusi normal. Nilai kurtosis dari distribusi
normal adalah 0.
Informasi yang lebih akurat dapat diperoleh dengan menggunakan salah satu
uji normalitas yaitu untuk menentukan peluang apakah sampel berasal dari
pengamatan populasi yang berdistribusi normal ataukah tidak (misalnya, uji
Kolmogorov-Smirnov, atau uji Shapiro-Wilks’W) . Namun, di antara uji formal
tersebut tidak ada satu pun yang dapat sepenuhnya menggantikan pemeriksaan data
secara visual dengan menggunakan cara grafis, seperti histogram (grafik yang
menunjukkan distribusi frekuensi dari variabel).
Grafik (Histogram, misalnya) memungkinkan kita untuk mengevaluasi
normalitas dari distribusi empiris karena pada histogram tersebut disertakan
juga overlay kurva normalnya. Hal ini juga memungkinkan kita untuk memeriksa
berbagai aspek dari bentuk distribusi data secara kualitatif. Sebagai contoh,
distribusi dapat bimodal (memiliki 2 puncak) ataupun multimodal (lebih dari 2
puncak). Hal ini menunjukkan bahwa sampel tidak homogen dan unsur-unsurnya
berasal dari dua populasi yang berbeda.
Ukuran Pemusatan (Central Tendency)
Salah satu aspek yang paling penting untuk menggambarkan distribusi data
adalah nilai pusat pengamatan. Setiap pengukuran aritmatika yang ditujukan
untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral
dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran tendensi
sentral.
Terdapat tiga jenis ukuran tendensi sentral yang sering digunakan, yaitu:
- Mean
- Median
- Mode
Rata-rata hitung atau arithmetic mean atau sering disebut
dengan istilah mean saja merupakan metode yang paling banyak digunakan
untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan
semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Mean
dipengaruhi oleh nilai ekstrem.
Median adalah nilai yang membagi himpunan pengamatan menjadi dua bagian yang sama
besar, 50% dari pengamatan terletak di bawah median dan 50% lagi terletak di
atas median. Median dari n pengukuran atau pengamatan x1,
x2 ,…, xn adalah nilai pengamatan yang terletak di tengah
gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n)
ganjil, median terletak tepat ditengah gugus data, sedangkan bila n
genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data
yang berada di tengah gugus data. Median tidak dipengaruhi oleh nilai
ekstrem.
Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus,
pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung
frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah
modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus
tidak dipengaruhi oleh nilai ekstrem.
Karakteristik penting untuk ukuran
pusat yang baik
Ukuran nilai pusat (average) merupakan nilai pewakil dari suatu distribusi
data, sehingga harus memiliki sifat-sifat berikut:
- Harus
mempertimbangkan semua gugus data
- Tidak
boleh terpengaruh oleh nilai-nilai ekstrim.
- Harus
stabil dari sampel ke sampel.
- Harus
mampu digunakan untuk analisis statistik lebih lanjut.
Dari beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan
tersebut, kecuali syarat pada point kedua, rata-rata dipengaruhi oleh nilai
ekstrem. Sebagai contoh, jika item adalah 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 maka
mean, median dan modus yang semua sama dengan 6. Jika nilai terakhir adalah 90
bukan 9, rata-rata akan menjadi 14.10, sedangkan median dan modus yang tidak
berubah. Meskipun median dan modus lebih baik dalam hal ini, namun mereka tidak
memenuhi persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat
yang terbaik dan sering digunakan dalam analisis statistik.
Kapan kita menggunakan nilai pusat
yang berbeda?
Nilai ukuran pusat yang tepat untuk digunakan tergantung pada sifat data,
sifat distribusi frekuensi dan tujuan. Jika data kualitatif, hanya modus yang
dapat digunakan. Sebagai contoh, apabila kita tertarik untuk mengetahui jenis
tanah yang khas di suatu lokasi, atau pola tanam di suatu daerah, kita dapat
menggunakan modus. Di sisi lain, jika data bersifat kuantitatif, kita dapat
menggunakan salah satu dari ukuran nilai pusat tersebut.
Jika data bersifat kuantitatif, kita harus mempertimbangkan sifat
distribusi frekuensi gugus data tersebut.
- Bila
distribusi frekuensi data tidak normal (tidak simetris), median atau modus
merupakan ukuran pusat yang tepat.
- Apabila
terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat
menggunakan median atau modus.
- Apabila
distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median,
atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding
yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang
baik.
- Ketika
kita berhadapan dengan laju, kecepatan dan harga lebih tepat menggunakan
rata-rata harmonik.
Jika kita tertarik pada perubahan relatif, seperti dalam kasus pertumbuhan
bakteri, pembelahan sel dan sebagainya, rata-rata geometrik adalah rata-rata
yang paling tepat.
distribusi
normal:sebaran data mengumpul pada harga rata-ratadistribusi poisson:digunakan
apabila menghitung jumlah peristiwa yang terjadi padakurun waktu tertentu atau
luasan tertentu. (kata kuncinya: jumlah benda)jenis datanya diskritcontoh:
jumlah mobil yang melintas pintu tol setiap jam ;jumlah ikan yang terjaring
setiap luasan 1 m2distribusi eksponensial:digunakan pada saat menghitung
peristiwa sambil menunggu (kata kuncinya: waktu)tipe data kontinucontoh: berapa
selang waktu antar mobil yang lewat di pintu toldistribusi binomialkeluaran
peristiwa hanya terdiri dari dua pilihantipe data diskritmisalnya menang atau
kalah, ya atau tidak, benar atau salah,pelemparan mata uang (angka atau
gambar)distribusi geometrik (with replacement)peluang dari sekumpulan item,
misalnya sekantong kelereng yang berarna merah danputih,bila kelerengnya
diambil kemudian dimasukkan lagi maka distribusinya disebut
hypergeometrikdistribusi hypergeometrik (without replacement)lihat d.
geometriklaw the large numbersemua distribusi akan menjurus ke bentuk
distribusi normal bila datanya terus ditambahdistribusi student (distribusi
t)sama dengan distribusi normal, hanya sampel yang digunakan sedikit (umumnya
kurang dari 33)distribusi gammaadalah distribusi eksponensial dengan dua
variabel atau lebihdistribusi betaadalah distribusi untuk inventorydistribusi
uniformsebaran data dengan peluang yang sama dari setiap unsurnyadistribusi
fmemperbandingkan dua variance, uji harga rata-rata tidak mencukupi (deviasinya
sangat besar,sehingga nilai rata-rata sulit dijadikan ukuran) oleh karena itu digunakan
ujivariance yang mengikuti distribusi f.
Distribusi
frekuensi
Tujuan instruksional umum
Setelah mempelajari makalah ini, pembaca dapat memahami konsep-konsep dasar statistik
Tujuan instruksional khusus
Pembaca dapat mengerti dengan baik dan benar:
Arti distribusi
Membuat tabel distribusi frekuensi
Membedakan frekuensi, frekuensi relatif dan frekuensi kumulatif
Membuat grafik histogram, poligon dan ogive
Distribusi frekuensi
Di dalam statistik deskriptif kita selalu mengusahakan agar data dapat disajikan dalam bentuk yang lebih berguna, lebih mudah dipahami dan lebih cepat dimengerti.
Kalau data yang ada hanya sedikit, kita tidak mengalami kesulitan untuk membaca dan mengerti angka-angka itu. Tetapi apabila data yang tersedia banyak sekali jumlahnya, maka untuk mengerti data tersebut kita akan mengalami kesulitan. Untuk memudahkannya data harus disusun secara sistematis atau teratur kedalam distribusi frekuensi.
Distribusi frekuensi adalah pengelompokkna data ke dalam beberapa kelompok (kelas) dan kemudian dihitung banyaknya data yang masuk kedalam tiap kelas.
Distribusi frekuensi ada beberapa macam, diantaranya:
Ditinjau dari jenisnya
Distribusi frekuensi numerik
Distribusi kategorikal
Ditinjau dari nyata tidaknya frekuensi
Distribusi frekuensi absolut
Distribusi frekuensi relatif
Ditinjau dari kesatuannya
Distribusi frekuensi satuan
Distribusi frekuensi kumulatif
Distrubsi frekuensi numerik dan kategorikal
Yang dimaksud dengan Distribusi frekuensi numerik adalah Distribusi frekuensi yang didasarkan pada data-data kontinum yaitu data yang berdiri sendiri dan merupakan suatu deret hitung.
Sedangkan yang dimaksud dengan Distribusi frekuensi kategorikal adalah Distribusi frekuensi yang didasarkan pada data-data yang terkelompok. Jika data masih berbentuk kontinum, maka harus diubah lebih dahulu menjadi data kategorikal dan selanjutnya beru dicari frekuens masing-masing kelompok.
Contoh:
Penelitian terhadap nilai pembaca S1 Jurusan Teknik Informatika untuk mata kuliah statistik pada suatu perguruan tinggi. Dari hasil pengambilan sampel secara random(acak) terambil sampel sebanyak 30 nilai statistik.
Dari sampel tersebut diperoleh data dengan penyebarannya sebagai berikut:
75 80 30 70 20 35 65 65 70 57
55 25 58 70 40 35 36 45 40 25
15 55 35 65 40 15 30 30 45 40
Pada contoh diatas merupakan contoh Distribusi frekuensi numerik. Mengingat Distribusi frekuensi numerik didasarkan padadata apa adanya maka ada kemungkinan daftar Distribusi akan panjang (terutama untuk data yang mempunyai rentangan panjang). Jika hal ini terjadi maka usaha yang semula bertujuan mempermudah dalam membaca data melalui penyusunan distribusi frekuensi tidak akan tercapai. Hal ini disebabkan karena daftar distribusi masih panjang yang berkemungkinan besar masih mengacaukan pembaca. Untuk mengatasi masalah tersebut dibuatlah distribusi frekuensi kategorikal yaitu data yang sudah dikelompokkan seperti tabel dibawah ini:
nilai F
15-25 5
26-36 7
37-47 6
48-58 4
59-69 3
70-80 5
30
Perubahan data numerik ke data kategorikal harus menggunakan aturan-aturan tertentu, itu berarti bahwa pengelompokkan tersebut harus memuat aturan-aturan tertentu, sehingga tidak akan terjadi suatu rentangan atau kelompok yang tidak berfrekuensi.
Tiga hal yang perlu diperhatikan dalam menentukan kelas bagi distribusi frekuensi kategorikal:
Jumlah kelas
Lembar kelas
Batas kelas
Jumlah kelas
Tidak ada aturan umum yang menentukan jumlah kelas. H.A. Sturges pada tahun 1926 menulis artikel dengan judul: “The Choice of a Class Interval” dalam Journal of the American Statistical Association, yang mengemukakan suatu rumus untuk menentukan banyaknya kelas sebagai berikut:
K = 1 + 3,3 log n
Dimana:
K = banyaknya kelas
n = banyaknya nilai observasi
rumus ini disebut Kriterium Sturges dan merupakan suatu perkiraan tentang banyaknya kelas. Misalnya data dengan n = 100, maka banyaknya kelas K adalah sebagai berikut:
K = 1 + 3,3 (2) = 1 + 6,664 = 7,644 – 8
Jadi jumlah kelas/kelompok yang dianjurkan pada data di atas adalah 8.
Ada kemungkinam jumlah kelompok hasil perhitungan rumus di atas merupakan pecahan, tetapi di sini untuk memudahkannyakita akan melakukan pembualatan. Langkah berikutnya adalah mencari rentangan (interval) tiap kelas.
Lebar kelas atau interval
Disarankan interval atau lebar kelas adalah sama untuk setiap kelas. Pada umumnya, untuk menentukan besar kelas (panjang interval) digunakan rimus:
c=(x_n- x_1)/k
Dimana:
c = lebar kelas
k = banyaknya kelas
x_n = nilai observasi terbesar
x_1 = nilai observasi terkecil
nilai f
48-54 1
55-61 2
62-68 7
69-75 12
76-82 7
83-89 3
90-6 2
34
Nilai 48-54 disebut kelas interval. Urutan kelas interval disusun mulai data terkecil hingga terbesar. Urutan kelas interval pertama adalah 48-54, dan urutan kelas unterval kedua adalah 55-61, demikian seterusnya. Semua kelas interval berada di kolom sebelah kiri. Sedangkan nilai yang berada disebelah kanan adalah nilai frekuansi yang disingkat f. f = 1 berarti yang mempunyai nilai antara 48 sampai 58 sebanyak 1. Nilai-nilai dikiri kelas interval (48,55,62,69,76,83,90) disebut batas bawah kelas. Nilai 48 disebut batas bawah kelas pertama, nilai 55 disebut batas bawah kelas kedua, dan sterusnya. Sedangkan nilai-nilai yang di kanan kelas interval (54,61,68,75,82,89,96) disebut batas atas kelas.
Selisih positif antara batas bawah dengan batas atas harus sama yang disebut lebar kelas.
Misalnya kita memiliki data terbesar 95 dan data terkecil 10 dengan jumlah kelas 9, maka di dapat:
c=(x_n- x_1)/k=(95-10)/9=85/9=9,44≈10
Pembulatan pada penentuan interval sebaiknya ke atas, walaupun angka di belakang koma kecil, karena pembulatan kebawah akan menanggung resiko yaitu ada data yang tidak masuk dalam kelompok yang telah ditentukan.
Batas kelas
Batas kelas bawah menunjukkan kemungkinan nilai data terkecil pada suatu kelas. Sedangkan batas kelas atas mengidentifikasi kemungkinan nilai terbesar dalam suatu kelas.
Contoh:
Berikut ini adalah data tenteng nila pembaca:
48 50 37 43 51 52 47 48 48 41
42 45 48 37 53 52 51 48 43 41
Jawab
Langkah 1 urutkan data dari yang terkecil hinga yang terbasar
37 37 41 41 42 43 43 45 47 48
48 48 48 48 50 51 51 52 52 53
Langkah 2 tentukan nilai max dan min
Nilai max = 53 dan nilai min = 37
Langkah 3 tentukan range (selisih nilai max dan min)
Range = 53-37=16 (kelas interval harus mampu menampung semua data observasi)
Langkah 4 tentukan jumlah kelas dengan menggunakan rumus sturges
k = 1 + 3,3 log n
= 1 + 3,3 log 20 = 1 + 3,3 * 1,3 = 5,29 -- 5
Langkah 5 tentukan c (lebar kelas/interval)
c=range/k=16/5=3,2≈4
Langkah 6 membuat tabel distribusi frekuensi
nilai Frekuensi
37-40
41-44
45-48
49-52
53-56 2
5
7
5
1
Distribusi frekuensi absolut dan relatif
Yang dimaksud dengan Distribusi frekuensi absolut adalah suatu jumlah bilangan yang menyatakan banyaknya data pada suatu kelompok tertentu. Distribusi ini disusun berdasarkan data apa adanya, sehingga tidak menyulitkan peneliti dalam membuat distribusi ini.
Yang dimaksud dengan Distribusi frekuensi relatif adalah suatu jumlah persentase yang menyatakan banyaknya data pada suatu kelompok tertentu. Dalam hal ini pembuat distribusi terlebih dahulu harus dapat menghitung persentase pada masing-masing kelompok. Distribusi akan memberikan informasi yang lebih jelas tentang posisi masing-masing bagian dalam keseluruhan, karena kita dapat melihat perbandingan antara kelompok yang satu dengan kelompok yang lainnya.walaupun demikian kita masih belum memperoleh gambaran yang jelastentang penyebab adanya perbedaan tersebut. Berikut adalah rumus mencari Distribusi frekuensi relatif:
frekuensi relatif=(frekuensi kelas)/n×100
Dibawah ini gambar tabel frekuensi relatif dan frekuensi kumulatif:
X f fr fk* fk**
X1 f1 f1/n*100 f1 f1+f2+...+fi+...+fk
X2 f2 f2/n*100 f1+f2 f2+...+fi+...+fk
. . . . .
. . . . .
. . . . .
Xi fi fi/n*100 f1+f2+...+fi fi+...+fk
. . . . .
. . . . .
. . . . .
Xk fk fk/n*100 f1+f2+...+fi+...+fk fk
Contoh:
Dari soal diatas didapat frekuensi relatifnya adalah:
nilai frekuensi Frek. Relatif
37-40 2 10
41-44 5 25
45-48 7 35
49-52 5 25
53-56 1 5
total 20
Contoh lain:
Data pengukuran tinggi badan atas 100 orang. Setelah dilakukan penyederhanaan data(tinggi badan dikelompokkan menjadi 7 kelompok/kelas), maka distribusi frekuensi absolut dan relatif dapat dikihat pada tabel dibawah ini:
Tinggi badan(cm) frekuensi Frek. Relatif
150-154 5 5
155-159 10 10
160-164 25 25
165-169 30 30
170-174 19 19
175-179 8 8
180-184 3 3
Total 100 100
Distribusi frekuensi satuan dan kumulatif
Distribusi frekuensi Satuan adalah frekuensi yang menunjukan berapa banyak data pada kelompok tertentu. Contoh-contoh Distribusi frekuensi diatas menunjukkan Distribusi frekuensi satuan, baik yang numerik maupun relatif. Yang dimaksud distribusi frekuensi kumulatif adalah distribusi frekuensi yang menunjukkan jumlah frekuensi pada sekelompok nilai tertentu mulai dai kelompok sebelumnya sampai kelompok tersebut.
Histogram, Poligom Dan Ogive
Histogram adalah penyajian data distribusi frekuensi yang diubah menjadi diagram batang. Untuk menggambarkan histogram dipakai sumbu mendatar yang menyatakan kelas-kelas interval (diambil dari batas bawah senbenarnya dan batas atas sebenarnya) dan sumbu tegak yang menyatakan frekuensi absolut atau frekuensi relatif.
nilai frekuensi Frek. Relatif Fk*(kurang dari) Fk**(lebih dari)
37-40 2 10 2 20
41-44 5 25 7 18
45-48 7 35 14 13
49-52 5 25 19 6
53-56 1 5 20 1
total 20
Contohnya diambil dari tabel diatas, pada tabel diatas setiap nilai kelas adalah daya diskrit, maka ada celah atau gap antara kelas yang satu dengan yang lainnya. Misalnya antara 37-40 dengan 41-44, antara 45-48 dengan 49-52 dan seterusnya. Untuk menggambarkan histogram, kelas pertama dibuat 36,5-40,5, kelas kedua 40,5-44,5, kelas ketiga 44,5-48,5 dan seterusnya. Angka 36,5 sebetulnya diambil dari:
nilai
36,5 - 40,5
40,5 - 44,5
44,5 - 48,5
48,5 - 52,5
52,5 - 56,5
(36+37)/2=36,5 , seolah-olah sebelum kelas pertama ada kelas 33-36, kemudian (40+41)/2=40,5 , dan seterusnya. Hasil tersebut dapat dilihat pada tabel dibawah ini. Setiap batangan (bar) dibuat pada kelas-kelas ini dengan tinggi sebesar nilai frekuensi kelas bersangkutan.
Poligon ialah gambar garis yang menghubungkan tengah-tengah tiap sisi atas dati histogram yang berdekatan. Caranya: batas bawah + batas atas / 2 = 36,5+40,5/2=38,5
Contohnya diambil dari tabel diatas:
nilai
36,5 - 40,5
40,5 - 44,5
44,5 - 48,5
48,5 - 52,5
52,5 - 56,5
Apabila titik tengah pada setiap batang (bar) dihubungkan, maka kita akan memperoleh gambar seperti gambar dibawah ini:
Ogive adalah distribusi frekuensi kumulatif yang diagramnya dalam sumbu tegak dan datar. Ogive “kurang dari” dari distribusi frekuensi kumulatif kurang dari. Dan ogive “atau lebih dari” ialah diagram dari distribusi frekuensi kumulatif atau lebih dari. Sewaktu membuat frekuensi kumulatif “kurang dari” kita mempergunakan nilai batas kelas atas (upper class limit) yaitu mulai 40,44,48 dan seterusnya. Jadi banyaknya kelompok nilai yang sama atau kurang 40 ada 2, yang sama atau kurang 44 ada 7, yang sama atau kurang 48 ada 14 dan seterusnya. Sebaliknya untuk yang “lebih dari” kita pergunakan nilai batas kelas bawah (lower class limit) yaitu mulai dari 37,41,45 danseterusnya. Jadi banyaknya kelompok yang sama atau lebih dari 37 ada 30, dan seterusnya. Untuk tujuan memperoleh kurva frekuensi kumulatif (ogive), batas kelas atas diwakili oleh angka 40,5 ; 44,5 ; 48,5 dan seterusnya, sedangkan batas bawah diwakili oleh 36.5 ; 40.5 ; 44.5 dan seterusnya.
Kesimpulan
Untuk mengolah data tentunya kita perlu mengusahakan agar data dapat disajikan dalam bentuk yang lebih berguna dan mudaj dipahami, untuk itu kita perlu memehami distribusi frekuensi dalam mengolah data statistik .
Kita pun harus mampu membuat tabel dan diagram frekuensi aar memudahkan kita dalam mengolah data, mengerti pengelompokkan data ke dalam beberapa kelompok alias kelas dan kemudian dihitung banyaknya data yang masuk ke dalam tiap kelas.
Tujuan instruksional umum
Setelah mempelajari makalah ini, pembaca dapat memahami konsep-konsep dasar statistik
Tujuan instruksional khusus
Pembaca dapat mengerti dengan baik dan benar:
Arti distribusi
Membuat tabel distribusi frekuensi
Membedakan frekuensi, frekuensi relatif dan frekuensi kumulatif
Membuat grafik histogram, poligon dan ogive
Distribusi frekuensi
Di dalam statistik deskriptif kita selalu mengusahakan agar data dapat disajikan dalam bentuk yang lebih berguna, lebih mudah dipahami dan lebih cepat dimengerti.
Kalau data yang ada hanya sedikit, kita tidak mengalami kesulitan untuk membaca dan mengerti angka-angka itu. Tetapi apabila data yang tersedia banyak sekali jumlahnya, maka untuk mengerti data tersebut kita akan mengalami kesulitan. Untuk memudahkannya data harus disusun secara sistematis atau teratur kedalam distribusi frekuensi.
Distribusi frekuensi adalah pengelompokkna data ke dalam beberapa kelompok (kelas) dan kemudian dihitung banyaknya data yang masuk kedalam tiap kelas.
Distribusi frekuensi ada beberapa macam, diantaranya:
Ditinjau dari jenisnya
Distribusi frekuensi numerik
Distribusi kategorikal
Ditinjau dari nyata tidaknya frekuensi
Distribusi frekuensi absolut
Distribusi frekuensi relatif
Ditinjau dari kesatuannya
Distribusi frekuensi satuan
Distribusi frekuensi kumulatif
Distrubsi frekuensi numerik dan kategorikal
Yang dimaksud dengan Distribusi frekuensi numerik adalah Distribusi frekuensi yang didasarkan pada data-data kontinum yaitu data yang berdiri sendiri dan merupakan suatu deret hitung.
Sedangkan yang dimaksud dengan Distribusi frekuensi kategorikal adalah Distribusi frekuensi yang didasarkan pada data-data yang terkelompok. Jika data masih berbentuk kontinum, maka harus diubah lebih dahulu menjadi data kategorikal dan selanjutnya beru dicari frekuens masing-masing kelompok.
Contoh:
Penelitian terhadap nilai pembaca S1 Jurusan Teknik Informatika untuk mata kuliah statistik pada suatu perguruan tinggi. Dari hasil pengambilan sampel secara random(acak) terambil sampel sebanyak 30 nilai statistik.
Dari sampel tersebut diperoleh data dengan penyebarannya sebagai berikut:
75 80 30 70 20 35 65 65 70 57
55 25 58 70 40 35 36 45 40 25
15 55 35 65 40 15 30 30 45 40
Pada contoh diatas merupakan contoh Distribusi frekuensi numerik. Mengingat Distribusi frekuensi numerik didasarkan padadata apa adanya maka ada kemungkinan daftar Distribusi akan panjang (terutama untuk data yang mempunyai rentangan panjang). Jika hal ini terjadi maka usaha yang semula bertujuan mempermudah dalam membaca data melalui penyusunan distribusi frekuensi tidak akan tercapai. Hal ini disebabkan karena daftar distribusi masih panjang yang berkemungkinan besar masih mengacaukan pembaca. Untuk mengatasi masalah tersebut dibuatlah distribusi frekuensi kategorikal yaitu data yang sudah dikelompokkan seperti tabel dibawah ini:
nilai F
15-25 5
26-36 7
37-47 6
48-58 4
59-69 3
70-80 5
30
Perubahan data numerik ke data kategorikal harus menggunakan aturan-aturan tertentu, itu berarti bahwa pengelompokkan tersebut harus memuat aturan-aturan tertentu, sehingga tidak akan terjadi suatu rentangan atau kelompok yang tidak berfrekuensi.
Tiga hal yang perlu diperhatikan dalam menentukan kelas bagi distribusi frekuensi kategorikal:
Jumlah kelas
Lembar kelas
Batas kelas
Jumlah kelas
Tidak ada aturan umum yang menentukan jumlah kelas. H.A. Sturges pada tahun 1926 menulis artikel dengan judul: “The Choice of a Class Interval” dalam Journal of the American Statistical Association, yang mengemukakan suatu rumus untuk menentukan banyaknya kelas sebagai berikut:
K = 1 + 3,3 log n
Dimana:
K = banyaknya kelas
n = banyaknya nilai observasi
rumus ini disebut Kriterium Sturges dan merupakan suatu perkiraan tentang banyaknya kelas. Misalnya data dengan n = 100, maka banyaknya kelas K adalah sebagai berikut:
K = 1 + 3,3 (2) = 1 + 6,664 = 7,644 – 8
Jadi jumlah kelas/kelompok yang dianjurkan pada data di atas adalah 8.
Ada kemungkinam jumlah kelompok hasil perhitungan rumus di atas merupakan pecahan, tetapi di sini untuk memudahkannyakita akan melakukan pembualatan. Langkah berikutnya adalah mencari rentangan (interval) tiap kelas.
Lebar kelas atau interval
Disarankan interval atau lebar kelas adalah sama untuk setiap kelas. Pada umumnya, untuk menentukan besar kelas (panjang interval) digunakan rimus:
c=(x_n- x_1)/k
Dimana:
c = lebar kelas
k = banyaknya kelas
x_n = nilai observasi terbesar
x_1 = nilai observasi terkecil
nilai f
48-54 1
55-61 2
62-68 7
69-75 12
76-82 7
83-89 3
90-6 2
34
Nilai 48-54 disebut kelas interval. Urutan kelas interval disusun mulai data terkecil hingga terbesar. Urutan kelas interval pertama adalah 48-54, dan urutan kelas unterval kedua adalah 55-61, demikian seterusnya. Semua kelas interval berada di kolom sebelah kiri. Sedangkan nilai yang berada disebelah kanan adalah nilai frekuansi yang disingkat f. f = 1 berarti yang mempunyai nilai antara 48 sampai 58 sebanyak 1. Nilai-nilai dikiri kelas interval (48,55,62,69,76,83,90) disebut batas bawah kelas. Nilai 48 disebut batas bawah kelas pertama, nilai 55 disebut batas bawah kelas kedua, dan sterusnya. Sedangkan nilai-nilai yang di kanan kelas interval (54,61,68,75,82,89,96) disebut batas atas kelas.
Selisih positif antara batas bawah dengan batas atas harus sama yang disebut lebar kelas.
Misalnya kita memiliki data terbesar 95 dan data terkecil 10 dengan jumlah kelas 9, maka di dapat:
c=(x_n- x_1)/k=(95-10)/9=85/9=9,44≈10
Pembulatan pada penentuan interval sebaiknya ke atas, walaupun angka di belakang koma kecil, karena pembulatan kebawah akan menanggung resiko yaitu ada data yang tidak masuk dalam kelompok yang telah ditentukan.
Batas kelas
Batas kelas bawah menunjukkan kemungkinan nilai data terkecil pada suatu kelas. Sedangkan batas kelas atas mengidentifikasi kemungkinan nilai terbesar dalam suatu kelas.
Contoh:
Berikut ini adalah data tenteng nila pembaca:
48 50 37 43 51 52 47 48 48 41
42 45 48 37 53 52 51 48 43 41
Jawab
Langkah 1 urutkan data dari yang terkecil hinga yang terbasar
37 37 41 41 42 43 43 45 47 48
48 48 48 48 50 51 51 52 52 53
Langkah 2 tentukan nilai max dan min
Nilai max = 53 dan nilai min = 37
Langkah 3 tentukan range (selisih nilai max dan min)
Range = 53-37=16 (kelas interval harus mampu menampung semua data observasi)
Langkah 4 tentukan jumlah kelas dengan menggunakan rumus sturges
k = 1 + 3,3 log n
= 1 + 3,3 log 20 = 1 + 3,3 * 1,3 = 5,29 -- 5
Langkah 5 tentukan c (lebar kelas/interval)
c=range/k=16/5=3,2≈4
Langkah 6 membuat tabel distribusi frekuensi
nilai Frekuensi
37-40
41-44
45-48
49-52
53-56 2
5
7
5
1
Distribusi frekuensi absolut dan relatif
Yang dimaksud dengan Distribusi frekuensi absolut adalah suatu jumlah bilangan yang menyatakan banyaknya data pada suatu kelompok tertentu. Distribusi ini disusun berdasarkan data apa adanya, sehingga tidak menyulitkan peneliti dalam membuat distribusi ini.
Yang dimaksud dengan Distribusi frekuensi relatif adalah suatu jumlah persentase yang menyatakan banyaknya data pada suatu kelompok tertentu. Dalam hal ini pembuat distribusi terlebih dahulu harus dapat menghitung persentase pada masing-masing kelompok. Distribusi akan memberikan informasi yang lebih jelas tentang posisi masing-masing bagian dalam keseluruhan, karena kita dapat melihat perbandingan antara kelompok yang satu dengan kelompok yang lainnya.walaupun demikian kita masih belum memperoleh gambaran yang jelastentang penyebab adanya perbedaan tersebut. Berikut adalah rumus mencari Distribusi frekuensi relatif:
frekuensi relatif=(frekuensi kelas)/n×100
Dibawah ini gambar tabel frekuensi relatif dan frekuensi kumulatif:
X f fr fk* fk**
X1 f1 f1/n*100 f1 f1+f2+...+fi+...+fk
X2 f2 f2/n*100 f1+f2 f2+...+fi+...+fk
. . . . .
. . . . .
. . . . .
Xi fi fi/n*100 f1+f2+...+fi fi+...+fk
. . . . .
. . . . .
. . . . .
Xk fk fk/n*100 f1+f2+...+fi+...+fk fk
Contoh:
Dari soal diatas didapat frekuensi relatifnya adalah:
nilai frekuensi Frek. Relatif
37-40 2 10
41-44 5 25
45-48 7 35
49-52 5 25
53-56 1 5
total 20
Contoh lain:
Data pengukuran tinggi badan atas 100 orang. Setelah dilakukan penyederhanaan data(tinggi badan dikelompokkan menjadi 7 kelompok/kelas), maka distribusi frekuensi absolut dan relatif dapat dikihat pada tabel dibawah ini:
Tinggi badan(cm) frekuensi Frek. Relatif
150-154 5 5
155-159 10 10
160-164 25 25
165-169 30 30
170-174 19 19
175-179 8 8
180-184 3 3
Total 100 100
Distribusi frekuensi satuan dan kumulatif
Distribusi frekuensi Satuan adalah frekuensi yang menunjukan berapa banyak data pada kelompok tertentu. Contoh-contoh Distribusi frekuensi diatas menunjukkan Distribusi frekuensi satuan, baik yang numerik maupun relatif. Yang dimaksud distribusi frekuensi kumulatif adalah distribusi frekuensi yang menunjukkan jumlah frekuensi pada sekelompok nilai tertentu mulai dai kelompok sebelumnya sampai kelompok tersebut.
Histogram, Poligom Dan Ogive
Histogram adalah penyajian data distribusi frekuensi yang diubah menjadi diagram batang. Untuk menggambarkan histogram dipakai sumbu mendatar yang menyatakan kelas-kelas interval (diambil dari batas bawah senbenarnya dan batas atas sebenarnya) dan sumbu tegak yang menyatakan frekuensi absolut atau frekuensi relatif.
nilai frekuensi Frek. Relatif Fk*(kurang dari) Fk**(lebih dari)
37-40 2 10 2 20
41-44 5 25 7 18
45-48 7 35 14 13
49-52 5 25 19 6
53-56 1 5 20 1
total 20
Contohnya diambil dari tabel diatas, pada tabel diatas setiap nilai kelas adalah daya diskrit, maka ada celah atau gap antara kelas yang satu dengan yang lainnya. Misalnya antara 37-40 dengan 41-44, antara 45-48 dengan 49-52 dan seterusnya. Untuk menggambarkan histogram, kelas pertama dibuat 36,5-40,5, kelas kedua 40,5-44,5, kelas ketiga 44,5-48,5 dan seterusnya. Angka 36,5 sebetulnya diambil dari:
nilai
36,5 - 40,5
40,5 - 44,5
44,5 - 48,5
48,5 - 52,5
52,5 - 56,5
(36+37)/2=36,5 , seolah-olah sebelum kelas pertama ada kelas 33-36, kemudian (40+41)/2=40,5 , dan seterusnya. Hasil tersebut dapat dilihat pada tabel dibawah ini. Setiap batangan (bar) dibuat pada kelas-kelas ini dengan tinggi sebesar nilai frekuensi kelas bersangkutan.
Poligon ialah gambar garis yang menghubungkan tengah-tengah tiap sisi atas dati histogram yang berdekatan. Caranya: batas bawah + batas atas / 2 = 36,5+40,5/2=38,5
Contohnya diambil dari tabel diatas:
nilai
36,5 - 40,5
40,5 - 44,5
44,5 - 48,5
48,5 - 52,5
52,5 - 56,5
Apabila titik tengah pada setiap batang (bar) dihubungkan, maka kita akan memperoleh gambar seperti gambar dibawah ini:
Ogive adalah distribusi frekuensi kumulatif yang diagramnya dalam sumbu tegak dan datar. Ogive “kurang dari” dari distribusi frekuensi kumulatif kurang dari. Dan ogive “atau lebih dari” ialah diagram dari distribusi frekuensi kumulatif atau lebih dari. Sewaktu membuat frekuensi kumulatif “kurang dari” kita mempergunakan nilai batas kelas atas (upper class limit) yaitu mulai 40,44,48 dan seterusnya. Jadi banyaknya kelompok nilai yang sama atau kurang 40 ada 2, yang sama atau kurang 44 ada 7, yang sama atau kurang 48 ada 14 dan seterusnya. Sebaliknya untuk yang “lebih dari” kita pergunakan nilai batas kelas bawah (lower class limit) yaitu mulai dari 37,41,45 danseterusnya. Jadi banyaknya kelompok yang sama atau lebih dari 37 ada 30, dan seterusnya. Untuk tujuan memperoleh kurva frekuensi kumulatif (ogive), batas kelas atas diwakili oleh angka 40,5 ; 44,5 ; 48,5 dan seterusnya, sedangkan batas bawah diwakili oleh 36.5 ; 40.5 ; 44.5 dan seterusnya.
Kesimpulan
Untuk mengolah data tentunya kita perlu mengusahakan agar data dapat disajikan dalam bentuk yang lebih berguna dan mudaj dipahami, untuk itu kita perlu memehami distribusi frekuensi dalam mengolah data statistik .
Kita pun harus mampu membuat tabel dan diagram frekuensi aar memudahkan kita dalam mengolah data, mengerti pengelompokkan data ke dalam beberapa kelompok alias kelas dan kemudian dihitung banyaknya data yang masuk ke dalam tiap kelas.
No comments:
Post a Comment