STATISTIKA

BAB I
ARTI STATISTIKA

A. Pendahuluan

Menurut sejarah, kata ‘Statistika’ diambil dari bahasa latin ‘status’ yang berarti ‘negara’. Untuk beberapa dekade, Statistika semata-mata hanya dikaitkan dengan penyajian fakta-fakta dan angka-angka tentang situasi perekonomian, kependudukan, dan politik yang terjadi di suatu negara. Hingga saat ini, sebagian masyarakat masih mempunyai pengertian yang salah, bahwa Statistika hanya berkaitan dengan susunan angka-angka yang membosankan dan kadang-kadang diselingi grafik-grafik. Namun demikian, metodologi dan teori statistika modern telah membuat lompatan yang jauh lebih maju. Sebagai suatu disiplin ilmu, saat ini Statistika meliputi berbagai metode dan konsep yang sangat penting dalam semua penyelidikan yang melibatkan pengumpulan data dengan cara eksperimentasi dan observasi, serta pengambilan inferensi atau kesimpulan dengan menganalisis data. Penyajian data dalam tabel dan grafik menjadi aspek Statistika yang kurang penting saat ini.
Untuk memantapkan pengertian kita tentang kata Statistika, berikut ini diberikan pengertiannya. Statistika adalah sekumpulan konsep dan metode yang digunakan untuk mengumpulkan dan menginterpretasi data tentang bidang kegiatan tertentu dan mengambil kesimpulan dalam situasi di mana ada ketidakpastian dan variasi.
Dalam penelitian ilmiah Statistika memegang peranan yang sangat penting. Pada tingkat pengumpulan informasi, Statistika memberikan petunjuk kepada para peneliti bagaimana cara yang wajar dan baik untuk mengumpulkan data yang informatif, termasuk penentuan macam dan banyak data hingga kesimpulan-kesimpulan yang ditarik dari analisis dapat dinyatakan dengan tingkat ketepatan yang diinginkan. Dalam bidang studi di mana eksperimen sangat mahal, macam dan banyaknya data yang diperlukan untuk memberikan tingkat kepercayaan yang diinginkan dalam kesimpulan yang diambil haruslah ditentukan sebelumnya secara cermat dan teliti.
Setelah data terkumpul, akan lebih banyak lagi metode untuk meringkaskan informasi yang terkandung di dalam data, memusatkan perhatian pada segi-segi yang pokok saja serta mengabaikan hal-hal kecil yang kurang penting. Metode-metode yang sangat penting untuk menganalisis data diperlukan dalam pengambilan kesimpulan atau inferensi tentang fenomena yang dipelajari. Statistika yang mempelajari metode meringkas dan menggambarkan segi-segi yang sangat penting dari data dikenal sebagai Statistika deskriptif. Sedangkan Statistika yang mempelajari metode mengevaluasi informasi yang terkandung dalam data dan penafsiran tentang pengetahuan baru yang diperoleh dari informasi itu dikenal sebagai Statistika inferensial.

B. Data, Proses Pengukuran, dan Skala

Data yang dikumpulkan dapat bersifat kualitatif atau kuantitatif. Data kualitatif adalah fakta yang dinyatakan dalam bentuk sifat (bukan angka). Misalnya profesi sebagai guru, pedagang dan sebagainya. Sedangkan data kuantitatif adalah fakta yang dinyatakan dalam bentuk angka. Seperti data tentang besarnya penghasilan, tinggi badan, hasil ujian, dan lain-lain. Metode Statistika khususnya bekerja dengan data kuantitatif, atau data kualitatif yang sudah dikuantitatifkan dengan berbagai cara, antara lain dengan cara memberi skor, ranking, variabel boneka ( dummy variabel).
Selanjutnya akan kita pelajari bagaimana data diperoleh. Pertama-tama kita kenali adanya pengertian yang dapat diukur secara langsung dan pengertian yang tidak dapat diukur secara langsung. Untuk pengertian yang tidak dapat diukur secara langsung, harus dibuat secara operasional dapat diukur. Operasionalisasi ini berarti harus diusahakan untuk memecah atau menguraikan pengertian itu dalam sejumlah dimensi yang dapat diukur. Misalnya operasionalisasi ‘status sosial ekonomi’ menjadi dimensi pendapatan dan dimensi status pekerjaan. Operasionalisasi ‘intelegensia’ menjadi tes intelegensia yang terdiri dari beberapa soal, yang setiap soalnya merupakan satu dimensi.
Dalam proses operasionalisasi harus diperhatikan bahwa sifat hakekat pengertian itu tidak berubah. Misalnya dalam suatu tes intelegensia, hal yang diukur apakah memang sesuai dengan pengertian intelegensia yang diartikan dalam teori ? Dengan kata lain apakah validitas pengukuran cukup baik?
Jawaban atas pertanyaan: “Apakah puas dengan program televisi yang baru?”, dapat diukur sepanjang skala: sangat puas, cukup puas, tidak puas, sangat tidak puas. Jika kita hendak mengukur berat suatu benda, maka dapat dilakukan dengan timbangan yang mempunyai skala gram. Dua contoh skala di atas, yaitu skala untuk mengukur tingkat kepuasan dan skala untuk mengukur berat, jelas merupakan skala yang berbeda. Ada beberapa skala yang biasa digunakan, yaitu:

1. Skala Nominal

Apabila bilangan atau lambang-lambang digunakan untuk mengklasifikasi obyek, atau orang, atau benda-benda lain, maka bilangan atau lambang-lambang itu membentuk skala nominal (klasifikasi). Sebagai contoh, suatu penelitian dilakukan di pedesaan. Untuk setiap keluarga di suatu desa, variabel ‘jenis pekerjaan’ diamati. Diteliti apakah keluarga itu keluarga petani atau bukan. Digunakan dua kelompok untuk membagi keluarga di desa itu, yaitu ‘tani’ dan ‘lain’ untuk keluarga bukan petani.
Setiap keluarga akan termasuk dalam salah satu dari dua himpunan tersebut. Skala yang dipakai dalam pengamatan ini mempunyai dua titik skala: ‘tani’ dan ‘lain’. Skala semacam ini juga dipakai untuk mengukur variabel ‘agama’. Titik dari skala ini dinamakan kelas atau kategori.

2. Skala Ordinal atau Ranking

Pengukuran yang dilakukan dalam skala ordinal adalah obyek dibedakan menurut persamaannya dan menurut urutannya. Sebagai contoh, seorang yang berprofesi sebagai anggota TNI, dapat diklasifikasikan menurut pangkatnya: mayor, kapten, letnan dan sebagainya. Dalam setiap titik skala terdapat urutan tertentu. Contoh lain adalah status sosial ekonomi keluarga. Ada keluarga yang mempunyai status sosial ekonomi tinggi, sedang atau rendah.

3. Skala Interval

Dalam skala ordinal masalah perbedaan jarak atau interval antara dua titik skala tidak diperhatikan. Dalam skala interval, jarak antara dua titik skala sudah diketahui. Pengukuran dalam skala ini dianggap lebih kuat daripada skala ordinal. Sebab pengukurannya dicapai kecuali dengan persamaannya dan urutannya, juga dengan mengetahui jarak (interval) antara dua kelas yang berbeda. Sebagai contoh skala dalam tanggal kalender.Kejadian-kejadian dalam sejarah dapat ditempatkan menurut waktu kejadiannya. Dalam skala seperti ini dapat ditentukan apakah dua kejadian terjadi pada tahun yang sama (persamaan) atau apakah kejadian yang satu mendahului yang lain (urutan) dan juga dapat ditentukan berapa jauh jarak yang memisahkan dua kejadian itu.

4. Skala Rasio

Jika suatu skala kecuali mempunyai sifat skala interval juga masih mempunyai sifat lain, yaitu titik nolnya tertentu, maka skala seperti itu dinamakan skala rasio. Contohnya adalah skala untuk mengukur berat, panjang, isi, dan sebagainya. Skala-skala ini mempunyai titik nol yang berarti (tidak sembarang). Dalam skala rasio dapat dikatakan misalnya ‘berat benda A dua kali berat benda B’.

C. Lambang Himpunan Data, Notasinya, dan Operasinya

Untuk menunjukkan urutan angka-angka yang diperoleh dari suatu eksperimen atau survai, tanpa menuliskan angka itu sendiri, seringkali dituliskan angka pertama sebagai x1 , angka kedua x2 , dan seterusnya.

Contoh:

1. Jumlah absen siswa di suatu sekolah pada minggu kedua bulan Januari adalah sebagai berikut:

Hari Senin Selasa Rabu Kamis Jumat Sabtu
Absen 4 5 3 6 2 7

Jika x menunjukkan jumlah absen dan subskripnya menunjukkan hari dalam minggu itu, maka dapat ditulis x1 = 4 ; x2 = 5 ; x3 = 3 ; x4 = 6 ; x5 = 2 dan x6 = 7.

2. Sebuah mata uang logam dilempar lima kali, dan

1 jika lemparan ke i menghasilkan muka
x =
0 jika lemparan ke i menghasilkan belakang

di mana i = 1, 2, 3, 4, 5. Misalnya harga-harga yang diperoleh adalah x1 = 1 ; x2 = 1 ; x3 = 0 ; x4 = 0 ; x5 = 1. Jadi pada pelemparan pertama diperoleh muka, pelemparan kedua muka, ketiga belakang, keempat belakang, dan kelima diperoleh muka.

Jika ada dua variabel yang dipelajari, misalnya hasil pengukuran berat x dan tinggi y beberapa orang, dapat dituliskan hasilnya (x1 , y1) berat dan tinggi untuk orang pertama, (x2 , y2) berat dan tinggi untuk orang kedua, dan seterusnya .
Seringkali kita ingin menjumlah sekumpulan angka. Jika angka-angka itu ditulis sebagai x1, x2, x3, … xn, maka jumlahnya ditulis dengan simbol,

= x1 + x2 + x3 + …+ xn

yang disebut notasi penjumlahan. Notasi penjumlahan (  ) mematuhi beberapa aturan sebagai berikut:

Aturan 1

Jika xi = k, suatu harga konstan, maka

= = k + k + k + ……+ k = nk

Aturan 2

Jika suatu konstan maka

= kx1 + kx2 + .. + kxn = k

Aturan 3

= (x1 + y1) + (x2 + y2) + …… + (xn + yn)
= +

Penggunaan notasi penjumlahan seringkali diperluas menjadi penjumlahan rangkap. Misalnya kita punyai mn kuantitas xij , di mana i = 1, 2, 3, …., m dan j = 1, 2, 3, …. , n. Susunan kuantitas-kuantitas tersebut dalam urutan persegi adalah sebagai berikut :

x11 x12 x13 ……x1n
x21 x22 x23…… x2n
. . . .
. . . .
xm1 xm2 xm3…. xmn

Terlihat adanya m baris dan n kolom. Apabila akan menjumlahkan semua kuantitas, dapat dilaksanakan dengan dua cara,yakni yang pertama, menjumlahkan masing-masing kolom, kemudian jumlah kolom-kolom ini ditambahkan untuk memperoleh hasil yang diinginkan. Cara kedua adalah masing-masing baris dijumlahkan, selanjutnya jumlahjumlah baris ini ditambahkan untuk memperoleh hasil yang diharapkan.
Salah satu cara dapat dituliskan sebagai :

dengan cara paling singkat:
( )

Karena hasil penjumlahan dangan kedua cara itu harus sama, maka
( ) = )

Karena dalam penjumlahan rangkap yang terhingga, urutan penjumlahan itu tidak penting, maka penjumlahan rangkap dapat ditulis tanpa tanda kurung.

BAB II
STUDI DESKRIPTIF DATA STATISTIK

A. Distribusi Frekuensi

Untuk dapat menganalisis data angka, terlebih dahulu data perlu disusun secara sistematis. Data itu dapat disusun menurut beberapa cara. Susunan-susunan data semacam ini biasanya disebut distribusi atau deret (runtun), yaitu :

Apabila data disusun menurut: Hasilnya dinamakan:

a) Besarnya (kuantitasnya) a) Distribusi frekuensi kuantitatif
b) Kategorinya (kualitasnya) b) Distribusi frekuensi kualitatif
c) Waktu terjadinya c) Runtun waktu (time series)
d) Tempat geografisnya d) Distribusi spasial

Jika data yang kita miliki terdiri dari observasi yang banyak, maka akan lebih mudah jika data tersebut diringkas menjadi distribusi frekuensi atau tabel frekuensi.
Suatu distribusi frekuensi kuantitatif dapat disusun dengan cara sebagai berikut:
Dengan menggunakan rentang data itu sebagai petunjuk. Data dikelompokkan dalam beberapa kelas, yang dinamakan interval kelas. Banyak dan lebar interal kelas tergantung pada banyak dan besar harga-harga yang disusun dalam distribusi itu. Jangan menggunakan terlalu sedikit atau terlalu banyak interval kelas, yang paling efisien antara 5 sampai 15 interval kelas. Sedang lebar interval kelas ditentukan dengan membagi rentang himpunan data itu dengan banyak interval kelas yang akan digunakan.
Syarat lain untuk menentukan interval kelas adalah:
1) Interval kelas harus tidak tumpang asuh (overlap) satu dengan yang lain. Agar satu observasi tidak masuk ke lebih dari satu interval kelas.
2) Antara satu interval dengan interval berikutnya jangan ada celah yang terlalu lebar, sehingga menyebabkan adanya data yang mungkin terletak dalam celah tersebut.
3) Interval yang digunakan sebaiknya mempunyai lebar yang sama.

1. Menyusun Suatu Distribusi Frekuensi

a) Carilah harga maksimum dan minimum himpunan data itu.
b) Pilihlah sejumlah interval atau kelas sebaiknya dengan lebar yang sama dan tidak tumpang asuh dengan yang lain.
c) Hitunglah banyak observasi dalam himpunan data itu yang termasuk dalam tiap-tiap kelas interval.
d) Frekuensi relatif untuk tiap kelas dapat dihitung dengan membagi frekuensi kelas dengan jumlah seluruh observasi dalam himpunan data itu.

Contoh

Angka-angka di bawah ini menunjukkan penghasilan bulanan 84 keluarga yang tinggal di daerah A (dikalikan 10.000 rupiah)

67 52 72 42 21 55 47 66 54 37 37 34 59 51 22 37 66 49 69 42 54
44 56 48 44 69 56 27 34 47 59 20 51 42 78 59 58 75 61 66 99 97
35 61 44 51 52 77 82 57 63 73 49 67 33 78 51 61 26 73 33 71 64
48 47 41 62 72 85 25 72 54 52 108 28 93 37 57 55 56 47 87 68 97
Dari kumpulan data di atas terlihat bahwa data terbesar adalah 108 dan terkecil adalah 20. Maka jika digunakan 9 interval kelas, lebar intervalnya adalah (108 – 20) : 9 hasilnya adalah 9,8 (dibulatkan menjadi 10). Berikut adalah susunan himpunan data di atas dalam distribusi frekuensi.

Penghasilan (dikalikan 10 ribu) Banyak keluarga

19,5 – 29,5 7
29,5 – 39,5 9
39,5 – 49,5 16
49,5 – 59,5 21
59,5 – 69,5 14
69,5 – 79,5 9
79,5 – 89,5 4
89,5 – 99,5 3
99,5 – 109,9 1

Jumlah 84

Tabel 1. Distribusi frekuensi Penghasilan 84 keluarga di daerah A

Kadangkala yang ingin diketahui tidak hanya berapa banyak keluarga yang berpenghasilan di antara dua harga tertentu, melainkan juga ingin diketahui berapa banyak keluarga yang berpenghasilan kurang dari atau lebih dari harga tertentu. Jika demikian, distribusi frekuensi di atas dapat diubah ke dalam bentuk distribusi frekuensi kumulatif.

Penghasilan (dikalikan 10 ribu) Banyak keluarga

Kurang dari 19,5 0
Kurang dari 29,5 7
Kurang dari 39,5 16
Kurang dari 49,5 32
Kurang dari 59,5 53
Kurang dari 69,5 67
Kurang dari 79,5 76
Kurang dari 89,5 80
Kurang dari 99,5 83
Kurang dari 109,5 84

Tabel 2. Distribusi frekuensi Kumulatif “kurang dari”
Penghasilan 84 keluarga di daerah A

Untuk menyusun distribusi frekuensi kumulatif lebih dari analog dengan menyusun distribusi frekuensi kumulatif kurang dari.

Penghasilan (dikalikan 10 ribu) Banyak keluarga

Lebih dari 19,5 84
Lebih dari 29,5 77
Lebih dari 39,5 68
Lebih dari 49,5 52
Lebih dari 59,5 31
Lebih dari 69,5 17
Lebih dari 79,5 8
Lebih dari 89,5 4
Lebih dari 99,5 1
Lebih dari 109,5 0

Tabel 3. Distribusi frekuensi Kumulatif “lebih dari”
Penghasilan 84 keluarga di daerah A

Kita juga dapat mengubah distribusi frekuansi pada tabel 1 menjadi distribusi frekuensi relatif, sebagai berikut:

Penghasilan (dikalikan 10 ribu) Banyak keluarga (dalam %)

19,5 – 29,5 8,3
29,5 – 39,5 10,7
39,5 – 49,5 19,0
49,5 – 59,5 25.0
59,5 – 69,5 16,7
69,5 – 79,5 10,7
79,5 – 89,5 4,8
89,5 – 99,5 3,6
99,5 – 109,9 1,2

Jumlah 100

Tabel 4. Distribusi Frekuensi Relatif Penghasilan 84 keluarga di daerah A

2. Menggambar Grafik Distribusi Frekuensi

Untuk menggambar grafik distribusi frekuensi digunakan sumbu silang, yakni sumbu datar (X) dan sumbu tegak (Y). Interval kelas distribusi itu diletakkan di sumbu datar, dan frekuensinya pada sumbu tegak. Selanjutnya dengan alas tiap-tiap interval dibuat persegipanjang-persegipanjang dengan tinggi sama dengan frekuensi masing-masing interval itu. Maka diperoleh grafik yang dinamakan grafik histogram.
Dari distribusi frekuensi relatif, dapat digambarkan histogram frekuensi relatif dengan cara; interval-interval kelas diletakkan di sumbu X dan dengan alas tiap-tiap interval ini dibuat persegipanjag-persegipanjang yang luasnya sama dengan frekuensi relatif masing-masing interval itu. Jadi ;

Tinggi persegipanjang = (Frekuensi relatif interval kelas) / (lebar interval kelas)

Maka luas persegipanjang sama dengan proporsi observasi yang ada dalam interval kelas yang bersangkutan. Sehingga jumlah luas keseluruhan persegipanjang dalam suatu histogram sama dengan 1.
Distribusi frekuensi dapat juga digambarkan dengan grafik yang dinamakan grafik frekuensi poligon. Cara menggambar grafik ini adalah sebagai berikut: Interval distribusi frekuensi itu diletakkan pada sumbu X dan frekuensinya pada sumbu Y seperti pada waktu menggambar grafik histogram. Selanjutnya ditentukan titik tengah setiap interval, dan dari titik tengah-titik tengah ini diukurkan ke atas sejauh frekuensi masing-masing, maka diperoleh titik-titik di atas interval-interval itu. Apabila titik-titik ini, yang saing berdekatan dihubungkan dengan garis lurus, maka diperoleh grafik yang diinginkan.
Jika cara yang dilakukan dalam menggambar grafik frekuensi poligon di atas digunakan untuk menggambar distribusi frekuensi kumulatif, maka akan diperoleh grafik yang dinamakan ogive.

B. Harga-harga Tengah

Harga tengah sekumpulan data (distribusi) adalah harga yang dipandang dapat menggambarkan distribusi itu, khususnya dalam hal letaknya.

1. Rata – rata

Harga rata-rata atau mean didefinisikan sebagai jumlah semua data yang ada dibagi dengan banyak data itu. Misalnya kita memiliki n angka-angka x1, x2, …, xn. Maka Harga rata-rata angka-angka ini, diberi lambang adalah :

= =

Untuk data dalam distribusi frekuensi, maka xi diwakili oleh nilai tengah interval. Dan rumusnya menjadi :

= = , dengan k menunjukkan banyaknya inteval atau kelompok.

Contoh

Untuk data dalam distribusi frekuensi (tabel 1) yang dibahas dalam sub bab sebelumnya, dapat dihitung nilai meannya sebagai berikut:

Penghasilan (dikalikan 10 ribu) Banyak keluarga (fi) Titik tengah interval (xi) fixi

19,5 – 29,5 7 24,5 171,5
29,5 – 39,5 9 34,5 310,5
39,5 – 49,5 16 44,5 712,0
49,5 – 59,5 21 54,5 1145,5
59,5 – 69,5 14 64,5 903,0
69,5 – 79,5 9 74,5 670,5
79,5 – 89,5 4 84,5 338,0
89,5 – 99,5 3 94,4 283,5
99,5 – 109,9 1 104,5 104,5

Jumlah 84 4638,0

Tabel 5. Mencari nilai mean penghasilan bulanan 84 keluarga di daerah A

Nilai meannya adalah = 55,21 x 10.000 = 552.100 rupiah.

2. Median

Median dari sekumpulan angka adalah harga yang di tengah apabila angka-angka itu disusun menurut besarnya. Median dapat ditemukan dengan cara:
a) Menyusun data itu menurut besarnya, dari kecil ke besar atau dari besar ke kecil.
b) Kita periksa harga yang di tengah-tengah urutan tadi, dan harga itu adalah mediannya. Jika banyak data genap, maka tidak ada data yang di tengah-tengah urutan, di sini diambil dua harga yang di tengah dan selanjutnya dihitung rata-rata dua harga yang di tengah ini. Dengan demikian diperoleh harga median.
Untuk data yang tersusun dalam distribusi frekuensi, mediannya dapat dihitung dengan rumus:

Median = Lmd + . c
Di mana Lmd = batas bawah interval median
n = banyak data
F = jumlah frekuensi interval-interval sebelum interval median
fmd = frekuensi interval median
C = lebar interval

3. Kuartil

Jika median adalah harga yang membagi distribusi angka menjadi dua bagian yang sama, maka kuartil adalah harga yang membagi distribusi angka menjadi empat bagian yang sama. Sehingga terdapat tiga harga kuartil, yaitu kuartil I, II, dan III. Kuartil berimpit dengan median. Harga-harga kuartil I dan III dapat dihitung dengan cara yang serupa dengan menghitung median.
Untuk data yang asli (tidak dikelompokkan) nilai kuartil dapat ditentukan dengan cara:
a) Mengurutkan data dari data terkecil sampai data terbesar
b) Menentukan letak nilai kuartil dengan rumus:
Letak Ki = data ke [ i (n+1) / 4]
Di mana K = nilai kuartil
i = 1, 2, 3

Contoh

Dimiliki data yang sudah terurut sebagai berikut :
52, 56, 57, 60, 64, 66, 70, 75, 82, 86, 92, 94
akan dicari nilai kuartil 1 dan 3.

Letak K1 = data ke [1(12 + 1) / 4]
= data ke 13/4 = data ke 3

Nilai K1 = data ke-3 + ( data ke-4 – data ke-3 )
= 57 + ( 60 – 57 ) = 57

Letak K3 = data ke [3(12 + 1) / 4]
= data ke 39/4 = data ke 9

nilai K3 = data ke-9 + ( data ke-10 – data ke-9 )
= 82 + ( 86 – 82 ) = 85

Untuk data dalam distribusi frekuensi (data yang dikelompokkan) digunakan rumus:

K1 = LK1 + . C

K3 = LK3 + . C

Sebagai contoh, akan dihitung nilai kuartil 1 dan 3 dari distribusi frekuensi dalam tabel 1.
K1 = 39,5 + . 10 = 39,5 + 3,125 = 42,625

K3 = 59,5 + . 10 = 59,5 + 7,14 = 66,64

d. Modus

Modus adalah harga yang paling sering muncul atau harga yang mempunyai frekuensi paling tinggi.
Untuk data asli (tidak dikelompokkan) nilai modus dapat dengan mudah dicari yaitu dengan melihat data mana yang paling sering muncul.
Untuk data dalam distribusi frekuensi (dikelompokkan) nilai modus dapat dicari dengan menggunakan rumus:

Modus = Lmo + . C

Di mana: Lmo = batas bawah interval modus
a = beda frekuensi antara interval modus dengan interval sebelumnya
b = beda frekuensi antara interval modus dengan interval sesudahnya
C = lebar interval
Jika rumus ini diterapkan untuk mencari nilai modus dari data dalam distribusi frekuensi pada tabel 1 maka diperoleh:

Modus = 49,5 + . 10 = 52,67

C. Harga-Harga Deviasi

1. Rentang

Rentang adalah harga deviasi yang paling sederhana, yaitu perbedaan antara harga yang tertinggi dan yang terendah dari sekumpulan angka. Rentang memberikan gambaran seberapa jauh data itu memencar, tetapi tidak menunjukkan tentang variasi datanya.

2. Deviasi rata-rata

Deviasi rata-rata adalah harga rata-rata penyimpangan tiap data terhadap meannya. Makin kecil harga deviasi ini berarti makin kecil dispersi (pemencaran) data terhadap harga meannya. Misalkan dimiliki angka-angka x1, x2, …, xn dengan rata-rata (mean) , maka deviasi rata-ratanya adalah :

dr =
Sebagai contoh akan dihitung deviasi rata-rata harga-harga beras seperti dalam tabel berikut:
Harga beras xi ( dikali 10 rupiah) Rata-rata
(xi – )

340 -20 20
525 165 165
450 360 90 90
210 -150 150
275 -85 85
Jumlah 0 510

Tabel 6. Mencari deviasi rata-rata harga lima kualitas beras per kg

Jadi deviasi rata-rata: = 102 (dikali 10 rupiah) = Rp 1.020,-
Untuk data yang tersusun dalam distribusi frekuensi, deviasi rata-rata dapat dihitung dengan menganggap bahwa besar tiap data sama dengan titik interval kelas yang bersangkutan (seperti pada saat menghitung nilai mean). Sebagai contoh akan dihitung deviasi rata-rata distribusi frekuensi tabel 1.

Titik tengah interval (xi) Banyak keluarga (fi)

fi

24,5 7 30,71 214,97
34,5 9 20,71 186,39
44,5 16 10,71 171,36
54,5 21 55,21 0,71 14,91
64,5 14 9,29 130,06
74,5 9 19,29 173,61
84,5 4 29,29 117,16
94,4 3 39,29 117,87
104,5 1 49,29 49,29

84 1175,62

Tabel 7. Mencari nilai deviasi rata-rata penghasilan bulanan 84 keluarga di daerah A

Jadi deviasi rata-rata : dr = = 13,995

Jika dituliskan dalam lambang maka

dr = , dengan n =

3. Variansi dan Deviasi Standar

Variansi (biasa diberi simbol s2) adalah harga deviasi yang juga memperhitungkan deviasi tiap data terhadap meannya. Harga ini didefinisikan sebagai: jumlah keadrat deviasi tiap data terhadap mean dibagi (n – 1), di mana n adalah banyak data.
Deviasi standar dengan simbol s didefinisikan sebagai akar positif variansi.
Jika dipunyai angka: x1, x2, … , xn dengan mean maka variansi:

s2 = dan deviasi standar s =

Sebagai contoh akan dihitung harga variansi dan deviasi standar harga-harga beras seperti dalam tabel 6 di atas.

Harga beras xi ( dikali 10 rupiah) Rata-rata
(xi – )
2

340 -20 400
525 165 27225
450 360 90 8100
210 -150 22500
275 -85 7225
Jumlah 0 65450
Tabel 8. Mencari variansi dan dev. Standar untuk harga lima kualitas beras

Jadi variansi s2 = = 16362,5 (dikali 10 rupiah)
Deviasi standar : s = = 127,916 (dikali 10 rupiah) = 1279,16 rupiah

Menghitung variansi dengan rumus definisi di atas akan menjadi tidak praktis apabila mean berbentuk pecahan desimal dengan beberapa angka di belakang koma. Karena deviasi kuadratnya akan terdiri dari banyak angka. Untuk menghindari hal ini, dapat digunakan rumus yang dapat diturunkan dari rumus definisi dengan mengingat sifat-sifat notasi sigma (  ). Yaitu :

( xi – x ) 2 = ( xi2 – 2xix +x 2 )

= xi 2 – 2 xi x + nx 2

= xi 2 – 2 nx .x + nx 2
= xi 2 – nx 2 = xi 2 – ( xi ) 2 / n

Maka: Variansi

s2 = xi 2 –

deviasi standar s =

Untuk data yang tersusun dalam distribusi frekuensi, variansi dan deviasi standarnya dapat dihitung dengan anggapan bahwa besar tiap data sama dengan titik tengah interval kelas yang bersangkutan. Rumus yang digunakan adalah:

Variansi: s2 = fi ( xi – x ) 2
Deviasi standar : s =

di mana s2 = variansi
s = deviasi standar
fi = frekuensi interval ke-i
xi = titik tengah interval ke-i
x = mean
n = banyak data = fi
k = banyak interval

Rumus-rumus ini dapat juga diubah menjadi rumus-rumus baru yang tidak menggunakan mean, yaitu:

Variansi: s2 = fi xi 2 –

Deviasi standar : s =

Untuk mengetahui bagaimana menggunakan rumus ini, akan dihitung variansi dan deviasi standar distribusi frekuensi Tabel 1.

Titik tengah interval (xi) Banyak keluarga (fi) xi 2 fi xi fi xi

24,5 7 600,25 171,5 4201,75
34,5 9 1190,25 310,5 10712,25
44,5 16 1980,25 712,0 31684,00
54,5 21 2970,25 1144,5 62375,25
64,5 14 4160,25 903,0 58243,50
74,5 9 5550,25 670,5 49952,25
84,5 4 7140,25 338,0 28651,00
94,4 3 8930,25 283,5 26790,75
104,5 1 10920,25 104,5 10920,25

84 4638,0 283441,00

Tabel 9. Mencari variansi dan deviasi std penghasilan bulanan 84 keluarga di daerah A

Jadi variansi : s2 = ( 283441 – ) = 329,6041

Deviasi standar: s = = 18,155

4. Deviasi Kuartil

Karena makin memencar data dalam suatu distribusi, makin besar pula perbedaan antara harga-harga kuartil distribusi itu. Maka harga perbedaan ini dapat pula digunakan sebagai ukuran deviasi distribusi itu. Ukuran deviasi ini dinamakan deviasi kuartil yang didefinisikan sebagai:

dk =
dengan dk = deviasi kuartil
k3 = kuartil ketiga
k1 = kuartil pertama

5. Deviasi Relatif

Harga-harga deviasi yang dibicarakan di atas adalah harga-harga deviasi mutlak, yang satuannya sama dengan satuan data yang bersangkutan. Sehingga kalau kita ingin membandingkan deviasi dua kelompok data, kita tidak dapat menggunakan harga-harga deviasi tadi. Sebab, disamping kadang-kadang satuannya tidak sama, juga dalam membandingkan harga deviasi, harus diingat pula harga-harga tengah yang bersangkutan. Maka untuk ini digunakan harga deviasi dalam bentuk persentase, atau harga deviasi relatif, yaitu:

v = . 100 % dengan s = standar deviasi
x = mean
v = koefisien variansi

Harga-harga deviasi relatif bentuk lain adalah:

Vdr = (deviasi rata-rata / mean) . 100 %

BAB III
UNSUR-UNSUR PROBABILITAS

A. Ruang Sampel dan Peristiwa

Dasar logika dari proses pengambilan inferensi statistik tentang suatu populasi dengan analisis data sampel adalah probabilitas. Dari pandangan intuitif, probabilitas suatu peristiwa adalah harga angka yang menunjukkan seberapa besar kemungkinan bahwa peristiwa itu akan terjadi.
Konsep probabilitas berhubungan dengan eksperimen yang menghasilkan ‘hasil’ yang tak pasti. Artinya, eksperimen yang diulang-ulang dalam kondisi yang sama akan memberikan ‘hasil’ yang dapat berbeda-beda. Istilah eksperimen yang digunakan di sini tidak terbatas pada eksprimen di laboratorium. Melainkan eksperimen diartikan sebagai prosedur yang dijalankan pada kondisi tertentu, di mana kondisi itu dapat diulang-ulang sebanyak n kali pada kondisi yang sama, dan setelah selesai prosedur itu berbagai hasil dapat diamati (baik dicacah maupun diukur). Dengan kata lain, suatu eksperiem adalah proses pengumpulan data tentang fenomena tertentu yang menunjukkan adanya variasi di dalam hasilnya.
Beberapa definisi:
a. Himpunan yang elemen-elemennya merupakan hasil yang mungkin dalam suatu eksperimen dinamakan ruang sampel.
b. Elemen suatu ruang sampel dinamakan titik sampel.
c. Suatu peristiwa adalah himpunan bagian dari suatu ruang sampel.
d. Suatu peristiwa yang hanya memuat satu elemen saja dinamakan peristiwa sederhana. Suatu peristiwa bersusun merupakan gabungan dari peristiwa sederhana.
e. Jika suatu eksperimen telah dilakukan dan hasil yang diperoleh termasuk himpunan bagian A, maka dikatakan peristiwa A telah terjadi.
f. Ruang sampel yang mempunyai banyak elemen terhingga atau tak terhingga terhitung dinamakan ruang sampel diskrit. Jika ruang sampel memuat semua bilangan dalam satu interval dinamakan ruang sampel kontinu.

Ruang sampel ditulis dengan lambang S, peristiwa dengan huruf besar A, B, C, ….Jika suatu eksperimen menghasilkan n kemungkinan peristwa, maka ruang sampelnya disajikan dengan:
S = { a1, a2, . . . . . . an }
Di mana a1, a2, . . . . . . an menunjukkan semua hasil yang mungkin terjadi dari eksperimen itu. ‘Peristiwa’ disajikan dengan cara yang sama yaitu { a1, a2 } menunjukkan peristiwa yang hanya terdiri dari hasil a1dan a2.

Contoh

1. Eksperimen : Pelemparan sebuah dadu
Hasil : Mata dadu yang tampak di atas
Ruang sampel : S = { 1, 2, 3, 4, 5, 6 }
Suatu peristiwa : A = titik ganjil yang tampak = { 1, 3, 5 }

2. Eksperimen : Pemilihan secara random seorang mahasiswa dan pencatatan Indeks prestasinya
Hasil : Bilangan x antara 0 dan 4
Ruang sampel : S = { 0  x ≤ 4 }
Suatu peristiwa : A = Indeks prestasi di atas 3 = { 3 < x  4 }
Beberapa peristiwa

Semua peristiwa yang kita pandang, dianggap merupakan himpunan bagian dari ruang sampel suatu eksperimen. Dalam hal ini termasuk seluruh ruang sampelnya S dan himpunan kosong , yaitu himpunan yan tidak mempunyai elemen. S dinamakan peristiwa yang pasti karena selalu terjadi, sedangkan  peristiwa yang tidak mungkin, karena tidak pernah terjadi.
‘Peristiwa-peristiwa baru’ dapat dibentuk dari peristiwa-peristwa yang sudah ada dengan menggunakan tiga operasi dasar, yaitu union, interseksi, dan komplementasi, yang timbul dari penggunaan kata-kata ‘atau’, ‘dan’, ‘tidak’.

Beberapa definisi

a. Union dua peristiwa A dan B, ditulis A  B, adalah himpunan semua elemen yang ada di dalam A atau di dalam B ( termasuk yang ada di dalam keduanya jika ada ).
b. Interaksi dua peristiwa A dan B, ditulis A  B, adalah himpunan semua elemen yang ada di dalam A dan sekaligus di dalam B.
c. Komplemen suatu peristiwa A, ditulis Ac , adalah himpunan semua elemen yang tidak di dalam A (relatif terhadap S).

B. Probabilitas Suatu Peristiwa

Kasus Peristiwa Peristiwa Berkemungkinan Sama

Definisi

Dianggap bahwa suatu ruang sampel S mempunyai elemen yang banyaknya terhingga, dan tiap-tiap elemen berkemungkinan sama akan terjadinya. Misalkan A suatu peristiwa (yaitu himpunan bagian dari S). Probabilitas P bahwa peristiwa A akan terjadi, jika eksperimen dilakukan, didefinisikan sebagai:
P (A) = (III.1)
Di mana N (. . .) menunjukkan banyak elemen dalam peristiwa (. . .)

Contoh

Jika A adalah peristiwa ‘ banyak titik ganjil ‘ dalam suatu pelemparan dadu, maka N (A) = 3 dan N (S) = 6. Sehingga P (A) = 3/6 = ½.

Kita akan menganalisis konsep probabilitas dengan menganggap bahwa ruang sampel S suatu eksperimen memuat terhingga banyak hasil-hasil yang mungkin dari eksperimen itu dan semuanya berkemungkinan sama akan terjadinya. Kemudian untuk suatu peristiwa A, kita gunakan definisi probabilitas seperti tersebut di atas (III.1). Dengan dasar ini akan disajikan beberapa sifat probabilitas yang sangat penting, tanpa mengingat macam eksperimennya.
Untuk setiap peristiwa A berlaku:
0 ≤ P (A) ≤ 1 (III.2)

karena Ø < N (A) < N (S), dan definisi (III.1).
Selanjutnya,
P (0) = Ø dan P (S) = 1 (III.3)

Konsep intuitif harga angka untuk probabilitas suatu peristiwa adalah perbandingan antara berapa kali peristiwa itu diharapkan akan terjadi jika eksperimen diulang-ulang dalam kondisi yang sama, dengan banyak kali eksperimen itu diulang. Lambang P (A) digunakan untuk menunjukkan probabilitas peristiwa A akan terjadi.
Jika suatu ruang sampel mempunyai n (S) elemen yang berkemungkinan sama akan terjadinya, dan peristiwa A mempunyai n (A) elemen, maka probabilitas bahwa A akan terjadi adalah
P (A) =

Suatu ruang sampel yang memiliki sifat bahwa elemen-elemennya berkemungkinan sama dikatakan mempunyai model probabilitas uniform.

Definisi

Dua peristiwa A dan B yang tidak mempunyai elemen berserikat, yaitu A  B = Ø, dinamakan saling asing ( ‘mutually exclusive’ atau ‘disjoint’ ).

Untuk setiap dua peristiwa A dan B yang saling asing berlaku :
P ( A  B ) = P (A) + P (B) (III.4)

Untuk melihat kebenaran rumus (III.4) di atas, dipandang keadaan berikut. Untuk dua peristiwa A dan B yang saling asing ataupun tidak, berlaku:

N ( A  B ) = N (A) + N (B) – N (A  B) (III.5)

Karena dalam jumlah [N(A) + N(B)] elemen dalam interaksi (A  B) terhitung dua kali. Dengan membagi ruas kiri dan ruas kanan dari (III.5) dengan N (S), dan menggunakan definisi (III.1) diperolrh:

P ( A  B ) = P (A) + P (B) – P (A  B) (III.6)

Karena untuk peristiwa A dan B yang saling asing A  B = Ø, maka P (A  B) = 0, dan rumus (III.4) berlaku.

Tiga peristiwa atau lebih A, B, C, . . .dikatakan saling asing jika peristiwa-peristiwa itu tidak mempunyai elemen-elemen berserikat. Untuk A, B, C yang saling asing berlaku :

P (A  B  C) = P(A) + P(B) +P(C) (III.7)

Untuk setiap peristiwa A berlaku:

P(Ac) = 1 – P(A) (III.8)
Karena
Ac  A = S,
Maka
N (Ac  A) = N (S)
Dan
P(S) = 1 = P (Ac  A) = P(Ac) + P(A)
Jadi:
P(Ac) = 1 – P(A)

Untuk setiap dua peristiwa A dan B berlaku:

P(B) = P(B  A) + P (B  Ac) (III.9)
Karena B = [(B  A)  (B  Ac)] dan kedua peristiwa dalam tanda kurung adalah saling asing.

Contoh

Sebuah kartu diambil secara random dari satu set kartu bridge. Dipandang peristiwa-peristiwa berikut:
A = terambil kartu hati
B = terambil kartu berlian
C = terambil kartu as.
Hitung probabilitas :
a. Terambil kartu hati atau berlian
b. Terambil kartu hati atau as
Jawab

a. P(A) = ; P(B) = ; P(C) =
Karena peristiwa-peristiwa A dan B saling asing, maka:
P (A  B) = P(A) + P(B) = + =

b. P (A  C) = P(A) + P(C) – P(A  B) = + – =

Definisi Umum Probabilitas

Definisi probabilitas klasik, [rumus (III.1)] hanya dapat digunakan untuk eksperimen dengan hasil yang banyak elemennya terhingga dan berkemungkinan sama. Jadi dalam satu pelemparan sebuah dadu, P (titik genap) = 3/6 = ½, karena dalam ruang sampelnya terdapat enam hasil berkemungkinan sama, di mana tiga di antaranya bertitik genap dan dalam pelemparan berulang-ulang frekuensi relatif dari titik genap yang tampak haruslah dekat dengan ½. Tetapi untuk dadu yang menceng, frekuensi relatif jangka panjang dari titik genap dapat berbeda cukup besar dari ½. Demikian juga akan mengalami hal yang sama untuk frekuensi relatif jangka panjang dari ‘muka’ dalam pelemparan sebuah mata uang logam yang tidak simetris.
Untuk membicarakan kasus seperti ini, andaikan ruang sampel S suatu eksperimen terdiri dari N elemen [ a1, a2, . . ., an ], tetapi intuisi dan pengalaman menunjukkan bahwa bahwa elemen-elemen itu tidak dapat dipandang sebagai berkemungkinan sama. Misalkan, dalam n trial dengan kondisi yang sama kita dapatkan:

Hasil a1 terjadi m1 kali
Hasil a2 terjadi m2 kali
.
.
.
Hasil aN terjadi mN kali

Dengan m1 + m2 + . . .+ mN = n. Frekuensi relatif dari ai dalam n trial, yaitu fi = mi / n dapat diambil sebagai estimasi empiris dari probabilitas bahwa ai akan terjadi dalam tak terhingga kali trial. (Tentu saja estimasi ini akan berubah jika banyak tria bertambah besar). Jumlah angka-angka f1 , . . . , fN sama dengan 1.

Definisi

Misalkan ruang sampel S suatu eksperimen terdiri dari N elemen [ a1, a2, . . ., an ], dan misalkan pula bahwa p1 , p2 , . . . , pN adalah bilangan-bilangan tidak negatif yang jumlahnya sama dengan satu, ( pi mungkin merupakan frekuensi relatif jangka panjang di mana suatu peristiwa ai akan terjadi). Untuk suatu peristiwa A (himpunan bagian dari S) probabilitasnya didefinisikan sebagai :

P(A) = jumlah semua pi yang berkaitan dengan hasil ai yang termasuk dalam A

Jika pi = 1/N untuk i = 1, 2, . . ., N, ini menjadi sama dengan definisi probabilitas untuk hasil-hasil yang berkemungkinan sama ( rumus III.1).

Contoh

Sebuah dadu telah dibuat sedemikian rupa sehingga dalam jangka panjang sisi-sisi dadu itu akan tampak di atas dalam frekuensi relatif sebagai berikut:

Sisi dengan titik 1 2 3 4 5 6
Frekuensi relatif 0,13 0,18 0,18 0,16 0,15 0,20

Ruang sampel untul pelemparan dadu itu satu kali terdiri dari elemen-elemen {1, 2, 3, 4, 5, 6}. Maka kejadian A = titik genap, mempunyai probabilitas:
P (A) = 0,18 + 0,16 + 0,20 = 0,54

Analisis Kombinatorik dalam Probabilitas

Aturan 1

Jika suatu eksperimen terdiri dari dua bagian sedemikian hingga bagian pertama menghasilkan k hasil yang berbeda, dan jika dengan tiap hasil itu dapat dihasilkan m hasil yang berbeda pada bagian kedua, maka banyak hasil yang mungkin seluruhnya adalah km. (aturan ini dapat diperluas untuk eksperiman yang terdiri dari lebih dari dua bagian.

Aturan 2

Banyak susunan atau urutan yang berbeda yang dapat dibentuk dari k obyek yang diambil dari sekumpulan n obyek yang berbeda dinamakan banyak permutasi k obyek dari n obyek, dihitung dengan rumus:

nPk =

Aturan 3

Banyak kombinasi dari n obyaek yang berbeda yang diambil k obyek setiap kali adalah:

=

Contoh dalam probabilitas

Sebuah kotak berisi 12 bola, di mana 8 di antaranya merah (ditandai M1, M2. . . . , M8) dan sisanya biru (B1, B2, B3, B4). Tiga bola diambil sekaligus dari kotak itu.
a. Berapa banyak hasil yang berbeda yang mungkin?
b. Berapa banyak hasil yang mungkin, dengan syarat dua bola yang terambil biru dan yang satu merah?
c. Apabila pengambilan tiga bola itu diambil secara random, berapa probabilitas akan diperoleh dua bola biru dan satu merah?

Jawab

a. Banyak hasil yang mungkin dari pengambilan tiga bola (tak berurut) dari 12 bola adalah:
= = 220

b. = . = 6 x 8 = 48

c. Probabilitas memperoleh 2 bola biri dan 1 bola merah :

C. Probabilitas Bersyarat

Definisi

Misalkan A dan B dua peristiwa di mana P (B) > 0. Maka probabilitas bersyarat dari kejadian A, kalau diketahui B terjadi, adalah:

P ( A / B ) = (III.10)
Probabilitas bersyarat P(A/B) dapat sama atau tidak sama dengan probabilitas tak bersyarat P(A).

Contoh

Sebuah kartu dipilih secara random dari satu kartu bridge, dan ternyata terdapat kartu merah. Berapakah probabilitas bahwa :
a. Kartu itu As
b. Kartu itu hati

Jawab
Misalkan :
A : Peristiwa terambil kartu As
H : Peristiwa terambil kartu Hati
M : Peristiwa terambil kartu Merah

a. P ( A / M ) = = = = P ( A )

b. P ( H / M ) = = = ‘ yang tidak sama dengan P ( H )

Kejadian Dipenden dan Independen

Dengan rumus (III.10) dapat dihitung P ( A  B ). Jika A dan B dua peristiwa sembarang dalam ruang sampel S, maka probabilitas peristiwa (A dan B) dapat dihitung dengan salah satu rumus berikut:

P (A  B) = P(B) . P(A/B)
P(A) . P(B/A)

Jika A, B, dan C adalah tiga peristiwa sembarang dengan probabilitas positif, maka untuk menghitung P (A  B  C) dapat dilakukan langkah-langkah sebagai berikut:

P (A  B  C) = P [(A  B)  C] = P (A  B) . P (C / A  B)
= P(A) . P(B/A) . P(C / A  B)

Rumus di atas dapat degeneralisasikan untuk kejadian-kejadian lebih dari tiga.

Contoh

1. Sebuah kotak berisi lima bola putih dan delapan merah. Tiga bola berturut-turut diambil secara random tanpa pengembalian. Berapakah probabilitasnya bahwa bola pertama putih, kedua merah, dan ketiga putih?

Jawab:

Didefinisikan kejadian-kejadian A = bola pertama putih , B = Bola kedua merah
C = bola ketiga putih. Maka
P(A  B  C) = P(A) . P(B/A) . P(C / A  B)
= 5/13 x 8/12 x 4/11 = 160/1716

Untuk kedua kejadian A dan B, kadang-kadang dijumpai sifat P(A) = P (A / B), yaitu probabilitas tak bersyarat dari A sama dengan probilitas bersyarat dari A, kalau diketahui B telah terjadi. Dalam hal ini dikatakan bahwa A independen dengan B.

Definisi

Dua kejadian A dan B independen jika:
P (A  B) = P(A) . P(B) (III.11)

Jika rumus ini berlaku, maka P(A) = P(A / B) dan P(B) = P(B / A). Jika (III.11) tidak berlaku, maka A dan B dikatakan dependen, dan untuk ini
P(A)  P(A / B) dan P(B)  P(B / A).

Secara intuitif, dua peristiwa A dan B independen jika probabilitas akan terjadinya kejadian yang satu tidak dipengaruhi oleh terjadi atau tidaknya kejadian yang lain. Perbedaan antara independensi dan dependensi digambarkan dengan dua kasus, sampling dengan pengembalian dan sampling tanpa pengembalian.

Contoh

Kita mengambil satu kartu secara random dari satu set kartu bridge, kita kembalikan kartu itu, kita kocok kartunya, dan mengambil kartu yang kedua (sampel dengan pengmembalian). Misalkan A1 adalah kejadian ‘didapat as pada pengambilan yang pertama’, dan A2 ‘ didapat as pada pengambilan yang kedua’. Karena dalam ruang sampelnya terdapat 52 x 52 hasil yang berkemungkinan sama, dan 4 x 4 di antaranya termasuk termasuk dalam (A1  A2), maka

P (A1  A2) = = ( )( ) = = P(A1) . P(A2)

Teorema Bayes

Jika A dan B dua peristiwa sembarang dalam suatu ruang sampel S, maka dari definisi probabilitas bersyarat dapat ditulis :
P ( A / B ) = = (III.12)

Dengan P(B) dapat ditulis sebagai:
P(B) = P (B  A) + (B  Ac) = P(A) . P(B / A) + P(Ac) . P(B / Ac) (III.13)

Sehingga

P (A / B) = (III.14)

Rumus ini kadangkala berguna dalam aplikasi jika semua suku ruas kanan diketahui dan ruas kiri adalah kuantitas yang akan dihitung.

Contoh

Andaikan dari 1000 orang sarjana yang bekerja pada suatu instansi, 60 persen adalah laki-laki (A) dan 40 persen perempuan (Ac), dan B menunjukkan sifat ‘lulusan Universitas PQR’. Jika diketahui 55 persen sarjana laki-laki adalah lulusan Universitas PQR dan 35 persen sarjana perempuan adalah lulusan Universitas PQR maka berapa persen sarjana lulusan PQR yang bekerja di instansi itu adalah laki-laki?

Jawab

Diketahui :
P(A) = 0,6
P(Ac) = 0,4
P(B / A) = 0,55
P(B / Ac) = 0,35

Maka dari rumus (III.14):

P(B) = (0,6) (0,55) + (0,4) (0,35) = 0,47

P(A / B) = = 0,702
Jadi sekitar 70 persen sarjana lulusan Universitas PQR yang bekerja di instansi itu adalah laki-laki.

Suatu generalisasi dari (III.14) adalah :

P(Ai / B) = (III.15)

Untuk tiap-tiap i = 1, 2, 3, …, r

BAB IV
DISTRIBUSI VARIABEL RANDOM CACAH

A. Varibel Random dan Distribusi Probabilitas

a. Variabel Random

Dalam bab III telah dipelajari bahwa model probabilitas untuk sebuah eksperimen dispesifikasi oleh ruang sampelnya, dan probabilitas yang berkaitan dengan peristiwa sederhana (titik sampel) anggota ruang sampel itu. Periatiwa sederhana tidak selalu berbentuk (berharga) angka. Misalnya dalam pelemperan sebuah mata uang logam, ruang sampelnya adalah {M,B}, di mana titiksampelnya dinyatakan dengan nama sisi bukan angka. Meskipun titik sampel yang kita miliki kadang-kadang bersifat kualitatif, namun kita sering tertatarik untuk mempelajari aspek numerik suatu fenomena atau keadaan. Dalam contah ini informasi yang mungkin menarik adalah berapa banyak diperoleh M dalam pelemparan sebuah mata uang logam lima kali.
Untuk memusatkan perhatian kita pada ukuran kuantitatif, didefinisikan konsep variabel random sebagai berikut:
Suatu variabel random X adalah cara memberi harga angka kepada setiap elemen ruang sampel.

Contoh
1. Kita pandang eksperimen melemparkan mata uang logam tiga kali. Eksperimen itu menghasilkan ruang sampel sebagai berikut:

MMM MMB MBB BBB
S = MBM BMB
BMM BBM

Jika mata uang itu seimbang, maka delapan elemen ruang sampel itu berkemungkinan sama, masing-masing mempunyai probabilitas 1/8 akan terjadi. Misalkan variabel random X didefinisikan sebagai ‘banyak M dalam tiap elemen’ , maka variabel random ini menjalani harga 0, 1, 2, dan 3. Urutan huruf M dan B menunjukkan apakah lemparan pertama, kedua dan ketiga sisi ‘muka’ (M) atau sisi ‘belakang’ (B). Harga-harga variabel random X dapat ditulis :
X (MMM) = 3 ,
X(MMB) = X(MBM) = X(BMM) = 2,
X(MBB) = X(BMB) = X(BBM) = 1,
X(BBB) = 0.

2. Seorang mahasiswa dipilih secara random dari satu kelas yang terdiri dari 30 mahasiswa. Ruang sampelnya terdiri dari 30 mahasiswa, ditulis sebagai {a1, a2, . . . , a30}. Misalkan Y(a) adalah variabel random yang menunjukkan indeks prestasi mahasiswa a, maka jika mahasiswa a1 mempunyai indeks prestasi 3,16 dan mahasiswa a2 mempunyai indeks prestasi 2,43, maka Y(a1) = 3,16 dan Y(a2) = 2,43; dan seterusnya. Di sini Y adalah variabel-variabel yang menjalani semua bilangan nyata (real) dalam interval 0  Y  4.

Definisi

Suatu variabel random yang hanya dapat menjalani sebanyak terhingga harga-harga yang berbeda dinamakan variabel random diskrit (seperti pada contoh 1). Suatu variabel random yang dapat menjalani setiap harga dalam suatu interval dinamakan variabel random kontinu (seperti pada contoh 2).

b. Distribusi Probabilitas Variabel Random Diskrit

Definisi

Misalkan X suatu variabel random diskrit yang didefinisikan dalam ruang sampel S; harga-harga yang mungkin untuk X adalah b1, . . . , bk dengan probabilitas masing-masing
p1 = P {X = b1}, . . . , pk = P {X = bk}, yang jumlahnya sama dengan satu. Maka distribusi probabilitas X diberikan dalam tabel sebagai berikut.

Harga X b1 b2 . . . . bk
Probabilitas X p1 p2 . . . . pk

Dari ruang sampel S suatu eksperimen dengan probabilitas yang didefinisikan untuk semua hasil yang mungkin, kita bentuk distribusi probabilitas untuk suatu variabel random X yang didefinisikan dalam S; dengan melupakan semua detail dari hasil eksperimen itu, kecuali harga-harga bi yang dijalani oleh X beserta masing-masing probabilitasnya pi.

Dalam contoh pelemparan sebuah mata uang logam tiga kali di atas, distribusi probabilitas X = banyak muka yang muncul dalam tiap elemen sampel, adalah sebagai berikut:

Harga X 0 1 2 3
Probabilitas X 1/8 3/8 3/8 1/8

B. Harga Harapan, Variansi dan Sifat-sifatnya

a. Harga Harapan

Dalam bab II telah dibahas tentang hinpunan data, membuat distribusi frekuensi, menggambar grafik dan menghitung mean serta variansi himpunan data (distribusi frekuensi) itu. Karena distribusi probabilitas adalah model teoritis, di mana porbabilitas dipandng sebagai frekuensi relatif jangka panjang, maka ukuran tengah dan ukuran pemencaran yang serupa dapat juga didefinisikan untuk distribusi probabilitas.
Kita ingat bahwa mean himpunan data;
2, 4, 3, 3, 4, 2, 2, 1, 0, 1, 3, 2
adalah:
0 . 1/12 + 1 . 2/12 + 2 . 4/12 + 3 . 3/12 + 4 . 2/12 =  (harga x frekuensi relatif)

Karena probabilitas adalah frekuensi relatif untuk jangka panjang, maka mean suatu variabel random atau distribusi probabilitasnya dapat didefinisikan sebagai:

Mean X =  ( harga x probabilitas)

Mean X dinamakan juga harga harapan X, dan ditulis E (X). Jika X dapat menjalani harga-harga yang mungkin x1, x2, . . . dengan probabilitas masing-masing x = f(xi) = P(X = xi), maka harga harapan X adalah:
E (X) = xi f (xi)
Di mana n adalah banyaknya semua harga-harga X yang berbeda.

Contoh

Berikut akan dihitung mean dari suatu distribusi probabilitas tentang banyak anak tiap keluarga di negara berkembang.

x 0 1 2 3 Jumlah
f(x) 0,1 0,2 0,4 0,3 1,0
x f(x) 0 0,2 0,8 0,9 1,9 = E(X)

Jadi harga harapan atau mean dari distribusi probabilitas di atas adalah 1,9.

Harga E(X) digunakan sebagai satu ukuran pusat suatu distribusi; dan E(X) juga dinamakan mean populasi dan biasanya ditulis dengan lambang .

Sifat-sifat ekspektasi

1. E(a) = a
2. E(bX) = bE(X)
3. E(X + a) = E(X) + a
4. E(bX + a) = bE(X) + a
5. E(cX2 + bX + a) = cE(X2) + bE(X) + C

b. Variansi

Telah dibahas tentang mean  = E(X) sebagai ukuran pusat suatu distribusi. Sekarang akan dibahas tentang suatu ukuran pemencaran (penyebaran) distribusi itu, yang didasarkan atas penyimpangan x terhadap meannya. Salah satu cara adalah dengan memandang kuadra deviasi (xi – )2. Ini akan membarikan suatu ukuran penyebaran yang disebut variansi.
Maka
Var (X) = E(X – )2

Variansi X biasa ditulis dengan lambang 2.

Versi kedua rumus variansi di atas dapat diperoleh dari:
(X – )2 = X2 – 2X + 2

Dengan mengingat sifat harga harapan (ekspektasi) diperoleh:

E(X – )2 = E ( X2 – 2X + 2 )
= E ( X2 ) – 2 E(X) + 2
= E ( X2 ) – 2 2 + 2
= E ( X2 ) – 2

Jika observasi diukur dengan unit ukuran tertentu, misalnya meter, maka  = E(X) mempunyai unit yang sama, yaitu meter; sedangkan variansi (X) = 2 mempunyai unit meter kuadrat. Untuk menyatakan ukuran pemencaran unit yang sama, kita harus menarik akar variansi itu, dan ini disebut deviasi standar.
Jadi deviasi standar X adalah akar variansi X atau ds(X) = . Deviasi standar biasa ditulis dengan lambang .

Contoh

Berikut adalah perhitungan yang dilakukan untuk mencari variansi dari ‘Penjualan Radio merk A’ yang distribusi probabilitasnya sudah diketahui.

(X) 0 1 2 3 4 5 Jumlah
f(X) 0,1 0,1 0,2 0,3 0,2 0,1 1
X f(X) 0 0,1 0,4 0,9 0,8 0,5 2,7 = E(X) = 
X2 f(X) 0 0,1 0,8 2,7 3,5 2,5 9,3 = E(X2)

Maka
Var (X) = 9,3 – (2,7)2 = 2,01
Ds (X) = = 1,42

Sifat-sifat Variansi dan Deviasi Standar

Disini a dan b adalah konstan

1. Var (X) tak negatif 1. Ds (X) tak negatif
2. Var (X + a) = Var (X) 2. Ds (X + a) = Ds (X)
3. Var (bX) = b2 Var (X) 3. Ds (bX) = b Ds (X)
4. Var (a + bX) = b2 Var (X) 4. Ds (a+ bX) = b Ds (X)

C. Dua Variabel Random dan Sifat-sifatnya

a. Distribusi Bersama Dua Variabel Random

Jika kita melakukan sebuah eksperimen, seringkali kita mengamati lebih dari satu vaiabel random secara bersama-sama. Selanjutnya kita tidak hanya ingin mempelajari sifat-sifat probabilitas masing-masing variabel random itu sendiri-sendiri melainkan juga ingin mempelajari tingkat hubungan antara variabel-variabel itu. Untuk menggambarkan model studi ini, kita ingat bahwa distribusi probabilitas suatu variabel random adalah daftar harga-harga X yang berbeda-beda bersama dengan probabilitas yang berkaitan dengan harga-harga itu. Jika ide ini kita perluas untuk distribusi bersama dua variabel random, maka diperlukan suatu daftar semua pasangan harga X dan Y yang berbeda-beda dengan probabilitas yang berkaitan dengan pasangan-pasangan harga itu. Lebih jelasnya, misalkan X dan Y masing-masing dapat mempunyai k dan m harga-harga yang berbeda, yaitu:

Harga-harga X : x1, x2, . . . , xk
Harga-harga Y : y1, y2, . . . , ym

Maka ada k x m pasangan harga-harga (xi , yj) , i = 1, 2, . . . , k ; j = 1, 2, . . . , m yang berbeda-beda. Kita tulis f(xi , yi) untuk menunjukkan probabilitas bahwa X dan Y secara bersama masing-masing mempunyai harga xi dan yi, yaitu:

f(xi , yi) = P[X = xi dan Y = yi]

maka distribusi probabilitas bersama yang merupakan suatu daftar semua pasangan harga (xi , yj) bersama-sama dengan probabilitas f(xi , yj) yang berkaitan dengan pasangan harga itu dapat disajikan dalam bentuk tabel dua arah sebagai berikut.

Harga – harga Y
y1 y2 . . . . . . . . . . ym
x1 f(x1 , y1) f(x1 , y2) . . . . . . . . . f(x1 , ym)
x2 f(x2 , y1) f(x2 , y2) . . . . . . . . . f(x2 , ym)
Harga X . . . .
. . . .
. . . .
xk f(xk , y1) f(xk , y2) . . . . . . . . . f(xk , ym)

Kadang-kadang distribusi probabilitas bersama X dan Y dapat disajikan dalam bentuk rumus.

Contoh

1. Dua bola diambil secara random dari sebuah kotak yang berisi tiga bola biru, dua bola merah, dan tiga bola hijau. Jika X adalah banyak bola biru terambil dan Y banyak bola merah terambil, tuliskan distribusi probabilitas bersama X dan Y.
Pasangan-pasangan harga (xi , yi) yang mungkin adalah (0 , 0), (0 , 1), (0 , 2), (1 , 0), (1 , 1), (2 , 0). Selanjutnya f(0 , 1) menunjukkan probabilitas bahwa satu bola merah dan satu bola hjau terambil.
Banyak cara yang mungkin untuk mengambil 2 bola dari 8 bola yang ada adalah = 28.
Banyak cara untuk mendapatkan satu dari 2 bola merah dan satu dari 3 bola hijau adalah
= 6.
Jadi f(0 , 1) = 6/28.
Dengan cara hitungan yang serupa akan diperoleh probabilitas kasus-kasus yang lain. Harga-harga ini disajikan dalam tabel berikut;

y
x 0 1 2
0 3/28 6/28 1/28
1 9/28 6/28 0
2 3/28 0 0

2. Suatu perusahaan sehari-hari beroperasi dalam dua kelompok kerja. Dalam suati studi tentang pola kerajinan kerja, variabel random yang diamati adalah X = banyak absen dalam kelompok kerja pagi, dan Y = banyak absendalam kelompok kerja sore, pada hari yang sama. Berdasarkan catatan absensi pada masa-masa yang lalu (yang panjang), Kepala Biro Personalia menyusun distribusi probabilitas bersama X dan Y seperti tertuang dalam tabel di bawah ini.

y
x 0 1 2 3 Jumlah
0 0,05 0,05 0,10 0 0,20
1 0,05 0,10 0,25 0,10 0,50
2 0 0,15 0,10 0,05 0,30
Jumlah 0,10 0,30 0,45 0,15 1

Di sini probabilitas dalam kotak ditetapkan dari frekuensi relatif terjadinya pasangan-pasangan harga dalam catatan jangka waktu yang lama. Misalkan harga probabilitas 0,25 dalam kotak (x = 1 , y = 2) berarti bahwa 25 % dari hari-hari kerja terdapat 1 pekerja kelompok kerja pagi absen dan 2 pekerja kelompok kerja sore absen.
Bilangan jumlah baris pertama 0,20 menunjukkan bahwa dalam 20 % hari-hari kerja tidak seorangpun pekerja kelompok kerja pagi yang absen.

Selanjutnya akan dipelajari beberapa macam informasi yang dapat ditarik dari distribusi probabilitas bersama. Untuk ini akan digunakan distribusi probabiltas bersama dari contoh 2 di atas.

a. Probabilitas suatu peristiwa yang menyangkut X dan Y

Misalnya untuk menghitung P (X + Y = 3) dari tabel contoh 2, diperhatikan jumlah X + Y = 3, diperoleh dari pasangan harga (0 , 3), (1 , 2), (2 , 1). Maka harga probabilitas yang diinginkan dapat diperoleh dari menjumlahkan probabilitas peristiwa-peristiwa itu masing-masing. Jadi
P (X + Y = 3) = f(0 , 3) + f(1 , 2) + f (2 , 1)
= 0 + 0,25 + 0,15 = 0,40

b. Distribusi probabilitas suatu fungsi dua variabel random X dan Y

Dalam contoh 2 di atas misalkan Z = X + Y adalah jumah absen dalam dua kelompok kerja (pagi dan sore). Harga yang mungkin dijalani oleh Z adalah 0, 1, 2, 3, 4, 5, dan probabilitas untuk masing-masing harga itu dihiutng seperti dalam a), yaitu menghitung probabilitas X + Y = 3. Distribusi probabilitas yang dihasilkan dari hitungan ini disajikan dalam tabel berikut ini.

z 0 1 2 3 4 5 Jumlah
f(z) 0,05 0,10 0,20 0,40 0,20 0,05 1

c. Distribusi probabilitas X sendiri

Ini dapat diperoleh langsung dari distribusi probabillitas bersama X dan Y. Dalam tabel pada contoh 2, harga-harga X yang berbeda-beda dituliskan di tepi kiri tabel itu. Probabilitas untuk masing-masing harga ini ditunjukkan oleh jumlah baris (tepi sebelah kanan). Maka harga-harga probabilitas yang berkaitan pada tepi sebelah kanan merupakan distribusi probabilitas X. Karena harga-harga probabilitas yang diperoleh itu merupakan jumlah marginal (tepi) dari tabel dua arah, maka distribusi X juga dinamakan distribusi probabilitas marginal X. Dengan cara yang sama dapat diperoleh distribusi probabilitas marginal Y, yang terlihat pada tepi bawah tabel pada contoh 2.

d. Mean dan deviasi standar X dan Y

Setiap ukuran numerik untuk distribusi X seperti mean x dan deviasi standar x, dihitung dari distribusi marginal X sendiri tanpa mengingat distribusi probabilitas bersama. Prosedur yang sama berlaku untuk distribusi Y.

Berikut diberikan perhitungan untuk mencari mean dan deviasi standar X

X 0 1 2 Jumlah
f(x) 0,2 0,5 0,3 1
xf(x) 0 0,5 0,6 1,1
x2f(x) 0 0,5 1,2 1,7

x = 1,1
2x = 1,7 – (1,1)2 = 0,49
x = 0,7

Dan di bawah ini adalah perhitungan untuk mencari mean dan deviasi standar Y.

Y 0 1 2 3 Jumlah
f(y) 0,10 0,30 0,45 0,15 1
yf(y) 0 0,30 0,90 0,45 1,65
y2f(y) 0 0,30 1,80 1,35 3,45

y = 1,65
2y = 3,45 – (1,65)2 = 0,7275
y = 0,85

e. Sifat jumlah harga harapan (ekspektasi)

Harga harapan memiliki sifat-sifat penjumlahan. Yaitu untuk dua variabel random X dan Y dengan distribusi probabilitas bersama tertentu berlaku:

E (X + Y) = E(X) + E(Y)

Untuk menunjukkan kebenaran hubungan ini, akan dihitung E (X + Y) dari tabel distribusi probabilitas Z = X + Y di atas:

E (X + Y) = 0 (0,05) + 1 (0,10) + 2 (0,20) + 3(0,40) + 4 (0,20) + 5 (0,05) = 2,75

Hitungan dengan menggunakan distribusi marginal telah dilakukan, dan diperoleh
E (X) + E(Y) = x + y = 1,1 + 1,65 = 2,75

Terlihat kebenaran hubungan E (X + Y) = E(X) + E(Y)

f. Kovariansi dan korelasi

Kovariansi antara X dan Y adalah ukuran numerik untuk variansi bersama dua variabel random dan didefinisikan sebagai harga harapan (ekspektasi) hasil kali (X – x) (Y – y).
Kovariansi ( X , Y) didefinisikan sebagai:

Kov ( X , Y) = E [(X – x) (Y – y)]
= E (XY) – xy

Bentuk kedua ini lebih mudah digunakan. Sebab x dan y dapat diperoleh dari distribusi marginal, tinggal menghitung E (XY). Ini dihitung dengan cara menjumlahkan semua harga XY di setiap kotak dikali probabilitas yang berkaitan.
Harga kovariansi tergantung pada satuan pengukuran X dan Y. Lebih diinginkan untuk memperoleh ukuran hubungan dua variabel yang tidak tergantung pada satuan pengukurannya. Ini dapat diperoleh dengan membagi kovariansi dengan deviasi standar X dan deviasi standar Y. Ukuran hubungan yang diperoleh dinamakan koefisien korelasi antara X dan Y. Jadi

Kor (X,Y) =

Contoh

Akan ditunjukkan bagaimana menghitung kovariansi dan koefisien untuk distribusi probabilitas bersama dalam contoh 2. Mean dan deviasi standar X dan Y telah dihitung dari distribusi marginal X dan Y. Artinya yang belum diperoleh hanya nilai E (XY) yang akan dilakukan berikut ini. Dalam tabel di bawah ini angka-angka di dalam kurung adalah harga-harga (XY) untuk tiap-tiap kotak. Selanjutnya harga-harga ini akan dikalikan dengan probabilitasnya dan hasil kalinya kita jumlahkan.

Perhitungan E (XY) untuk distribusi probabilitas dalam contoh 2.

y
x 0 1 2 3
0 0,05
(0) 0,05
(0) 0,10
(0) 0
(0)
1 0,05
(0) 0,10
(1) 0,25
(2) 0,10
(3)
2 0
(0) 0,15
(2) 0,10
(4) 0,05
(6)

0,10 x 1 = 0,10
0,25 x 2 = 0,50
0,10 x 3 = 0,30
0,15 x 2 = 0,30
0,10 x 4 = 0,40
0,50 x 6 = 0,30

E(XY) = 1,90

Kov (X , Y) = 1,90 – (1,65) (1,1) = 0,085
Kor (X , Y) = = = 0,14

Sifat-sifat koefisien korelasi

a. Kor (X,Y) adalah bilangan antara -1 dan 1. harga-harga 1 dan -1 dicapai apabila X dan Y dihubungkan sebagai garis lurus dengan koefisien arah masing-masing positif dan negatit
b. Kor (X,Y) tidak berubah apabila variabelnya ditambah dengan bilangan konstan atau dikalikan dengan bilangan konstan yang tandanya sama. Misalnya
U = 5X + 2 dan V = 2Y + 3, maka kor (U,V) = kor (X,Y).

g. Dua variabel random independen

Telah kita ketahui bahwa dua peristiwa A dan B independen jika P (AB) = P(A).P(B). Dengan menggunakan alasan yang sama, dapat dikatakan bahwa dua variabel random X dan Y independen apabila peristiwa X menjalani harga tertentu xi, adalah independen dengan peristiwa bahwa Y menjalani harga tertentu yj, berapapun harga-harga tertentu yang dipilih itu. Dengan definisi peristiwa-peristiwa independen kita punyai:

P [X = x , Y = y] = P [X = x] . P [Y = y]

Maka, variabel random X dan Y independen jika f (x,y) = f (x). f (y) untuk semua pasangan-pasangan harga (x,y) dalam distribusi bersama. Dengan kata lain setiap probabilitas dalam kotak merupakan hasil kali.

BAB V
BEBERAPA DISTRIBUSI PROBABILITAS
VARIBEL RANDOM CACAH KHUSUS

A. Model Probabilitas dan Bernoulli Trials

a. Model Probabilitas

Model probabilitas suatu variabel random X adalah suatu bentuk distribusi probabilitas tertentu yang dianggap mencerminkan tingkah laku X. Harga-harga probabilitas dinyatakan dalam bentuk parameter yang tidak diketahui, yang berkaitan dengan karakteristik populasi dan cara pengambilan sampelnya.
Di bawah ini adalah beberapa kriteria sebagai petunjuk umum untuk merumuskan model probabilitas yang baik.
1. Cukup

Model harus didasarkan pada postulat yang cukup menggambarkan mekanisme kemungkinan yang menyebabkan adanya variasi dalam observasi itu.

2. Sederhana

Jika sekiranya mungkin pendekatan yang sederhana harus diusahakan sehingga model itu dapat untuk analisis statistik tanpa mengorbankan kualitas ‘cukup’ nya.

3. Ekonomi dalam parameter

Memasukkan parameter yang tidak semestinya cenderung menurunkan kualitas analisis statistiknya.

Jika memilih antara dua model yang keduanya merupakan pendekatan yang realistik terhadap mekanisme kemungkinan yang melandasinya, maka model dengan parameter yang lebih sedikit yang lebih disenangi.
Bab ini mempelajari beberapa model dasar yang berguna dalam menggambarkan distribusi probabilitas variabel cacah mengenai banyak terjadinya suatu peristiwa dalam ‘trial’ yang berulang-ulang suatu percobaan. Pembicaraan di bab ini ditujukan terutama untuk kasus yang menyangkut pengambilan sampel dari populasi dikotomi (bercabang dua); dinamakan demikian karena elemen-elemen populasi itu diklasifikasikan dalam dua kategori. Memilih satu elemen populasi itu dan menentukan kategorinya adalah merupakan satu trial dari eksperimen itu, sehingga setiap trial hanya dapat menghasilkan satu dari dua hasil yang mungkin.
Dimulai dari ruang sampel yang terdiri dari dua hasil yang mungkin itu, akan dipelajari distribusi banyak kejadian-kejadian dalam trial yang diulang-ulang.

b. Bernoulli Trials

Dipandang pengulangan berturut-turut suatu eksperimen atau observasi di mana tiap pengulangan dinamakan satu trial. Selanjutnya dianggap bahwa hanya dua hasil yang mungkin dalam setiap trial. Hasil ini masing-masing dinamakan sukses (S) dan tidak sukses (TS) untuk menegaskan hanya ada dua hasil yang mungkin.
Situasi yang menyangkut trial dengan dua hasil yang mungkn dapat terjadi dalam berbagai bidang, termasuk pengambilan sampel dari populasi dikotomi. Misalnya:

a. Amati telur ayam berikutnya yang menetas dan tentukan apakah anak ayam itu jantan atau betina.
b. Periksa satu produk dari proses produksi dan amati apakah produk itu baik atau cacat.

Sifat sederhana hasil-hasil tiap trial suatu eksperimen merupakan titik awal yang baik untuk membentuk model probabilitas variabel random yang didefinisikan dalam bentuk pengulangan trial itu. Trial yang diulang-ulang itu dilakukan di bawah sekumpulan syarat yang dinyatakan sebagai postulat. Postulat-postulat ini tidak hanya memberikan syarat yang sangat mendekati banyak syarat-syarat eksperimental, tetapi juga menghasilkan model probabilitas yang berguna dan sederhana. Trial yang diulang-ulang yang mengikuti postulat-postulat ini dinamakan ‘Bernoulli trials’.

Sifat-sifat Bernoulli Trials:

1. Tiap trial menghasilkan satu dari dua hasil yang mungkin yang dinamakan sukses (S) dan tidak sukses (T).

2. Untuk tiap trial, probabilitas akan sukses P(S), adalah sama dan ditulis p = P(S). Probabilitas tidak sukses adalah P(T) = (1 – p), dan biasanya ditulis sebagai q, maka
p + q = 1.

3. Trial-trial itu independen satu dengan yang lain, probabilitas akan sukses dalam suatu trial tidak berubah meskipun diperoleh informasi tentang hasil trial lain.

Contoh: (pengambilan sampel dari populasi dikotomi)

Dipunyai suatu populasi benda-benda (hasil produksi) di mana tiap benda dapat diklasifikasikan sebagai baik atau rusak.

a) Pengambilan sampel dengan pengembalian

Misalkan populasi itu terdiri dari 15 benda di mana 10 baik dan 5 rusak. Satu benda diambil secara random (yaitu dengan cara sedemikian hingga tiap benda di dalam populasi itu mempunyai kemungkinan yang sama untuk terambil). Kualitas benda itu diperiksa dan dicatat dan selanjutnya dikembalikan lagi ke dalam himpunan populasinya sebelum pengambilan selanjutnya dilakukan. Maka dalam hal ini syarat ‘Bernoulli Trials’ dipenuhi. Apabila terambilnya benda yang rusak itu dituliskan sebagai S, maka P(S) = p = 5/15.

b) Pengambilan sampel tanpa pengembalian

Dalam situasi a), misalkan tiga benda diambil satu persatu tetapi tanpa pengembalian. Maka syarat bahwa trial-trial independen tidak dipenuhi. Untuk pengambilan pertama, P(S) = 5/15. Jika pengambilan pertama menghasilkan S, maka elemen populasi tinggal 14 dan empat diantaranya rusak.
Dengan informasi hasil pengambilan pertama itu, probabilitas bersyarat akan memperoleh S pada pengambilan kedua adalah 4/14  5/15 yang menunjukkan tidak independen.

c) Pengambilan sampel tanpa pengembalian dari populasi yang besar

Pandang pengambilan sampel 3 benda tanpa pengembalian dari sekumpulan 1500 benda, di mana 500 di antaranya rusak (cacat). Dengan notasi S1 peristiwa terambil produk cacat pada pengambilan pertama, dan S2 peristiwa terambil produk cacat pada pengambilan kedua , maka:

P(S1) = =
Dan
P(S2 / S1) =

Untuk praktisnya, pecahan yang kedua itu dapat dianggap sama dengan 1/3 . Jadi meskipun secara tepat, trial itu telah menyalahi sifat trial yang independen, tetapi penyimpangan itu sedemikian kecil sehingga dapat diabaikan, dan syarat ‘Bernoulli trials’ dapat dipenuhi.
Tujuan pendekatan ini adalah untuk menyederhanakan penyusunan modelnya. Dapat kita simpulkan bahwa dalam pengambilan sampel tanpa pengembalian dari suatu populasi yang besar, di mana ukuran sampelnya hanya merupakan bagian kecil dari ukuran populasinya (biasanya kurang dari 10 %), syarat ‘Bernoulli trials’ dianggap dipenuhi.

B. Distribusi Binomial

a. Distribusi Binomial

Kita lakukan ‘Bernoulli trials’ berulang-ulang sebanyak n kali, dengan probabilitas sukses p dalam tiap trial. Kita pandang variabel random X = banyak sukses dalam n trial itu. Maka distribusi probabilitas X dinamakan distribusi probabilitas binomial dengan n trial dan probabilitas sukses p. Harga-harga yang dijalani X adalah bilangan-bilangan bulat 0, 1, 2, . . . , n, dan selanjutnya akan diturunkan rumus untuk probabilitas P(X = x), di mana x dapat sembarang bilangan bulat dari 0 sampai dengan n.
Namun sebelum disajikan rumus untuk kasus n trial, akan lebih jelas apabila kita pelajari terlebih dahulu suatu kasus khusus sebagai berikut:
Dalam kasus n = 4 trial, yang masing-masing dapat menghasilkan sukses (S) atau tidak sukses (T), ruang sampelnya mempunyai 2 x 2 x 2 x 2 = 16 mhasil yang mungkin. Semua hasil yang mungkin dalam eksperimen dengan 4 trial adalah sebagai berikut:

TTTT TTTS SSTT SSST SSSS
TTST STST SSTS
TSTT STTS STSS
STTT TSST TSSS
TSTS
TTSS

Untuk memperoleh harga untuk P(X = 2), kita pandang semua hasil (urutan S dan T) yang tertulis dalam kolom ketiga yang terdiri dari dua S dan dua T. Karena trial-trial itu independen satu sama lain dan dalam tiap trial P(S) = p dan P(T) = (1-p). Maka dari definisi peristiwa yang independen kita peroleh:

P(SSTT) = P(S) P(S) P(T) P(T) = p2 (1 – p)2

Dengan cara yang sama, probabilitas tiap hasil (urutan) dalam kolom itu adalah
p2 (1 – p)2. Ada enam urutan dengan dua S dan dua T, sehingga kita peroleh
P(X = 2) = 6 p2 (1 – p)2. Meskipun tanpa membuat daftar yang lengkap semua urutan 2S dan 2, kita dapat memperolehnya dengan mengingat semua tempat di mana S terjadi dapat dipilih dari seluruh empat tempat dalam = 6 cara, dengan dua sisa tempat lain diisi huruf T.
Dengan jalan pikiran yang sama dapat kita peroleh untuk X = 1 terjadi dalam = 4 cara, yaitu ada empat urutan dengan satu S dan tiga T. Masing-masing urutan mempunyai kemungkinan p (1 – p)3, sehingga P (X = 1) = p (1 – p)3. Setelah semuanya kita selesaikan, dengan jalan pikiran sepert ini, maka distribusi binomial dengan 4 trial dapat disusun dalam tabel di bawah ini.

x 0 1 2 3 4
P(X = x) p0(1-p)4
p1(1-p)3
p2(1-p)2
p3(1-p)1
p4(1-p)0

Cara berpikir ini dapat diperluas untuk kasus umum dengan n Bernoulli trials. Seperti diketahui dari keterangan di atas, ada urutan dengan x buah S dan (n-x) buah T, dan masing- masing urutan mempunyai probabilitas px (1-p)n-x , sehingga:

P (X = x) = px (1-p)n-x ; x = 0, 1, 2, . . . , n
Ini adalah rumus distribusi probabilitas binomial dengan n trial. Rumus ini biasa ditulis sebagai b(x ; n ; p) yang dibaca probailitas X adalah distribusi binomial dengan n trial dan probabilitas sukses p.

b. Cara menggunakan tabel binomial kumulatif

Jika n agak besar, perhitungan probabilitas binomial menjadi sangat merepotkan, karena harus menghitung harga pangkat dari p dan q. Untuk mempermudah perhitungan, telah tersedia tabel probabilitas binomial kumulatif.

P ( X  i ) = b (x; n; p)
Telah ditabelkan untuk beberapa harga n, p, dan i. Harga-harga probabilitas yang lain dapat diperoleh dengan menuliskan peristiwa-oeristiwa itu dalam bentuk peristiwa ( X  i ) dan selanjutnya digunakan hukum-hukum probabilitas yang sesuai.
Sebagai contoh, misalnya:

1) P (X = a) = P ( X  a) – P ( X  a – 1)
2) P ( a  X  b) = P ( X  b) – P ( X  a – 1)
3) P (X > c) = 1 – P ( X  c)
4) P (X  d) = 1 – P ( X  d – 1)

Contoh

1. Misalkan diketahui bahwa tingkat bertunasnya suatu varietas biji tertentu adalah 80 % apabila biji-biji itu ditanam pada musim semi ini. Jika 15 biji ditanam, tentukan probabilitas Bahwa:
a) Paling banyak 8 biji bertunas
b) Sepuluh biji atau lebih akan bertunas
c) Banyak biji yang bertunas tidak kurang dari 8 dan tidak lebih dari 12

Jawab

Dalam eksperimen ini, S menyatakan biji yang ditanam bertunas;
Maka P (S) = p = 0,8.
Selanjutnya dianggap bahwa hasil dari ditanamnya biji-biji itu independen satu dengan yang lain. Maka distribusi probabilitas X = banyak biji yang bertunas; adalah distribusi binomial dengan n = 15 dan p = 0,8.

Untuk menghitung probabilitas yang diinginkan digunakan Tabel Binomial kumulatif dengan n = 15 dan p = 0,8.

a) P ( X  8) = 0,018
b) P (X  10) = 1 – P ( X  9) = 1 – 0,061 = 0,939

c. Mean dan Variansi Distribusi Binomial

Rumus umum mean dan variansi distribusi binomial adalah sebagai berikut:
Untuk distribusi binomial dengan n trial dan p = P (S),

Mean  = np
Variansi 2 = np (1 – p) = npq
Deviasi standar  =

C. Distribusi Hipergeometrik dan Distribusi Poisson

a. Distribusi Hipergeometrik

Kita pandang persoalan sebagai berikut:
Misalkan dalam sebuah kotak terdapat a bola bernomor 1 dan b bola bernomor 0, di mana seluruhnya ada N = a + b bola. Kita ambil tanpa pengembalian n bola ( 1  n  N) sedemikian hingga himpunan bagian mempunyai probabilitas yang sama, yaitu
1 / , akan terambil. Ini dinamakan sampel random berukuran n yang diambil tanpa pengembalian dari populasi terhingga dengan N elemen. Misalkan X = banyak bola bernomor 1 di antara n bola yang terambil. Maka Y yang dapat menjalani harga bilangan bulat dari 0 sampai dengan mana yang terkecil antara a dan n, dikatakan berdistribusi hipergeometrik.
Rumus fungsi probabilitas distribusi ini adalah:

f(x) = P (X = x) =
x = 0, 1, 2, . . . , a (jika a < n)
x = 0, 1, 2, . . . , n (jika n < a)

Mean dan variansi distribusi hipergeometrik adalah:

Mean (X) =  = n .
Var (X) = 2 = n . . .

Rumus-rumus ini akan identik dengan rumus-rumus untuk variabel random binomial X yang diperoleh dengan pengambilan sampel dengan pengembalian dari kotak yang sama, kecuali faktor dalam rumus variansi, yang dinamakan faktor koreksi populasi terhingga untuk variansi dalam pengambilan sampel tanpa pengembalian. Jika N sangat besar relatif terhadap n, harga faktor koreksi ini mendekati 1, oleh karena itu perbedaan antara pengembalian sampel dengan dan tanpa pengembalian dapat diabaikan.

b. Distribusi Poisson

Untuk sembarang konstan positif, variabel random X sedemikian hingga
P( X = x ) = f(x) = ; x = 0, 1, 2, . . .
Dikatakan berdistribusi Poisson .
Mean dan variansi variabel random ini sama, yakni:
Mean (X) =  = 
Var (X) = 2 = 

Dalam praktek, distribusi poisson kerap timbul dalam perhitungan X dari ‘peristiwa-peristiwa yang jarang terjadi’, yaitu banyak kali terjadinya suatu peristiwa dalam probabilitas p yang kecil dalam n trial independen. Hanya mengetahui harga mean (X), yakni , dapat dihitung probabilitas Poisson untuk x = 0, 1, 2,. . .

REFERENSI

1. Sudjana, M.A.,M.Sc, 1992, Metode Statistika, Bandung: Tarsito

2. Zanzawi Soejoeti, Metode Statistika I………………………………….

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s


%d bloggers like this: