Sebaran Peubah Acak Diskret
Di dalam bidang statistika terdapat beberapa sebaran peubah acak diskret yang sudah dikenal luas. Pada tulisan ini kita akan membahas beberapa sebaran tersebut beserta karakteristiknya masing-masing, termasuk nilai harapan, ragam dan fungsi pembangkit momennya.
Suatu peubah acak $X$ disebut sebagai peubah acak diskret, jika batas dari $X$ atau ruang contoh dari $X$ dapat dihitung (countable). Dalam banyak situasi, nilai peubah acaknya merupakan nilai bilangan bulat.
Halaman 85, Casella, B. and R.L. Berger. 2002. Statistical Inference, 2nd Edition. Duxbury.
Kita katakan suatu peubah acak merupakan sebaran peubah acak diskret jika ruang contohnya terbatas ataupun dapat dihitung.
Halaman 45, Hogg, R., Mc Kean, and Craig, A. 2005. Introduction to Mathematical Statistics, 6th Edition. Prentice Hall.
Sebaran Seragam Diskret
Suatu peubah acak $X$ dikatakan sebagai peubah acak yang mengikuti sebaran seragam diskret, jika untuk setiap nilai $X$ berupa bilangan bulat di dalam batas-batas $a$ dan $b$, memiliki peluang yang sama. $X \sim Seragam(a, b)$
Fungsi Massa Peluang (FMP) dari sebaran seragam diskret adalah:
$$f(x) = \frac{1}{b\; – \; (a-1)} \quad untuk \quad x = a, a+1, …, b$$
Nilai harapan dari $f(x)$ dapat dihitung dengan mudah dengan penjumlahan, namun formula umumnya adalah:
$$E(X) = \mu = \frac{b(b+1)-a(a+1)}{2(b – (a-1))}$$
Sementara untuk ragamnya adalah:
$$Var(X) = \sigma^2 = \frac{b(b+1)(2b+1)-a(a-1)(2a-1)}{6(b – (a-1))} – \left ( \frac{b(b+1)-a(a-1)}{2(b – (a-1))} \right)^2$$
Formula umumnya cukup rumit, sehingga lebih mudah menghitung ragam-nya dengan menghitung $E(X^2)$ terlebih dahulu kemudian $\sigma^2 = E(X^2) – [E(X)]^2$.
Untuk $a=1$ dan $b=n$ maka :
Nilai Harapan dan Ragam:
$$\mu = \frac{n+1}{2} \quad dan \quad \sigma^2 = \frac{(n+1)(n-1)}{12}$$
Fungsi Pembangkit Momen:
$$M_X(t) = \frac{e^t}{n}\left (\frac{e^{tn}-1}{e^t – 1}\right)$$
Ilustrasi Sebaran Seragam Diskret
Peubah acak X menyatakan angka pada mata dadu yang muncul dari pelemparan sebuah dadu bermata enam setimbang. Maka Fungsi Massa Peluang-nya adalah:
X | 1 | 2 | 3 | 4 | 5 | 6 |
P(X) | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
Penyelesaian
Nilai Harapan dan Ragam:
$$E(X) = \frac{6+1}{2} = 3,5$$
Fungsi Pembangkit Momen:
$$\sigma^2 = \frac{(6+1)(6-1)}{12} = \frac{35}{12}$$
Sebaran Bernoulli
Sesuai namanya, sebaran ini ditemukan oleh Jacob Bernoulli seorang ahli matematika Swiss. Ciri-ciri dari sebaran Bernoulli adalah:
- Sebuah percobaan yang terdiri dari satu ulangan (trial)
- Hasil dari percobaan tesebut terdiri d ari dua kemungkinan : sukses atau gagal
- Peluang suksesnya adalah $p$ sehingga peluang gagal adalah $1-p$
- Nilai peubah acak : $x=1$ untuk kejadian sukses dan $x=0$ untuk kejadian gagal
Properti Sebaran Bernoulli
Fungsi Massa Peluang:
\begin{equation}f(x) = P(X=x) = \begin{cases}p & \text{untuk $x$ = 1, } \\ 1-p & \text{untuk $x$ = 0}\end{cases}\end{equation}
Nilai Harapan :
$$E(X) = p$$
Ragam :
$$Var(X) = p(1-p)$$
Fungsi Pembangkit Momen :
$$M_X(t) = pe^t+(1-p)$$
Ilustrasi Sebaran Bernoulli
Suatu soal ujian memiliki 5 pilihan jawaban, dimana hanya satu pilihan jawaban yang benar. Jika X=1 menyatakan nilai peubah acak X jika menebak jawaban dengan benar, maka berapa nilai peluangnya?
Penyelesaian
X mengikuti sebaran Bernoulli : $X \sim Bernoulli(p=1/5)$, maka
$$P(X=1) = 1/5$$
jadi, peluang seseorang menebak jawaban dengan benar adalah = $p = 1/5$
Sebaran Binomial
Sebaran Binomial merupakan perluasan dari sebaran Bernoulli, dimana suatu kejadian Bernoulli dilakukan berulang-ulang sebanyak $n$ kali, dan setiap ulangan bersifat saling bebas. Adapun sifat dari sebaran Binomial adalah:
- Percobaan terdiri dari $n$ kali ulangan yang identik
- Setiap ulangan memiliki dua kemungkinan hasil (sukses atau gagal)
- Setiap ulangan bersifat bebas (hasil pada suatu ulangan tidak memengaruhi hasil ulangan lainnya)
- Peluang sukses untuk setiap ulangan adalah sama yaitu sebesar $p$.
- Nilai peubah acak $X$ menyatakan banyaknya kejadian sukses dari $n$ kali percobaan
- X mengikuti sebaran Binomial, $X \sim Binomial(n, p)$ untuk $x = 0,\;1,\,…,\;n$
Properti Sebaran Binomial
Fungsi Massa Peluang:
\begin{equation}P(X=x) = \begin{cases}{n \choose r} p^x (1-p)^{n-x} & \text{ , $x = 0,\;1\;…,\;n$} \\ 0 & \text{, $x$ lainnya}\end{cases}\end{equation}
Nilai Harapan :
$$E(X) = np$$
Ragam :
$$Var(X) = np(1-p)$$
Fungsi Pembangkit Momen :
$$M_X(t) = (pe^t+(1-p))^n$$
Ilustrasi Sebaran Binomial
Sebuah dadu bermata enam dilempar sebanyak 10 kali. Jika kejadian X menyatakan berapa kali angka 1 atau 6 muncul pada 10 pelemparan tersebut. Hitunglah:
- Nilai harapan dan ragamnya!
- Peluang muncul angka 1 atau 6 sebanyak 4 kali pada 10 pelemparan tersebut
- Peluang munculnya angka 1 atau 6 tidak lebih dari 2 kali
Penyelesaian
Peluang muncul angka 1 atau 6 pada setiap pelemparan adalah 2 dari 6 kemungkinan sehingga $p=2/6=1/3$,
Fungsi massa peluang dari $X$:
$$P(X=x) = {10 \choose x}(1/3)^x(2/3)^{10-x}$$
Nilai Harapan bagi $X$ adalah $E(X) = 10 \cdot 1/3 = 10/3$
Ragam dari $X$ adalah $Var(X) = 10 \cdot 1/3 \cdot 2/3 = 20/9$
Peluang $X = 4$:
$$\begin{aligned}P(X=4) &= {10 \choose 4}(1/3)^4 (2/3)^{10-4} \\\\&= \frac{10!}{4!6!}(1/3)^4(2/3)^6 \\\\&=0,2276\end{aligned}$$
Peluang $X \leq 2$ sama saja dengan $P(X=0) + P(X=1) + P(X=2)$ :
$$\begin{aligned}P(X \leq 2) &= \frac{10!}{0!10!}(1/3)^0(2/3)^{10} + \frac{10!}{1!9!}(1/3)^1(2/3)^9+ \frac{10!}{2!8!}(1/3)^2(2/3)^8\\\\&= 0,0173 + 0,0867 + 0,1951 \\\\ &=0,2991\end{aligned}$$
Sebaran Geometrik
Sebaran Geometrik digunakan untuk memodelkan banyaknya ulangan Bernoulli yang diperlukan sampai kejadian sukses pertama. Dengan kata lain, jika dilakukan percobaan Bernoulli sebanyak $x$ kali, maka pada ulangan pertama sampai dengan ulangan ke-$x-1$ menghasilkan nilai gagal sementara pada ulangan ke-$x$ baru memperoleh sukses. Sebaran Geometrik dinotasikan $X \sim Geom(p)$
Properti Sebaran Geometrik
Fungsi Massa Peluang:
\begin{equation}P(X=x) = \begin{cases}(1-p)^{x-1}p & \text{, $x = 1,\;2,…$} \\ 0 & \text{, $x$ lainnya}\end{cases}\end{equation}
Nilai Harapan :
$$E(X) = 1/p$$
Ragam :
$$Var(X) = \frac{1-p}{p^2}$$
Fungsi Pembangkit Momen :
$$M_X(t) = \frac{pe^t}{1-(1-p)e^t}$$
Ilustrasi Sebaran Geometrik
Dari satu set yang berisi 52 kartu remi, diambil sebuah kartu berulang kali dengan pengembalian sampai mendapatkan sebuah kartu As. Jika X menyatakan banyaknya pengambilan yang terjadi sampai memperoleh kartu As tersebut, hitunglah:
- Nilai Harapan dan Ragam dari X
- Peluang terambilnya kartu As untuk pertama kalinya pada ulangan ke-10
- Peluang terambilnya kartu As untuk pertama kalinya setelah lebih dari 4 kali pengambilan
Penyelesaian
Peluang terambil kartu As dari satu set kartu adalah $p=4/52=1/13$,
Fungsi massa peluang dari $X$ adalah $P(X=x) = (12/13)^{x-1}(1/13)$ untuk $x=1, 2, 3, …$
Nilai Harapan bagi $X$ adalah $E(X) = 1/(1/13) = 13$
Ragam dari $X$ adalah $Var(X) = (1-1/13)/(1/13)^2 = 156$
Peluang $X = 10$:
$$\begin{aligned}P(X=10) &= (12/13)^{10-1} (1/13) \\\\&= 0,0345\end{aligned}$$
Peluang $X > 4$ sama saja dengan $P(X>4) = \sum_{x=5}^{\infty}P(X=x) $ atau $P(X > 4) = 1 – \sum_{x=1}^4P(X=x) $
$$\begin{aligned}P(X>4) &= 1 – \sum_{x=1}^4 {\left(\frac{12}{13}\right)}^{x-1}\left(\frac{1}{13}\right) \\\\&=1 – \left[{\left(\frac{12}{13}\right)}^0 \left(\frac{1}{13}\right) + \;…\; + {\left(\frac{12}{13}\right)}^3 \left(\frac{1}{13}\right) \right]\\\\&= 1-0,3298 \\\\ &=0,6702\end{aligned}$$
Sebaran Binomial Negatif
Sebaran Binomial Negatif merupakan perluasan dari sebaran Geometrik. Dimana peubah acak $X$ menyatakan banyaknya ulangan Bernoulli yang dilakukan hingga mendapatkan $r$-kali sukses, dengan ulangan terakhir memperoleh hasil sukses. Notasi untuk sebaran Binomial Negatif $X \sim NB(r, p)$.
Dalam banyak literatur, termasuk pada perangkat lunak seperti R, binomial negatif lebih umum dinyatakan sebagai banyaknya kegagalan yang terjadi sampai memperoleh $r$-kali sukses, sehingga sudut pandang yang digunakan sedikit berbeda.
Properti Sebaran Binomial Negatif
Fungsi Massa Peluang:
\begin{equation}P(X=x) = \begin{cases}{{x-1} \choose {r-1}}p^r(1-p)^{x-r} & \text{, $x = r,\;(r+1),\;…$} \\ 0 & \text{, $x$ lainnya}\end{cases}\end{equation}
Jika peubah acak Y menyatakan banyaknya kejadian gagal sebelum memperoleh $r$-kali sukses, dimana $x = y+r$, maka:
\begin{equation}P(Y=y) = \begin{cases}{{y+r-1} \choose {y}}p^r(1-p)^y & \text{, $y = 0,\;1,\;…$} \\ 0 & \text{, $y$ lainnya}\end{cases}\end{equation}
Nilai Harapan :
$$E(Y) = r/p$$
Ragam :
$$Var(Y) = \frac{r(1-p)}{p^2}$$
Fungsi Pembangkit Momen :
$$M_Y(t) = \left(\frac{pe^t}{1-(1-p)e^t}\right)^r$$
Ilustrasi Sebaran Binomial Negatif
Dalam suatu permainan roulette dimana saat diputar terdapat 8 kemungkinan hasil. Terdapat satu bagian yang berisi hadiah utama dan 2 bagian berisi hadiah hiburan dan sisanya kosong.
- Jika Budi bermain sebanyak 10 kali, berapa peluang Budi mendapatkan hadiah utama sebanyak 3 kali, dimana pada permainan terakhirnya memperoleh hadiah utama?
- Berapa kali minimal Budi harus bermain, agar peluangnya memperoleh hadiah (utama ataupun hiburan) sebanyak 5 kali, lebih dari 90 persen?
Penyelesaian
1. Peluang mendapatkan hadiah utama $p=1/8 = 0,125$,
$$\begin{aligned}P(X=10) &={{10-1} \choose {3-1}}(0,125)^3(1-0.125)^{10-3}\\\\ &=\frac{9!}{2!7!}(0,125)^3(0,875)^7\\\\&=0,0276\end{aligned}$$
2. Untuk pertanyaan ke-2 maka $p=3/8=0,375$ dan $r=5$ . Mencari minimal putaran, berarti mencari nilai $k$ tertentu sehingga $P(X\leq k) > 0,9$, maka
$$\begin{aligned}P(X\leq k) &> 0,9 \\\\ \sum_{x=5}^k {k-1 \choose 4}(0,375)^5(0,625)^{k-5} &>0,9\end{aligned}$$
Penyelesaian persamaan ini sulit dilakukan secara manual, sehingga sebaiknya menggunakan bantuan software. Pada bahasa R, kita dapat menggunakan fungsi quantil bagi negatif binomial qbinom untuk mencari nilai $k$ sehingga nilai $P(X\leq k) = 0,9$ dengan kode berikut:
# p : peluang kumulatif yang menjadi perhatian # size : banyaknya sukses # prob : peluang sukses pada setiap ulangan n.gagal <- qnbinom(p = 0.9, size = 5, prob = 0.375) # n.gagal = 15
Pada bahasa R, output yang diberikan untuk sebaran negatif binomial adalah tentang kejadian gagal-nya. Sehingga nilai $15$ yang diperoleh merupakan banyaknya kejadian gagal sampai memperoleh 5 sukses. Jadi, banyaknya ulangan yang diperlukan adalah $15 + 5 = 20$ ulangan.
Secara statistik dengan melakukan permainan sebanyak minimal 20 kali maka Budi akan memiliki peluang sebesar $90\%$ untuk memenangkan 5 hadiah.
Sebaran Hipergeometrik
Sebaran Hipergeometrik merupakan generalisasi dari sebaran Binomial dengan populasi terbatas. Dilihat dari cara pengambilan contoh, ketika dilakukan dengan pemulihan dan antar ulangan saling bebas maka menggunakan sebaran Binomial. Jika pengambilan contoh dilakukan tanpa pemulihan maka menggunakan sebaran Hipergeometrik.
Jika di dalam populasi terdapat $N$ elemen, dengan $K$ elemen merupakan bagian sukses (karakteristik yang menjadi perhatian). Kemudian dilakukan pengambilan contoh sebanyak $n$ elemen, maka peubah acak $X$ menyatakan banyaknya kejadian sukses. Batas dari peubah acak $X$ adalah ($x = 0,\;1,\;…,\;min(n, K)$). Karena berbicara mengenai pengambilan contoh tanpa pengembalian, maka batas maksimal dari nilai $X$ adalah sebanyak K buah jika contoh yang diambil $\geq K$ atau sebanyak $n$ buah jika contoh yang diambil $<\;K$.
Properti Sebaran Hipergeometrik
Fungsi Massa Peluang:
\begin{equation}P(X=x) = \frac{{K \choose x}{{N-K} \choose {n-x}}}{{N \choose n}} \text{ , $x = 0,\;1,\;…,\;min(n, K)$}\end{equation}
Nilai Harapan :
$$E(X) = n \cdot\frac{K}{N}$$
Ragam :
$$Var(X) = n \cdot \frac{K}{N} \cdot \frac{N-K}{N}\cdot \frac{N-n}{N}$$
Ilustrasi Sebaran Hipergoemetrik
Jika dilakukan pengambilan 5 buah kartu secara acak dari 1 set kartu remi (52 kartu) tanpa pemulihan, berapakah peluang terambil 3 kartu bergambar (kartu J, Q atau K).
Penyelesaian
Karena dilakukan tanpa pengembalian, peluang terambil kartu J, Q, K (total 12 kartu) dari satu set kartu akan tergantung dari kartu yang terambil sebelumnya.
$N=52$, $K=13$, dan $n=5$ dengan batas nilai $x=0, 1, 2, …, 12$
Peluang $X = 3$:
$$\begin{aligned}P(X=3) &= \frac{{12 \choose 3}{{52-12} \choose {5-3}}}{{52 \choose 5}}\\\\&=\frac{\frac{12!}{3!9!} \cdot \frac{40!}{2!38!}}{\frac{52!}{5!47!}}\\\\&=0,066\end{aligned}$$
Sebaran Poisson
Sebaran Poisson digunakan untuk memodelkan peristiwa langka atau memiliki peluang kecil dan seringkali digunakan untuk memodelkan kejadian dengan karakteristik berupa ruang atau waktu.
Contoh kejadian yang dapat dimodelkan dengan sebaran Poisson:
Jika peubah acak $X$ menyebar Poisson dengan rata-rata kejadian sebesar $\lambda$ maka $X \sim Poisson(\lambda)$.
Properti Sebaran Poisson
Fungsi Massa Peluang:
$$P(X=x) = \frac{\lambda^x e^{-\lambda}}{x!}\quad untuk\; x=0,\;1,\;2,\;…$$
dimana $\lambda$ adalah rata-rata banyaknya kejadian dan $e = 2,71828…$ adalah konstanta Euler
Nilai Harapan :
$$E(X) = \lambda$$
Ragam:
$$Var(X) = \lambda$$
Fungsi Pembangkit Momen:
$$M_X(t) = e^{\lambda(e^t-1)}$$
Ilustrasi Sebaran Poisson
- Misalkan banyaknya telepon keluhan yang diterima seorang customer service menyebar Poisson dengan rata-rata 6 telepon per harinya.
- Hitunglah peluang pada 1 hari tertentu seorang CS tidak mendapat satupun telepon keluhan!
- Hitunglah Peluang pada dalam 1 hari tertentu seorang CS menangani 5-7 keluhan!
- Jika pada suatu hari terdapat 3 orang CS yang bekerja dan antara CS saling bebas, hitunglah peluang pada hari tersebut perusahaan menerima lebih dari 20 panggilan keluhan!
Penyelesaian
Diketahui $\lambda=6$ sehingga fungsi massa peluang-nya adalah
$$\begin{aligned}P(X=x) &=\frac{6^x e^{-6}}{x!}\end{aligned}$$
Poin pertama, 1 hari tidak terdapat panggilan telepon keluhan maka $x=0$, sehingga
$$\begin{aligned}P(X=0) &=\frac{6^0 e^{-6}}{0!} = 0,0025\end{aligned}$$
Poin kedua, $5 \leq x\leq 7$, sehingga
$$\begin{aligned}P(5 \leq X \leq 7) &=\sum_{x=5}^7\frac{6^x e^{-6}}{x!} \\\\&= \frac{6^5 e^{-6}}{5!}+\frac{6^6 e^{-6}}{6!}+\frac{6^7 e^{-6}}{7!}\\\\&=0,4589\end{aligned}$$
Poin ketiga,
Misal $X_1, X_2, X_3$ adalah 3 peubah acak identik dan saling bebas yang menyebar $Poisson$ atau $X_1, X_2, X_3 \overset{\text{iid}}{\sim} Poisson(\lambda = 6)$ maka dapat dibuktikan (misalkan menggunakan fungsi pembangkit momen) bahwa $Y = X_1+ X_2 + X_3$ akan menyebar $Poisson$ dengan $\lambda = 3\cdot6 = 18$. Sehingga $Y \sim Poisson(\lambda = 18)$ dan fungsi massa peluang-nya adalah
$$\begin{aligned}P(Y = y) &=\frac{18^y e^{-18}}{y!}\end{aligned}$$
Jadi, peluang jumlah telepon keluhan dari tiga cs $>20$ adalah
$$\begin{aligned}P(Y > 20) &=\sum_{y=21}^\infty{\frac{18^y e^{-18}}{y!}}\\\\&=1-\sum_{y=0}^20{\frac{18^y e^{-18}}{y!}}\\\\&=1 – \left[\frac{18^0e^{-18}}{0!} + \frac{18^1 e^{-18}}{1!} + … + \frac{18^{20} e^{-18}}{20!} \right]\\\\&=0,2693\end{aligned}$$
Kita akan menggunakan bantuan perangkat lunak seperti R untuk menghitungnya.
Berikut ini kode untuk menyelesaikan persoalan pada poin ke-3, sekaligus untuk poin ke-1 dan ke-2:
# titik : P(X = 0) = 0.002478752 p1 <- dpois(x=0, lambda=6) # kumulatif : P(5 <= X <= 7) = P(X <= 7) - P(X <= 4) # hasil : 0.4589233 p2 <- ppois(x=7, lambda=6) - ppois(x=4, lambda=6) # atau p2alt <- dpois(5, 6) + dpois(6, 6) + dpois(7, 6) # kumulatif : P(Y>20) = 1 - P(Y <= 20) # hasil : 0.2692798 p3 <- 1 - ppois(x=20, lambda=18)
- Pada sebuah gudang penyimpanan, dilakukan proses pemilahan buah apel untuk ekspor. Buah yang diekspor adalah yang memiliki bobot lebih dari 250 gram. Berdasarkan informasi perkebunan yang munyuplai buah tersebut, secara rata-rata sekitar 1 persen buah memiliki berat kurang dari 250 gram. Jika saat ini akan dilakukan pemilahan dari 10.000 buah apel, berapakah peluang bahwa apel tidak dikespor tidak lebih dari 50 buah?
Penyelesaian
$\lambda = 0,01\cdot 10.000 = 100$
$$\begin{aligned}P(X = x) &=\frac{100^x e^{-100}}{100!}\end{aligned}$$
Jadi, peluang jumlah apel yang tidak diekspor $<=20$ adalah
$$\begin{aligned}P(X \leq 50) &=\sum_{y=0}^{50}{\frac{100^xe^{-100}}{x!}}\\\\&=\frac{100^0e^{-100}}{0!} + \frac{100^1 e^{-100}}{1!} + … + \frac{100^{50} e^{-100}}{50!} \\\\&\approx0\end{aligned}$$
Berdasarkan hasil perhitungan menggunakan R, peluang memperoleh jumlah apel yang tidak diekspor $\leq 50$ sangat-sangat kecil atau hampir tidak mungkin.
Jika kita iseng hitung dengan cara yang sama, kita bisa peroleh peluang jumlah apel yang tidak diekspor antara 80 hingga 120 apel adalah sekitar 0,95.
# P(X <= 50) = 2.401592e-08 p <- ppois(x=50, lambda=100)
Referensi
- Casella, B. and R.L. Berger. 2002. Statistical Inference, 2nd Edition. Duxbury.
- Hogg, R., Mc Kean, and Craig, A. 2005. Introduction to Mathematical Statistics, 6th Edition. Prentice Hall.
- Djuraidah, A,. STA511 Teori Statistika : Sebaran Peubah Diskret. IPB University.