TS HW5

Theoretical statistics
homework
Author

김보람

Published

April 19, 2023

1번

\((X_1, X_2, X_3)\)\(MULT(n, p_1, p_2, p_3)\)일 때 \(X_1|X_2 = x_2\)의 조건부 확률밀도함수를 구하시오.

\(f_{X_1,X_2,X_3}(x_1,x_2,x_3)=\begin{pmatrix} n \\ x_1 \ x_2\ x_3 \end{pmatrix} p_1^{x_1} p_2^{x_2} p_3^{x_3}\) , 단 \(\begin{pmatrix} 0\leq x_{1}\leq 1 & \\ 0\leq x_{2}\leq 1 & \\ 0\leq x_{3}\leq 1 & \\ x_{1}+x_{2}+x_{3}= & 1 \end{pmatrix}\)

\(X_1\) ~ \(B(n,p_1)\)이므로 \(E(X_1)=np_1, E(X_2)=np_2\)

\(f_{X_1,X_2}(x_1,x_2)=P(X_1=x_1,X_2=x_2)\) 이고

이 실험에서는,

\(=P(X_1=x_1,X_2=x_2,X_3=n-x_1-x_2)\)

\(=\dfrac{n!}{x_1! x_2! (n-x_1 -x_2)!}p_1^{x_1} p_2^{x_2} p_3^{n-x_1-x_2}\)

분모는, 이항분포를 따르므로

\(f_{X_2}(x_2) = \dfrac{n!}{x_2!(n-x_2)!}p_2^{x_2}(1-p_2)^{n-x_2}\)

\(f_{X_1|X_2}(x_1|x_2)=\dfrac{f_{X_1,X_2}(x_1,x_2)}{f_{X_2}(x_2)}\)

\(=\dfrac{\dfrac{n!}{x_1! x_2! (n-x_1 -x_2)!}p_1^{x_1} p_2^{x_2} p_3^{n-x_1-x_2}}{\dfrac{n!}{x_2!(n-x_2)!}p_2^{x_2}(1-p_2)^{n-x_2}}\)

\(=\dfrac{(n-x_2)!}{x_1!(n-x_2-x_1)!} \left( \dfrac{p_{1}}{1-p_{2}}\right) ^{x_{1}} \left( \dfrac{p_{3}}{1-p_{2}}\right) ^{n-x_{2}-x_{1}}\)

\(=\begin{pmatrix} n-x_{2} \\ x_{1} \end{pmatrix} \left( \dfrac{p_{1}}{1-p_{2}}\right) ^{x_{1}} \left( 1-\dfrac{p_{1}}{1-p_{2}}\right) ^{n-x_{2}-x_{1}}\)

즉, \(B(n-x_2, \dfrac{p_1}{1-p_2})\)를 따른다.

2번

\(X\)\(N(µ, σ^2)\)일 때 다음을 구하시오.

(1)

\(Y = |X − µ|\)의 확률밀도함수

\(f_X(x)=\dfrac{1}{\sqrt{2\pi \sigma^2}}e^ {-\frac{(x-\mu)^2}{2\sigma^2}}\)

\(F_Y(y) = P(Y \le y) = P(|X-\mu| \le y) = P(\mu-y \le X \le \mu+y) = F_X(\mu + y) - F_X(\mu - y)\) 이다.

\(f_y(y) = \frac{d}{dy}\{F_X(\mu + y) - F_X(\mu - y) \} = f_X (\mu + y) + f_X(\mu - y) = \frac{2}{\sqrt{2\pi}\sigma} exp(-\frac{y^2}{2\sigma^2}) I(y>0)\)

(2)

\(Y = exp(X)\)의 확률밀도함수

\(g(y) = e^X\) 라 놓자.

\(g^{-1}(y) = lny\)

\(\dfrac{d}{dy}(g^{-1}(y))= \dfrac{1}{y}\)

\(f_Y(y) = f_X(g^{-1}(y))\left| \dfrac{d g^{-1}(y) }{dy} \right| = \dfrac{1}{y\sqrt{2\pi\sigma^2}}e^{-\frac{(lny - \mu)^2}{2\sigma^2}}\)

\(= \dfrac{1}{y\sqrt{2\pi\sigma^2}}e^{-\frac{(lny - \mu)^2}{2\sigma^2}}I(y>0)\)

3번

한 개의 전자 시스템에 두 가지 다른 유형의 구성 요소가 각각 하나씩 공동으로 작동하고 있다. \(Y_1\)\(Y_2\)는 각각 유형 I 및 유형 II의 구성 요소의 수명 길이를 나타낸다고 한다. \(Y_1\)\(Y_2\) 의 결합확률밀도함수가 \[f_{Y_1,Y_2}(y_1, y_2) = \dfrac{1}{8}y_1e^{−(y_1+y_2)/2}I(y_1 > 0, y_2 > 0)\] 로 주어졌을 때 다음을 구하시오. (측정값은 백 시간 단위)

\[f_{Y_1,Y_2}(y_1, y_2) = \dfrac{1}{8}y_1e^{−y_1/2}e^{-y_2/2}I(y_1 > 0, y_2 > 0)\]

(1)

\(Z = Y_1 + Y_2\)의 확률분포

\(Y_1\)\(Y_2\)는 서로 독립이므로 합성곱 이용해보면, 범위는 \(0<y_1<z\)이고

\(f_Z(z)=\int_{-\infty}^\infty f_{Y_2}(z-y_1) f_{Y_1}(y_1) dy_1=\dfrac{e^{-2/z}}{8}\int_0^z y_1 dy_1=\dfrac{ze^{-2/z}}{8}I(z>0)\)

교수님 풀이

\(f_Z(z) = \dfrac{d}{dz}F_Z(z)\)

\(F_Z(z) = P(Z \leq z) = P(Y_1 + Y_2 \leq z)\) 이므로 \((Y_1, Y_2)\)의 사건

\(\int\int_{y_1+y_2 \leq z} f_{Y_1,Y_2}(y_1,y_2)dy_1dy_2\)

=\(\int\int_{y_1+y_2 \leq z} \dfrac{1}{8}y_1e^{-(y_1+y_2)/2}I(y_1>0)I(y_2>0)dy_1dy_2\)

=\(\int_0^z \dfrac{1}{8}y_1 e^{-\frac{y_1}{2}}\int_0^{z-y_1}e^{-\frac{y_2}{2}}dy_2dy_1\)

=\(\int_0^z \dfrac{1}{8}y_1 e^{-\frac{y_1}{2}} \left[ -2e^{-\frac{y^2}{2}} \right]_0^{z-y_1}dy_1\)

=\(\int_0^z \dfrac{1}{8}y_1 e^{-\frac{y_1}{2}} 2(1-e^{-\frac{z-y_1}{2}})dy_1\)

=\(\int_0^z \dfrac{1}{4}y_1 \left( e^{-\frac{y_1}{2}}-e^{-\frac{z}{2}} \right)dy_1\)

(2)

\(U = Y_2/Y_1\)\(V = Y_1\)의 결합확률밀도함수

\(U.V\)를 연립하면 \(Y_1=V, Y_2=UV\) 이다.

\(|J|=\begin{vmatrix} 0 & 1 \\ v & u \end{vmatrix}=|-v|=v\)

\(f_{U,V}(u,v) = f_{Y_1,Y_2}(y_1,y_2)|J| = f_{Y_1,Y_2}(v,uv)v =\dfrac{1}{8} v^2 e^{-(v+uv)/2}I(u>0,v>0)\)

(3)

\((2)\)의 결과를 이용하여 \(U\)의 주변확률밀도함수

\(f_U(u)=\int_{-\infty}^{\infty} f_{U,V}(u,v) dv = \int_{0}^{\infty} \dfrac{1}{8} v^2 e^{-(v+uv)/2}I(u>0)dv\)

\(\dfrac{v(u+1)}{2}=t\)치환, \(v=\dfrac{2t}{u+1}, dv=\dfrac{2}{u+1}dt\)

=\(\int_{-\infty}^\infty \dfrac{1}{8} (\dfrac{2}{u+1})^3 t^2 e^{-t} I(u>0)I(t>0)dt\)

=\(\dfrac{1}{8}(\dfrac{2}{u+1})^3I(u>0) \int_0^\infty t^2e^{-t}dt\)

\(\because \int_0^\infty t^2e^{-t}dt=\Gamma(3)=2!=2\)

=\(\dfrac{2}{(u+1)^3}I(u>0)\)

4번

두 명의 경계병이 1마일 길이의 도로를 순찰하도록 지시받았다고 한다. 경계병은 도로 상에서 서로 독립적으로 선택된 지점으로 파견되는데, 경계병이 할당된 위치에 도달할 때 서로 1/2 마일 이내에 있을 확률을 구하시오.

\(f_{X}(x)=I(0<x<1), f_{Y}(y)=I(0<y<1)\)

\(X\) \(Y\)는 서로 독립이므로, \(f_{X,Y}(x,y)=I(0<x<1)I(0<y<1)\)이다.

\(P(|X-Y|<0.5)=P(-0.5<X-Y<0.5)\)를 구하자.

\(Z_1=X-Y, Z_2=Y\)로 놓으면 \(X=Z_1+Z_2, Y=Z_2\)

\(g(z_1, z_2)=|J|f(x,y)=f_X(z_1+z_2)f_Y(z_2)=1\)

확률밀도함수 \(g(z_1)=\begin{cases}\int _{-z_{1}}^{1}dz_{2}=1+z_{1}\left( -1 <z_{1} <0\right) \\ \int ^{1-z_{1}}_{0}dz_{2}=1-z_{1}\left( 0\leq z_{1} <1\right) \end{cases}\)

\(P(|X-Y|<0.5)=P(-0.5<X-Y<0.5)=F_{g(z_1)}(0.5)-F_{g(z_1)}(-0.5)\)

누적분포함수 \(F_{g(z_1)}=\begin{cases}z_{1}+\dfrac{1}{2}z_{1}^{2}\left( -1 <z_{1} <0\right) \\ z_{1}-\dfrac{1}{2}z_{1}^{2}\left( 0\leq z_{1}<1\right) \end{cases}\)

\(=F_{g(z_1)}(0.5)-F_{g(z_1)}(-0.5)=1-(0.5)^2=0.75\)

5번

\(X\)\(Y\)는 서로 독립이고 동일한 기하분포를 따른다고 할 때 다음을 구하시오.

\(f_X(x)=p(1-p)^{x-1}\), \(f_Y(y)=p(1-p)^{y-1}\)

(3)

\(U = X − Y\) 라고 할 때 \(U\)의 확률밀도함수

\(U=X-Y, V=Y\)이면 \(X=U+V, Y=V, |J|=1\)

\(f_{U,V}(u,v)=p^2(1-p)^{u+2v-2}\)

\(f_U(u)=\sum_v f_{U,V}(u,v) = \sum_{v=1}^\infty (1-p)^u [p(1-p)^{v-1}]^2 = \dfrac{p}{2-p}(1-p)^u\)

\(u\)의 범위가 \((-\infty, \infty)\)이고, 위 식은 \(u>0\)인 경우에만 성립한다.

만약 \(u\leq0\)인 경우를 생각하면

\(\begin{aligned}\sum \sum \\ \begin{pmatrix} x=y+n \\ y=1.2,\dots \\ x\geq 1 \end{pmatrix}\end{aligned} = \sum_{y=1-u}^\infty p^2 (1-p)^{2y+u-2} = p^2 \dfrac{(1-p)^{-u}}{1-(1-p)^2}=\dfrac{p}{(2-p)(1-p)^u}\)

(1)

\(P (X = Y )\)

\(P (X = Y )=P(X-Y=0)=P(U=0)=\dfrac{p}{2-p}\)

교수님 풀이

\(f_{X,Y}(x,y) = \sum \sum_{x=y}f_{X,Y}(x,y)= \begin{aligned}\sum \sum \\ \begin{pmatrix} x=y \\ x=1,2,\dots \\ y=1,2,\dots \end{pmatrix}\end{aligned}p^2(1-p)^{x+y-2}=\sum_{k=1}^\infty (1-p)^{2k-2}=\dfrac{p}{2-p}\)

(2)

\(P (X − Y = 1)\)

\(P (X − Y = 1)=P(U=1)=\dfrac{p(1-p)}{2-p}\)

교수님 풀이

\(f_{X,Y}(x,y) = \sum \sum_{x-y=1}f_{X,Y}(x,y)= \begin{aligned}\sum \sum \\ \begin{pmatrix} x-y=1 \\ x=1,2,\dots \\ y=1,2,\dots \end{pmatrix}\end{aligned}p^2(1-p)^{x+y-2}=\sum_{y=1}^\infty (1-p)^{2y-1}=\dfrac{p(1-p)}{2-p}\)

6번

어떤 합성물의 알코올 비율 \(Y\) 는 다음 확률밀도함수를 따르는 확률변수라고 하자. \[f(y) = 20y^3(1 − y)I(0 < y < 1)\] 그 합성물의 판매가는 알코올 함량에 따라 결정된다고 한다. \(1/3 < y < 2/3\)이면 1갤런 당 \(C_1\)달러, 그렇지 않으면 \(C_2\)달러에 판매된다. 생산비가 갤런 당 \(C_3\)달러라면, 갤런당 판매수익의 확률분포를 구하시오

\(Y\) ~ \(BETA(4,2)\)이고 판매수익을 \(X\)라고 놓으면

\(P(X=C_1Y-C_3) \to P(0< y \leq 1/3) = \int_0^{1/3} 20y^3(1-y)dy = \frac{11}{243}\)

\(P(X=C_1Y-C_3) \to P(2/3 \leq y < 1) = \int_{2/3}^1 20y^3(1-y)dy = \frac{131}{243}\)

\(P(X=C_2Y-C_3) \to P(1/3 < y < 2/3) = \int_{1/3}^{3/2} 20y^3(1-y)dy = \frac{101}{243}\)

교수님 풀이

\(X=\begin{cases}C_{1}-C_{3},\frac{1}{3} <y <\frac{2}{3}\\ C_{2}-C_{3},0,w\end{cases}\)

\(P(X=C_1-C_3)=P(1/3 < y < 2/3)\)

\(P(X=C_2-C_3)=1-P(1/3 < y < 2/3)\)