모든 풀이는 틀릴 수 있움
1번
\(B(a,b) = \dfrac{γ(a)γ(b)}{γ(a+b)}\) 임을 보이시오
\(γ(a)γ(b)=\int_0^\infty x^{a-1}e^{-x} dx \int_0^\infty y^{b-1}e^{-y}dy\)
= \(\int_0^\infty \int_0^\infty x^{a-1} y^{b-1} e^{-(x+y)} dxdy\)
\(x+y=g\) 로 치환, \(dy=dg\)
= \(\int_0^\infty \int_0^g x^{a-1} (g-x)^{b-1} e^{-g} dxdg\)
\(t=xg\)치환, \(dt=\dfrac{1}{g} dx\)
= \(\int_0^\infty \int_0^1 (tg)^{a-1}(g-tg)^{b-1}e^{-g}gdtdy\)
=\(\int_0^1 t^{a-1}(1-t)^{b-1}dt \int_0^\infty g^{(a+b-1)}e^{-g}dg\)
=\(B(a,b)γ(a+b)\)
s.t \(B(a,b) = \dfrac{γ(a)γ(b)}{γ(a+b)}\)
2번
확률변수 \(X\)와 \(Y\)가 \(f(x,y)=(x+y)I(0 \leq x \leq 1)I(0 \leq y \leq1)\)를 따를 때 확률변수 \(X\)와 \(Y\)의 상관계수를 구하시오.
\(Corr(X,Y)=\dfrac{Cov(X,Y)}{SD(X)SD(Y)}\)
\(Cov(X,Y)=E(XY)-E(X)E(Y)\)
\(E(XY)=\int\int xy f(x,y)dxdy = \int_0^1 \int_0^1 xy(x+y) dxdy = \int_0^1 ( \dfrac{1}{3} y + \dfrac{1}{2} y^2 ) dy = \dfrac{1}{3}\)
\(f(x)= \int f(x,y)dy = x+\dfrac{1}{2} I(0 \leq x \leq 1)\)
\(f(y)=\int f(x,y)dx = y+\dfrac{1}{2} I(0 \leq y \leq 1)\)
\(E(X)=\int xf(x)dx = \int_0^1 (x^2+\dfrac{x}{2}) dx=\dfrac{7}{12}\)
\(E(Y)=\int yf(y)dy = \int_0^1 (y^2+\dfrac{y}{2}) dy=\dfrac{7}{12}\)
\(Cov(X,Y)=E(XY)-E(X)E(Y)=\dfrac{1}{3}-(\dfrac{7}{12})^2=\dfrac{-1}{144}\)
\(E(X^2)=\int x^2 f(x)dx = \int_0^1 (x^3 + \dfrac{x^2}{2}) dx=\dfrac{5}{12}\)
\(E(Y^2)=\int y^2 f(y)dy = \int_0^1 (y^3 + \dfrac{y^2}{2}) dy=\dfrac{5}{12}\)
\(Var(X)=E(X^2)-[E(X)]^2=\dfrac{5}{12} - (\dfrac{7}{12})^2 = \dfrac{11}{144}, SD(X)=\sqrt{Var(X)}=\sqrt{\dfrac{11}{144}}\)
\(Var(Y)=E(Y^2)-[E(Y)]^2=\dfrac{5}{12} - (\dfrac{7}{12})^2 = \dfrac{11}{144}, SD(Y)=\sqrt{Var(Y)}=\sqrt{\dfrac{11}{144}}\)
\(Corr(X,Y)=\dfrac{Cov(X,Y)}{SD(X)SD(Y)}=\dfrac{-1}{11}\)
3번
\(E(X_i)= μ, E(X_i^2)= σ^2, i=1,\dots,n\)인 확률 변수 \(X_1, \dots, X_n\)과 상수 \(a_1, \dots, a_n\)에 대하여 \(U= \sum_{i=1}^n a_i X_i\)라 하자.
문제오류!! \(E(X_i^2)=\sigma^2\)이 아니라 \(Var(X_i)=\sigma^2\)
(1)
\(E(U)= μ\)를 만족하기 위한 상수 \(a_1, \dots, a_n\)에 대한 조건은?
\(E(U)=E(\sum_{i=1}^n a_i X_i)= E(a_1X_1)+ \dots + E(a_nX_n)= μ(a_1 + \dots + a_n)=μ\)
s.t \((a_1 + \dots + a_n)=1\)
(2)
\(Var(U)=\sum_{i=1}^n a_i^2 Var(X_i) + 2 \sum\sum_{i<j} a_i a_j Cov(X_i, X_j)\)임을 보이시오.
만약 \(X_i\) 가 랜덤분포라면..
\(Var(U)=Var(\sum_{i=1}^n a_i X_i)= Var(a_1X_1)+ \dots + Var(a_nX_n)= a_1^2Var(X_1)+\dots+a_n^2Var(X_n)=\sum a_i^2 Var(X_i)\)
\(n=2\)인 경우를 고려
\(Var(a_1X_1+a_2X_2)=E(a_1X_1+a_2X_2)^2 - [E(a_1X_1)+E(a_2X_2)]^2\)
= \(E(a_1^2X_1^2+ a_2^2X_2^2 + 2a_1a_2X_1X_2) - [E(a_1X_1)]^2 -[E(a_2X_2)]^2 -2E(a_1X_1)E(a_2X_2)\)
= \(E(a_1^2X_1^2)+E(a_2^2X_2^2)+ 2a_1a_2E(X_1X_2) - [E(a_1X_1)]^2 -[E(a_2X_2)]^2 -2E(a_1X_1)E(a_2X_2)\)
= \(E(a_1^2X_1^2)- [E(a_1X_1)]^2+E(a_2^2X_2^2)-[E(a_2X_2)]^2 + 2a_1a_2E(X_1X_2)-2a_1a_2E(X_1)E(X_2)\)
=\(Var(a_1X_1)+Var(a_2X_2)+2a_1a_2Cov(X_1,X_2)\)
수학적 귀납법을 통해 그 이후도 성립
교수님 풀이
\(Var(U)=E[(u-E(u))^2]\)
\(E(u)=\sum a_i \mu\) 이므로
\(u-E(u) = \sum a_iX_i - \sum a_i \mu = \sum a_i(X_i - \mu)\)
\(E[(u-E(u))^2] = E(\sum a_i(X_i - \mu))^2 = E(\sum a_i^2(X_i-\mu)^2 + \sum \sum a_i (X_i-\mu) a_j (X_j-\mu))\)
\(=\sum a_i^2 E(X_i-\mu)^2 + 2\sum \sum a_i a_j E(X_i-\mu)E(X_j-\mu)\)
\(= \sum_{i=1}^n a_i^2 Var(X_i) + 2 \sum\sum_{i<j} a_i a_j Cov(X_i, X_j)\)
(3) 확인해보쟈
\(X_1, \dots, X_n\)이 서로 독립인 확률변수라고 할 때 \(E(U)=μ\)을 만족하면서 \(Var(U)\)를 최소로 하는 상수 \(a_1,\dots,a_n\)에 대한 조건은?
\(X_i\)가 서로 독립이면 \(Cov(X_i,X_j)=0\)이다.
만약 \(X_i\) 가 랜덤분포라면..
\(Var(U)=Var(\sum_{i=1}^n a_i X_i)= Var(a_1X_1)+ \dots + Var(a_nX_n)= a_1^2Var(X_1)+\dots+a_n^2Var(X_n)=\sum a_i^2 Var(X_i)\)
\((σ^2 - μ^2) \sum a_i^2\)
위식이 최소가 되기 위해서는 \(\sum a_i^2\)이 최소가 되어야 한다.
코시 슈바츠르 부등식을 이용하여,
코시 슈차르츠 부등식: \((a^2+b^2)(x^2+y^2) > (ax+by)^2\)
\((a_1^2 + \dots + a_n^2)(1^2+ \dots + 1^2) \geq (a_1+ \dots a_n)^2\)
\(n \sum a_i^2 \geq μ^2\)
\(\sum a_i^2 \geq \dfrac{μ^2}{n}\)
문제오류!! \(E(X_i^2)=\sigma^2\)이 아니라 \(Var(X_i)=\sigma^2\)
\(Var(U)=\sum a_i^2 \sigma^2\)을 최소로 하는 \(a_1, \dots, a_n\)을 구하자.
라그랑쥬(Lagrange)승수법 이용
\(g(a_1,\dots,a_n,\lambda) = \sum_{i=1}^n a_i^2 \sigma^2 + \lambda(\sum a_i - 1)\)
제약조건을 \(\lambda\)로 넣는다.
\(\begin{cases}\dfrac{\partial g}{\partial a_{i}}=0(i=1,2,\dots)\\ \dfrac{\partial g}{\partial \lambda}=0\end{cases}\)인 것을 찾자
\(2a_i \sigma^2 + \lambda=0 (i=1,\dots,n)\)
\(a_i=-\dfrac{\lambda}{2\sigma^2}\)
\(\sum a_i - 1 = 0\)
\(1=-\dfrac{\lambda}{2\sigma^2}\)
\(\lambda = -\dfrac{2\sigma^2}{n}\)
\(\therefore a_i=\dfrac{1}{n}\)
4번
확률변수 \(X\)와 \(Y\)가 서로 독립일 때 다음 중 참인 것은?
(1)
\(E(X-Y)=E(X)-E(Y)\)
T
(2)
\(Var(X-Y) = Var(X) - Var(Y)\)
F(\(Var(X-Y) = Var(X) + Var(Y)\))
(3)
\(Cov(X+Y,X) = Var(X)\)
T
\(Cov(X+Y,X)=E((X+Y)X)-E(X+Y)E(X)=E(X^2+YX)-(E(X)+E(Y))E(X)=E(X^2)+E(YX)-[E(X)]^2-E(Y)E(X)=E(X^2)-[E(X)]^2=Var(X)\)
(4)
\(Cov(X+Y,X-Y) = Var(X)+Var(Y)\)
F(\(Var(X)-Var(Y)\))
\(Cov(X+Y,X-Y)=E((X+Y)(X-Y))-E(X+Y)E(X-Y)=E(X^2+YX-XY-Y^2)-(E(X)+E(Y))(E(X)-E(Y))=Var(X)-Var(Y)\)
(5)
\(Corr(X+Y,Y)=\dfrac{SD(Y)}{SD(X)}\)
F
\(Corr(X+Y,Y)=\dfrac{Cov(X+Y,Y)}{SD(X+Y)SD(Y)}=\dfrac{Var(Y)}{\sqrt{Var(X)+Var(Y)}SD(Y)}=\dfrac{SD(Y)}{\sqrt{Var(X)+Var(Y)}}\)
5번
마코프 부등식: 확률변수 \(X\)는 함수 \(u(x)>0\)와 임의의 상수 \(c>0\)에 대하여
\(P[u(X) \geq c] \leq \dfrac{E[u(X)]}{c}\) 가 성립함을 보이시오.
\(A={x:u(x) \geq c}\) 인 A에 대하여
\(E[u(X)]=\int_{-\infty}^{\infty} u(x)f(x)dx = \int_A u(x)f(x)dx + \int_{A^c} u(x)f(x)dx \geq \int_A u(x)f(x)dx \geq \int_A cf(x)dx = cP[X \in A] = cP[u(X) \geq c]\)
6번
Cauchy-Schwarz inequality: \(E(X^2) < \infty, E(Y^2) < \infty\)인 두 확률변수 \(X\)와 \(Y\)에 대해서 \([E(XY)]^2 \leq E(X^2)E(Y^2)\)이 성립함을 보이시오.
\(h(t)=E[(tX-Y)^2]=E(X^2)t^2-2E(XY)t+E(Y^2) \geq 0\) 을 만족시키기 위한 판별식 \(D\)를 구하면,
\(D=4[E(XY)]^2-4E(X^2)E(Y^2) \leq 0\)
s.t \([E(XY)]^2 \leq E(X^2)E(Y^2)\)
7번
두 확률변수 \(X\)와 \(Y\)가 \(f_{X,Y}(x,y)=x^2e^{-x(y+1)}I(x>0,y>0)\)을 따를 때 \(Var(Y|X=x)\)을 구하시오.
\(f_X(x)=\int_{-\infty}^\infty f_{X,Y}(x,y)dy = \int_0^\infty x^2e^{-x(y+1)}I(x>0)dy= x^2e^{-x}I(x>0)\int_0^\infty e^{-xy} dy= xe^{-x}I(x>0)\)
위식은 \(GAM(2,1)\)이다.
\(f_{Y|X}(y|x) = \dfrac{f_{X,Y}(x,y)}{f_{X}(x)}=\dfrac{x^2e^{-x(y+1)}I(x>0,y>0)}{xe^{-x}I(x>0)}=xe^{-xy}I(y>0)\)
위식은 \(GAM(1,\dfrac{1}{x})=EXP(\dfrac{1}{x})\)이다.
\(E(Y|X=x)=\int_{-\infty}^\infty yf_{Y|X}(y|x)dy=\int_0^\infty xye^{-xy}dy=\dfrac{1}{x}\)
\(E(Y^2|X=x)=\int_{-\infty}^\infty y^2f_{Y|X}(y|x)dy=\int_0^\infty xy^2e^{-xy}dy=\dfrac{2}{x^2}\)
\(Var(Y|X)=E(Y^2|X)-[E(Y|X)]^2=\dfrac{1}{x^2}\)
8번
확률변수들 \(X_i(i=1,\dots,n)\)는 서로 독립이며 동일한 확률밀도함수 \(f(x)=xe^{-x}I(x>0)\)을 따른다고 하자.
위식은 \(GAM(2,1)\)이다.
(1)
확률변수 \(X_i\)의 적률생성함수를 구하라.
\(M_X(t)=E(e^{tX})=\int_{-\infty}^\infty e^{tx}xe^{-x}I(x>0)dx=\int_0^\infty xe^{x(t-1)}dx=\dfrac{1}{(t-1)^2}\)
\(\dfrac{1}{(1-t)^2} \ for (1-t)>0\)
(2)
(1)의 결과를 이용하여 확률변수 \(X_i\)의 분산을 구하라
\(Var(X)=E(X^2)-[E(X)]^2\)
\(M_X^{(1)}(t=0)=E(X), M_X^{(2)}(t=0)=E(X^2)\) 이용
\(M_X^{(1)}(t)=\dfrac{-2}{(t-1)^3}, M_X^{(1)}(t=0)=2\)
\(\dfrac{-2}{(1-t)^3}\)
\(M_X^{(2)}(t)=\dfrac{6}{(t-1)^4}, M_X^{(2)}(t=0)=6\)
\(Var(X)=E(X^2)-[E(X)]^2=6-4=2\)
(3)
(1)의 결과를 이용하여 확률변수 \(\sum_{i=1}^n X_i\)의 적률생성함수를 구하라.
확률변수 \(X_i\)가 랜덤분포이므로 \(U=\sum X_i\)일때 적률생성함수는
\(M_U(t)=M_{X_1}(t)M_{X_2}(t) \dots M_{X_n}(t)\) 이다.
\(M_U(t)= \dfrac{1}{(t-1)^{2n}}\)
(4)
(3)의 결과를 이용하여 확률변수 \(Y=\sum_{i=1}^n 2X_i\)의 적률생성함수를 구하라.
\(M_Y(t)=E(e^{tY})=E(e^{2tu})=M_u(2t)=(\dfrac{1}{1-2t})^{2n}\) 이다.
위 결과는 \(GAM(2n,2)\)의 mgf이다, 즉 \(Y\)~\(GAM(2n,2)\)이다.
\(GAM(2n,2)\)은 자유도가 4n인 카이제곱을 따른다.
9번
어떤 질병을 치료하기 위하여 개발된 신약으로 치료되는 환자의 비율 \(X\)는 다음과 같은 확률밀도함수를 가지는 확률변수라고 하자.
\[ f_X(x) = 6x(1-x)I(0<x<1)\]
신약 복용한 총 \(n\)명의 환자 중 치료 효과를 보인 환자의 수 \(Y\)는 다음과 같은 확률밀도함수를 가진다고 한다.
\[f_{Y|X}(y|x) = \begin{pmatrix} n \\ y \end{pmatrix} x^y \ (1-x)^{n-y}, y=0,1,\dots,n\]
다음을 구하시오.
\(Var(Y)\)
\(Var(Y)=E(Y^2)-[E(Y)]^2\)
(2)
\(Var(Y|X=x)\)
\(Var(Y|X=x) = E(Y^2|x)-[E(Y|x)]^2\)
\(E(Y^2|x)=\sum y^2 f_{X|Y}(x|y) = \sum_0^n y^2 \begin{pmatrix} n \\ y \end{pmatrix} x^y \ (1-x)^{n-y}\)
\(f_{X|Y}(x|y)\)는 이항분포이며 기댓값은 \(nx\), 분산은 \(nx(1-x)\)이다.
\(E(Y|X)=nx, Var(Y|X)=nx(1-x)\)
계산이 너무 복잡해..
(1)
이중기댓값 정의를 이용하여 \(E(Y)=E[E(Y|X)]\) 풀이
\(Var(Y)=Var(E(Y|X))+E(Var(Y|X))\)
\(=Var(nX)+E(nX(1-X))\)
\(=n^2 Var(X) + nE(X) - nE(X^2)\)
\(=n^2/20 + n/2 - 3n/10\)
\(=n^2/20 + n/5\)