TS HW2

Theoretical statistics
homework
Author

김보람

Published

March 28, 2023

모든 풀이는 틀릴 수 있움..ㅡ

1번

\(X_1, X_2, X_3\) 의 결합확률밀도함수 \(f(x_1,x_2,x_3)\)를 이용하여

1(1)

  1. \(X_1\)\(X_2\)의 결합확률밀도함수를 구하시오.

\(f_{X_1,X_2}(x_1,x_2) = \sum_{X_3}f_{X_1,X_2,X_3}(x_1,x_2,x_3) = \int_{-\infty}^{\infty} f_{X_1,X_2,X_3}(x_1,x_2,x_3) dx_3\)

1(2)

  1. \(X_3\)의 주변확률밀도함수를 구하시오.

\(f_{X_3}(x_3) = \sum_{X_1} \sum_{X_2}f_{X_1,X_2,X_3}(x_1,x_2,x_3) = \int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f_{X_1,X_2,X_3}(x_1,x_2,x_3) dx_1 dx_2\)

1(3)

  1. \(X_3 = x_3\) 으로 주어져 있을 때 \(X_1\)\(X_2\)의 결합조건부확률밀도함수를 구하시오.

\(f_{X_1,X_2|X_3=x_3}(x_1,x_2|x_3) = \dfrac{f_{X_1,X_2,X_3}(x_1,x_2,x_3)}{f_{X_3}(x_3)}\)

2번

어떤 질병을 치료하기 위하여 개발된 신약으로 치료되는 환자의 비율 \(X\)는 다음과 같은 확률밀도함수를 가지는 확률변수라고 하자.

\[ f_X(x) = 6x(1-x)I(0<x<1)\]

신약 복용한 총 \(n\)명의 환자 중 치료 효과를 보인 환자의 수 \(Y\)는 다음과 같은 확률밀도함수를 가진다고 한다.

\[f_{Y|X}(y|x) = \begin{pmatrix} n \\ y \end{pmatrix} x^y \ (1-x)^{n-y}, y=0,1,\dots,n\]

2(1)

  1. \(Y\)의 주변확률밀도함수를 구하시오.

\(f_X(x)\)는 기하분포 \(f_{Y|X}(y|x)\)는 이항분포이다.

\(f_Y(y)=\int_0^1 6\begin{pmatrix} n \\ y \end{pmatrix} x^{y+1} \ (1-x)^{n-y+1}dx, y=0,1,\dots,n\)

\(B(y+2,n-y+2)=\int_0^1x^{y+1}(1-x)^{n-y+1}dx=\dfrac{(y+2-1)!(n-y+2-1)!}{(y+2+n-y+2-1)!}=\dfrac{(y+1)!(n-y+1)!}{(n+3)!}\)

\(f_Y(y)=6\begin{pmatrix} n \\ y \end{pmatrix}\int_0^1 x^{y+1} \ (1-x)^{n-y+1}dx, y=0,1,\dots,n\)

= \(\dfrac{6n!}{(n-y)!y!}\dfrac{(y+1)!(n-y+1)!}{(n+3)!},y=0,1,\dots,n\)

= \(\dfrac{6(y+1)(n-y+1)}{(n+3)(n+2)(n+1)},y=0,1,\dots,n\)

2(2)

  1. \(Y=y\)일때 \(X\)의 조건부 확률밀도함수를 구하시오.

\(f_{X|Y}(x|y=y)=\dfrac{f_{X,Y}(x,y)}{f_Y(y)}=\dfrac{f_{Y|X}(y|x)f_X(x)}{f_Y(y)}=\dfrac{(n+3)!}{(y+1)!(n-y+1)!}x^{y+1}(1-x)^{n-y+1}, 단(0<x<1, y=0,1,\dots, n)\)

2(3)

  1. \(P(0<X<0.1|Y=n)\)을 구하시오.

=\(\dfrac{P(0<X<0.1,Y=n)}{P(Y=n)}=\dfrac{\int_0^{0.1}f_{X,Y}(x,y=n)dx}{P(Y=n)}=(n+3)(0.1)^{n+2}-(n+2)(0.1)^{n+3}\)

\(\int_0^{0.1}f_{X,Y}(x,y=n)dx= \int_0^{0.1} 6x^{n+1}(1-x)dx=6[\dfrac{(0.1)^{n+2}}{n+2} - \dfrac{(0.1)^{n+3}}{n+3}]\)

\(P(Y=n) = \dfrac{6}{(n+3)(n+2)}\)

3번

확률벡터 \((X,Y)\)는 아래 주어진 결합확률밀도함수를 가진다. \(X\)\(Y\)는 독립인가?

note: 인수분해정리: \(f_{X,Y}(x,y) = g(x)h(y)\) 로 인수분해 할 수 있으면 \(X\),\(Y\)는 서로 독립이다.

3(1)

  1. \(f(x,y) = (\dfrac{1}{α+1} + \dfrac{1}{β+1})(x^α + y^β)I(0<x<1, 0<y<1)\)

쉽게 생각해서 인수분해 안되서 독립아님

\((\dfrac{1}{α+1} + \dfrac{1}{β+1}) = A\) 라고 놓고 계산하자.

\(f_X(x) = \int_{0}^{1}(Ax^α + Ay^β)I(0<y<1)dy = Ax^α + \dfrac{A}{β+1}\)

\(f_Y(y) = \int_{0}^{1}(Ax^α + Ay^β)I(0<x<1)dx = Ay^β + \dfrac{A}{α+1}\)

\(f_X(x)f_Y(y) \neq f(x,y)\)

3(2)

  1. \(f(x,y) = 4y(x-y)e^{-(x+y)}I(0 \leq y \leq x)\)

곱으로 분리 안되서 독립아님. 범위도 분리가 안된당..

3(3)

  1. \(f(x,y) = \dfrac{1}{2x^2y} I(1 \leq x, \dfrac{1}{x} \leq y \leq x)\)

\(f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)dy = \int_{1/x}^{x} \dfrac{1}{2x^2y} I(1 \leq x)dy = \dfrac{1}{2x^2} I(1 \leq x) \int_{1/x}^{x} \dfrac{1}{y}dy = \dfrac{lnx}{x^2}I(1 \leq x)\)

\(f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)dx = \int_{1}^{\infty} \dfrac{1}{2x^2y} I( \dfrac{1}{x}\leq y \leq x)dx = \dfrac{1}{2y} I( \dfrac{1}{x}\leq y \leq x) \int_{1}^{\infty} \dfrac{1}{x^2}dX = \dfrac{1}{2y} I( \dfrac{1}{x}\leq y \leq x)\)

\(f_X(x)f_Y(y) = \dfrac{lnx}{2x^2y} I(1 \leq x, \dfrac{1}{x} \leq y \leq x) \neq f(x,y)\)

note: 범위가 나누어지지 않기 때문에 이것도 독립이 아니다.

3(4)

  1. \(f(x,y) = xyI(0 \leq x \leq 2, 0 \leq y \leq 1)\)

쓰기 귀찮으니까 밑에 생략

\(f(x) = \int f(x,y) dy = \int_{0}^{1} xyI(0 \leq x \leq 2) dy = \dfrac{x}{2}I(0 \leq x \leq 2)\)

\(f(y) = \int f(x,y) dx = \int_{0}^{2} xyI(0 \leq y \leq 1) dx = 2y I(0 \leq y \leq 1)\)

\(f(x)f(y) = f(x,y)\) 이므로 독립이다.

4번

확률변수 \(X\)\(E(X)\)\(E(X^2)\)가 존재하는 경우 그 값을 구하시오.

4(1)

  1. \(f(x) = \dfrac{1}{λ} e^{-x/λ}I(x>0)\)

\(E(X)= \int_{-\infty}^{\infty} xf(x)dx = \int_{0}^{\infty}\dfrac{x}{λ} e^{-x/λ}dx =λ\)

\(E(X^2)= \int_{-\infty}^{\infty} x^2f(x)dx = \int_{0}^{\infty}\dfrac{x^2}{λ} e^{-x/λ}dx = 2λ^2\)

note: 위는 지수분포이며 GAM(1, λ)로 표현할 수 있다.

4(2)

  1. \(f(x) = \dfrac{1}{π(1+x^2)}\)

note: 위는 cauchy분포라고 한다.

\(E(|X|)<\infty\) 이면 기댓값이 존재한다.

코시분포는 기댓값이 존재하지 않는다.

4(3)

  1. \(f(x) = p(1-p)^{x-1}, x=1,2,\dots, 0<p<1\)

위 식은 기하분포의 확률밀도함수이며 \(E(X)= \dfrac{1}{p}, Var(X)= \dfrac{1-p}{p^2}\)

\(E(X) = \sum_{x=1}^{\infty}xf(x) = \sum_{x=1}^{\infty}xp(1-p)^{x-1}\)\((\sum_{x=0}^{\infty} (1-p)^x)'\)을 이용해서 풀이

\(E(X)=\sum_{x=1}^{\infty}xpq^{x-1}\),단 (\(p+q=1\))

=\(\sum_{x=1}^{\infty} p \dfrac{d}{dq}q^x = p \dfrac{d}{dq} \sum_{x=1}^{\infty} q^x= p \dfrac{d}{dq} \dfrac{q}{1-q}= \dfrac{p}{(1-q)^2} = \dfrac{1}{p}\)

\(E(X(X+1))=E(X^2+X)=E(X^2)+E(X)\) 를 이용해서 \(E(X^2)\)을 구하자.

\(E(X(X+1))=\sum_{x=1}^{\infty}x(x+1)pq^{x-1}=p\sum_{x=1}^{\infty} \dfrac{d^2}{dq^2}q^{x+1}=p \dfrac{d^2}{dq^2} \sum_{x=1}^{\infty} q^{x+1} = p \dfrac{d^2}{dq^2} \dfrac{q^2}{1-q} = \dfrac{2}{p^2}\)

\(E(X^2)=E(X(X+1))-E(X)=\dfrac{1+q}{p^2}\)

5번

\(X_1, \dots, X_n\) 은 확률밀도함수 \(f(x) = e^{-x}I(x>0)\) 을 따르는 램덤표본이다.

5(1)

  1. \(E(\sum_{i=1}^{n}X_i)\)

\(E(\sum_{i=1}^{n}X_i) = \sum_{i=1}^{n} E(X_i) = n\)

\(E(X) = \int_{0}^{\infty} xe^{-x} dx = 1\)

\(X_i\)는 랜덤표본이고 기댓값이 모두 1이다.

5(2)

  1. \(P(max_{i=1,\dots,n} X_i \leq x)\)

(Hint: \((max_{i=1,\dots,n} X_i \leq x) = (X_1 \leq x, \dots, X_n \leq x)\)

\(P(max_{i=1,\dots,n} X_i \leq x)=P(X_1\leq x, \dots, X_n \leq x)\)

\(X_i\)는 랜덤표본이므로,

= \(P(X_1 \leq x) \dots P(X_n \leq x)= [P(X_i \leq x)]^n\)

\(P(X_i \leq x)= \int_0^x e^{-x}dx=1-e^{-x}\) 이므로

=\([P(X_i \leq x)]^n=(1-e^{-x})^n\)

5(3)

  1. \(Y_i\)\(X_i > 1\) 일 때 1, 아니면 0의 값을 가진다고 하자. (\(i\)=1,\(\dots\),\(n\))

\(E(\sum_{i=1}^{n}Y_i)\)을 구하시오.

\(Y_i=I(X_i>1)\)

\(E(\sum_{i=1}^{n}Y_i)=\sum_{i=1}^{n}E(Y_i)\) 이다.

\(X_i\)가 랜덤표본이므로 \(Y_i\)도 랜덤표본

\(E(Y_i)=0f_{Y_i}(0)+1f_{Y_i}(1)=\int_1^{\infty}e^{-x}dx=\dfrac{1}{e}\)

\(\sum_{i=1}^{n}E(Y_i)=\dfrac{n}{e}\)

6번

두 확률변수 \(X\)\(Y\)의 결합 확률밀도함수 \(f_{X,Y}(x,y)\)가 다음과 같이 주어져 있다.

x=0 x=1 x=2 x=3
y=0 4/84 18/84 12/84 1/84
y=1 0 6/84 24/84 12/84
y=2 0 0 3/84 4/84

6(1)

  1. \(U\)\(Y=0\)일 때 0, 아니면 1의 값을 가지는 확률변수로 정의하자. \(U\)\(Y\)의 결합확률밀도함수를 구하시오.

\[f_{U,Y}(u,y)\]

u=0 u=1
y=0 35/84 0
y=1 0 42/84
y=2 0 7/84

6(2)

  1. \(P(U=1)\)

\(P(U=1) = \sum_{y}f_{U,Y}(1,y) = f_{U,Y}(1,0) + f_{U,Y}(1,1) + f_{U,Y}(1,2) = \dfrac{49}{84}\)

6(3)

  1. \(P(X>2|U=1)\)

\(P(X>2|U=1) = \dfrac{f_{X,U}(x>2,u=1)}{f_U(u=1)}\)

\(P(X>1, U=1) \to y \neq 0\) 일때 \(X=3\)의 값이므로 \(f_{X,Y}(x=3,y=1)+f_{X,Y}(x=3,y=2)= \dfrac{12}{84} + \dfrac{4}{84} = \dfrac{16}{84}\)

즉, \(\dfrac{f_{X,U}(x>2,u=1)}{f_U(u=1)}=\dfrac{16}{49}\)

6(4)

  1. \(P(X>2|U=0)\)

\(P(X>2|U=0) = \dfrac{f_{X,U}(x>2,u=0)}{f_U(u=0)}\)

\(P(X>2, U=0) \to y = 0\) 일때 \(X=3\)의 값이므로 \(f_{X,Y}(x=3,y=0)= \dfrac{1}{84}\)

즉, \(\dfrac{f_{X,U}(x>2,u=0)}{f_U(u=0)}=\dfrac{1}{35}\)