「数学の基礎」の編集履歴(バックアップ)一覧はこちら
「数学の基礎」(2008/09/11 (木) 15:16:27) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
第1章 確率の基礎概念
1.順列と組み合わせ
順列:$$n$$個の中から$$k$$個を並べる並べ方。$$_{n}P_k$$
$$_{n}P_k=n(n-1)(n-2) \cdots (n-k+1)=\frac{n!}{(n-k)!}$$
組み合わせ:$$n$$個の中から$$k$$個を選ぶ選び方。$$_nC_k$$
$$_nC_k=\frac{n(n-1)(n-2) \cdots (n-k+1)}{k!}=\frac{n!(n-k)!}{k!}=\frac{_nP_k}{k!}$$
ここで、$$0!=1, \ _nC_0= \ _0C_0=1$$と「約束」する。
$$_nC_k$$を2項係数と呼ぶ
2項係数の性質
$$_nC_k= \ _nC_{n-k}$$
$$_{n}C_k= \ _{n-1}C_{k-1}+_{n-1}C_k$$
なお、$$_nC_k$$のかわりに、$$\left( \begin{array}{c} n \\ k \\ \end{array} \right) $$と書くこともある。
また、$$x$$が一般の実数について$$\left( \begin{array}{c} x \\ k \\ \end{array} \right) $$を考えることができる。つまり、
$$\left( \begin{array}{c} x \\ k \\ \end{array} \right) =\frac{x(x-1)(x-2) \cdots (x-k+1)}{k!}$$
と定義する。
2.2項定理
$$(a+b)^n=\sum_{k=0}^{n} _nC_k a^{n-k}b^k$$
3.確率の基本公理
$$P(A)$$で事象$$A$$が起こる確率を表す。
(1)独立と排反
$$A$$と$$B$$が独立とは$$P(A \cap B)=P(A) \cdot P(B)$$が成り立つこと。
$$A$$と$$B$$が排反とは、$$A \cap B=\emptyset$$(空集合)であること。
$$A$$と$$B$$が排反のとき、$$P(A \cup B)=P(A)+P(B)$$が成り立つ
(2)余事象
事象$$A$$に対して、$$A$$が起こらない事象を$$\overline{A}$$とあらわす。
(3)加法定理
$$P(A \cup B)=P(A)+P(B)-P(A \cap B)$$
$$P(A \cup B \cup C)=P(A)+P(B)+P(C)-P(A \cap B)-P(B \cap C)-P(B \cap C)+P(A \cap B \cap C)
4.条件付確率とベイズの定理
(1)条件付確率
事象$$A$$のもとで事象$$B$$が発生する確率を$$P(B|A)$$または$$P_{A}(B)$$と表記し、「$$A$$のもとで$$B$$が起こる条件付確率」という。
$$P(B|A)=P(A \cap B)P(A)$$
$$A$$と$$B$$が独立ならば、$$P(B|A)=P(B)$$
(2)ベイズの定理
事象$$X$$の生じる原因として$$A,B,C$$の3つだけがあり、$$A,B,C$$はそれぞれ排反とする。いま$$X$$が生じたときにその原因が$$A$$である確率$$P(A|X)$$は、
$$P(A|X)=P(X \cap A)P(X)$$
$$=\frac{P(X|A)P(A)}{P(X|A)P(A)+P(X|B)P(B)+P(X|C)P(C)}$$
(今、3つとしたが、それ以上の場合でも同様の式になる。)
第2章 確率変数
1.離散型確率変数
$$P(X=x)=a_x$$のような形で表される。
$$f(x)=P(X=x)$$のことを確率関数と呼ぶ
2.連続型確率変数
$$P(a \le X \le b)=\int_a^b f(x)dx$$
のような形で表される。
$$f(x)$$のことを確率密度関数と呼ぶ。
確率密度関数の性質
$$f(x)$$を(連続型)確率変数の確率密度関数とするとき、
(a)$$f(x) \ge 0$$
(b)$$\int_{-\infty}^{\infty} f(x)dx=1$$
一方$$F(x)=P(X \le x)=\int_{-\infty}^{x} f(t)dt$$を確率分布関数と呼ぶ。
確率密度関数$$f(x)$$と確率分布関数$$F(x)$$の間には$$F'(x)=f(x)$$の関係がある。
また、$$F(x)$$は(広義の)単調増加関数。
つまり、$$x_1<x_2 \Rightarrow F(x_1) \le F(x_2)$$
さらに$$F(-\infty)=0,F(\infty)=1$$
3.確率変数の独立
$$X$$と$$Y$$が独立とは
$$P(X=m,Y=n)=P(X=m) \cdot P(Y=n)$$(離散型)
$$P(a \le X \le b,c \le Y \le d)=P(a \le X \le b) \cdot P(c \le Y \le d)$$(連続型)
4.期待値(平均)と分散
$$E(X)=\sum x \cdot a_x$$(離散型)
$$E(X)=\int xf(x)dx$$(連続型)
を$$X$$の期待値(平均)という。
$$g(x)$$を$$x$$の関数とするとき、$$g(X)$$の平均として、
$$E(g(X))=\sum g(x)ax$$(離散型)
$$E(g(X))=\int g(x)f(x)dx$$(連続型)
が定義できる。
特に、$$g(x)=(x-\mu )^2 \ (\mu =E(X))$$としたとき、
つまり、$$E((X-\mu )^2)$$を$$V(X)$$とあらわし、$$X$$の分散という。
実際には、$$V(X)=E(X^2)-\{ E(X) \} ^2$$
で計算することがほとんど。
また、$$sigma (X)=\sqrt{V(X)}$$を$$X$$の標準偏差という。
5.期待値と分散の性質
$$E(X+Y)=E(X)+E(Y)$$
$$E(aX+b)=aE(X)$$($$a,b$$は$$X$$と無関係な定数)
$$V(aX+b)=a^2 V(X)$$($$a,b$$は$$X$$と無関係な定数)
さらに$$X$$と$$Y$$が独立の場合は、
$$E(f(X)g(Y))=E(f(X))E(g(Y))$$
特に
$$E(XY)=E(X)E(Y)$$
$$V(X+Y)=V(X)+V(Y)$$
6.積率母関数
確率変数$$X$$に対し、
積率母関数$$m_X (t)=E(e^{tX})$$
つまり、
$$m_X(t)=\sum e^{tx}a_x$$(離散型)
$$m_X (t)=\int e^{tx}f(x)dx$$(連続型)
$$X$$は省略されることも多い。
7.積率母関数の性質
$$X$$と$$Y$$が独立$$\Leftrightarrow m_{X+Y}(t)=m_X(t)m_Y(t)$$
$$mX(t)=mY(t)\Leftrightarrow X=Y$$(積率母関数の一意性)
$$E(X^n)=m_X^{(n)}(0)$$
($$X$$の$$n$$次のモーメントは積率母関数に0を代入したものに等しい)
8.離散的確率変数の例
(1)2項分布
$$Bi(n,p)$$ ($$n$$は正の整数、$$0<p<1$$)
$$P(X=x)=\ _nC_x \cdot p^xq^{n-x}(q=1-p \, , \, x=0,1,2, \cdots ,n)$$
成功確率$$p$$のベルヌーイ試行を$$n$$回行ったときの成功回数
期待値$$E(X)=np$$、分散$$V(X)=npq$$
積率母関数$$(p \cdot e^t+q)^n$$
(2)ポワソン分布
$$Po(\lambda) \ (\lambda>0)$$
$$P(X=x)=\frac{\lambda^x \cdot e^{-\lambda}}{x!} \ (x=0,1,2, \cdots)$$
単位時間で平均$$\lambda$$回発生する事象が、単位時間内で発生する回数
2項分布で$$np=\lambda$$としながら、$$n \to \infty$$としたもの。
期待値$$E(X)=\lambda$$、分散$$V(X)=\lambda$$
積率母関数$$\exp(\lambda \cdot e^t-\lambda)$$
(3)幾何分布
$$G(p) \ (0<p<1)$$
$$P(X=x)=p \cdot q^x(q=1-p, \ x=0,1,2, \cdots )$$
成功確率$$p$$のベルヌーイ試行を繰り返すときに初めて成功するまでに失敗する回数。
期待値$$E(X)=\frac{q}{p}$$、分散$$V(X)=\frac{q}{p^2}$$
積率母関数$$\frac{p}{1-q \cdot e^t}$$
(4)負の2項分布
$$NB(k,p) \ (0<k<\infty,0<p<1)$$
$$P(X=x)=p \cdot q^x(q=1-p, \ x=0,1,2, \cdots )$$P(X=x)=k+x-1Cxpkqx(q=1-p、x=0,1,2, \cdots )
成功確率$$p$$のベルヌーイ試行を繰り返すときに、$$k$$回成功するまでに失敗する回数と考えることができる。
($$k=1$$だと、幾何分布$$G(p)$$になる)
期待値$$E(X)=\frac{kq}{p}$$、分散$$V(X)=\frac{kq}{p^2}$$
積率母関数$$V(X)=\frac{p}{1-q \cdot e^t}$$
9.連続的確率変数の例
(1)一様分布
$$U(\alpha,\beta) \, (\alpha<\beta)$$
確率密度関数$$f(x)=\frac{1}{\beta-\alpha} \, (\alpha<x<\beta)$$
期待値$$E(X)=\frac{\alpha+\beta}{2}$$、分散$$V(X)=\frac{(\beta-\alpha)^2}{12}$$
積率母関数\frac{e^{\beta t}-e^{\alpha t}}{t(\beta-\alpha)}
(2)正規分布
$$N(\mu,\sigma^2) \, (\sigma>0)$$
確率密度関数$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp(\frac{(x-\mu)^2}{2\sigma^2}) (-\infty<x<\infty)$$
期待値$$E(X)=\mu$$、分散$$V(X)=\sigma^2$$
積率母関数$$\exp(\mu t+\frac{\sigma^2}{2}t^2)$$
正規分布の性質
(a)正規分布$$N(0,1)$$を標準正規分布という。
(b)$$X$$が正規分布$$N(\mu,\sigma^2)$$に従うとき、$$aX+b$$は正規分布$$N(a\mu+b,a^2\sigma^2)$$に従う。特に、$$\frac{X-\mu}{\sigma}$$は標準正規分布に従うが、この操作を規準化という。
(c)$$X$$が標準正規分布$$N(0,1)$$に従うとき、$$X^2$$は自由度1のカイ2乗分布(後述)$$\chi ^2(1)$$に従う。
(3)対数正規分布
$$X$$が正規分布のとき$$e^X$$が従う分布
確率密度関数f(x)= (0<x<\infty)
期待値E(X)= 、分散V(X)=
正規分布の積率母関数から容易に導出される。
積率母関数は存在しない。
(4)指数分布
$$e(\lambda) (\lambda>0)$$
確率密度関数f(x)=\lambdae-\lambdax(0<x<\infty)
単位時間に発生する確率\lambdaの事象が発生してから次に発生するまでの時間。
期待値E(X)=1\lambda、分散V(X)=1\lambda2
積率母関数\lambda\lambda-t(t<\lambda)
(5)ガンマ分布 \Gamma(\alpha,\beta) (0<\alpha<\infty,0<\beta<\infty)
確率密度関数f(x)=\beta\Gamma(\alpha)e-\betax(\betax)\alpha-1(0<x<\infty)
ただし\Gamma(\alpha)はガンマ関数。
期待値E(X)=\alpha\beta、分散V(X)=\alpha\beta2
積率母関数\beta\beta-t \alpha(t<\beta)
前記の指数分布e(\lambda)は\Gamma(1,\lambda)とあらわされる。
また、\Gamma(n2,12)を自由度$$n$$のカイ2乗分布\chi^2(n)という。
第3章 多変量の確率変数
1.同時確率密度関数と周辺確率密度関数
(1)同時確率密度関数
P(a \le X \le b,c \le Y \le d)=
となるとき、$$f(x,y)$$を$$(X,Y)$$の同時確率密度関数という。
=1がなりたつ。
(2)XとYの確率密度関数は
fX(x)= 、fY(y)=
となる。fX(x)、fY(y)をそれぞれ、X,Yの周辺確率密度関数とよぶ。
(3)XとYが独立である必要十分条件は
(X,Y)の同時確率密度関数f(x,y)が、
f(x,y)=fX(x) \cdot fY(y)となること。
ここで、fX(x)はXの周辺確率密度関数で、fY(y)はYの周辺確率密度関数
(4)f(x,y)を(X,Y)の同時確率密度関数とし、X=\phi(U,V)、
y=ψ(U,V)(U,Vの関数)とし、(U,V)の同時確率密度関数をg(u,v)とおくと、
g(u,v)=\partial(x,y)\partial(u,v) \cdot f(\phi(u,v),\psi(u,v))
ここで、\partial(x,y)\partial(u,v)はヤコビ行列式(ヤコビアン)と呼ばれるもので、
$$\partial(x,y)\partial(u,v)=\partialx\partialu \partialx\partialv\partialy\partialu \partialy\partialv$$
特に、Z=X+Yの確率密度関数g(z)は
g(z)=
とかける。
さらに、XとYが独立で、Xの確率密度関数がf(x),Yの確率密度関数がg(y)のとき、Z=X+Yの確率密度関数h(z)は、h(z)=
とかけるが、これをfとgの畳み込みといい、h=f*gのようにあらわす。
2.共分散と相関係数
(1)共分散
$$X$$と$$Y$$の共分散$$Cov(X,Y)$$を
$$Cov(X,Y)=E((X-\mu)(Y-\nu))$$で定義する。
ただし、$$\mu=E(X)\, , \, \nu=E(Y)$$
実際には、$$Cov(X,Y)=E(XY)-E(X)E(Y)$$で計算することが多い。
(2)共分散の性質
$$Cov(Y,X)=Cov(X,Y)$$
$$Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)$$
$$Cov(aX+b,Y)=aCov(X,Y)$$
$$Cov(X,X)=V(X)$$
$$X,Y$$が独立なら$$Cov(X,Y)=0$$(逆は成立しない)
(3)相関係数
$$\rho(X,Y)=\frac{Cov(X,Y)}{\sqrt{V(X)V(Y)}}$$
(4)相関係数の性質
$$-1 \le \rho(X,Y) \le 1$$
$$\rho(X,Y)= 1$$となるのは、$$Y=aX+b \, (a>0)$$のときに限る。
$$\rho(X,Y)=-1$$となるのは、$$Y=aX+b \, (a<0)$$のときに限る。
$$\rho(Y,X)=\rho(X,Y)$$
$$\rho(aX+b,cY+d)=\rho(X,Y) \ (a,c \ne 0)$$
3.分布の再生性
以下、$$X$$と$$Y$$は独立とする。また「$$X \sim \bigcirc \bigcirc$$」は、「$$X$$が○○分布に従う」ことをあらわす。
(1)2項分布の再生性
$$X \sim Bi(m,p),Y \sim Bi(n,p)$$ならば$$X+Y \sim Bi(m+n,p)$$
(2)ポワソン分布の再生性
$$X \sim Po(\lambda),Y \sim Po(\mu)$$ならば$$X+Y \sim Po(\lambda+\mu)$$
(3)正規分布の再生性
$$X \sim N(\mu_1,\sigma_1^2),Y \sim N(\mu_2,\sigma_2^2)$$ならば
$$X+Y \sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$$
(4)ガンマ分布の再生性
$$X \sim \Gamma(\alpha_1,\beta),Y \sim \Gamma(\alpha_2,\beta)$$ならば
$$X+Y \sim \Gamma(\alpha_1+\alpha_2,\beta)$$
(5)カイ2乗分布の再生性
$$X \sim \chi^2(m),Y \sim \chi^2(n)$$ならば$$X+Y \sim \chi^2(m+n)$$
(6)負の2項分布の再生性
$$X \sim NB(k_1,p),Y \sim NB(k_2,p)$$ならば$$X+Y \sim NB(k_1+k_2,p)$$
4.中心極限定理
$$X_1,X_2, \cdots $$は独立かつ同じ分布(期待値$$\mu$$、分散$$\sigma^2$$)に従うとき、任意の実数$$a,b$$に対して、
$$Y=\frac{(X_1+X_2+ \cdots +Xn)-n\mu}{\sqrt{n}\sigma}$$とおくと、
つまり、
「同一の分布に従う独立なn個の確率変数の平均$$\bar{x}$$を規準化(平均0、分散1にすること)した確率変数$$Y$$は、$$n \to \infty$$のとき標準正規分布$$N(0,1)$$に従う。」
または
「同一の分布に従う独立なn個の確率変数の平均$$\bar{x}$$は、$$n \to \infty$$のとき、
正規分布$$N(E(\bar{x}),V(\bar{x}))$$に従う。」
といえる。
実際の問題では、「中心極限定理を用いて」というのは、($$n$$が十分大きいときに)「正規分布とみなしてよい」(正規近似)と解釈してよい。
5.条件付期待値と条件付分散
(1)条件付期待値の理論(参考「損保数理」のテキスト0-11~0-13)
$$E(X|Y)$$は$$Y$$のもとでの$$X$$の期待値をあらわす。
つまり、Y=yに対し、E(X|Y=y)(Y=yのもとでXの期待値)を対応させることになり、確率変数Yの関数で、また確率変数となる。
同様に条件付分散、V(X|Y)も定義できる。
(例1)
離散型確率変数(X,Y)を次のように定義する。
P(X=x,Y=y)=120(x+y)((x=1またはx=2)かつ(y=3またはy=4))
P(X=x,Y=y)=0 (上記以外)
このとき、
P(X=1 \cap Y=3)=15、P(X=2 \cap Y=3)=14
P(X=1)=P(X=1 \cap Y=3)+P(X=2 \cap Y=3)=920
なので、
P(X=1|Y=3)=15÷920=49、P(X=2|Y=3)=14÷920=59
であり、
E(X|Y=3)=1×49+2×59=149
同様に計算すると、E(X|Y=4)=1711
つまり、E(X|Y=y)=y×3+5y×2+3(y=3,4)
さらに条件付分散については、
V(X|Y=3)=2081,V(X|Y=4)=30121となるので、
V(X|Y=y)=y×10-10(y×2+3)2(y=3,4)
(例2)
X1,X2, \cdots は互いに独立で同じ分布
Nは0,1,2, \cdots をとる離散型分布で、Nと各Xiは独立
Y=X1+X2+ \cdots +XNとする。
E(Y|N=n)=E(i=1n Xi)=nE(X1)
V(Y|N=n)=V(i=1n Xi)=nV(X1)
なので、
E(Y|N)=N \cdot E(X1)
V(Y|N)=N \cdot V(X1)
と確率変数のNの関数で表すことができる。
(2)条件付期待値と条件付分散に関して次の公式が成立する。
a.E(X)=E(E(X|Y))
(「もとの期待値」=「条件付期待値の期待値」、左辺は確率変数Xの期待値、右辺は確率変数Yの関数の期待値)
b.V(X)=V(E(X|Y))+E(V(X|Y))
(「もとの分散」=「条件付期待値の分散」+「条件付分散の期待値」、左辺は確率変数Xの分散、右辺は確率変数Yの関数の期待値や分散)
前記の(例1)でa.b.を確認する。
E(X=1)=920、E(X=2)=1120なので、
E(X)=1×920+2×1120=3120、V(X)=12×920+22×1120-3120 2=99400
一方、P(Y=3)=920、P(Y=4)=1120なので、
E(E(X|Y))
=E(X|Y=3)×P(Y=3)+E(X|Y=4)×P(Y=4)
=149×920+1711×1120=3120=E(X)
V(E(X|Y))
=E(X2|Y)-{E(E(X|Y))}2
=E(X2|Y=3)×P(Y=3)+E(X2|Y=4)×P(Y=4)
-{E(E(X|Y))}2
=149 2×920+1711 2×1120-3120 2=139600
E(V(X|Y))
=V(X|Y=3)×P(Y=3)+V(X|Y=4)×P(Y=4)
=2081×920+30121×1120=49198
V(E(X|Y))+E(V(X|Y))=49198+139600=99239600=99400=V(X)
第4章 統計
1.不偏推定量
推定しようとする(未知)母数(パラメーター)$$\theta$$の推定量として$$T$$をとったとき、
$$E(T)=\theta$$が成り立つ場合に、$$T$$を不偏推定量と呼ぶ。
(例)$$X_1,X_2, \cdots X_n$$を平均$$\mu$$の同じ分布から得た標本とすると、
\bar{x}=X1+X2+ \cdots +Xn nは、E(\bar{x})=\muを満たすので、\muの不偏推定量である。
2.有効推定量
2.最尤法
母集団の(未知)母数を$$\theta$$、母集団分布の確率密度関数(離散型の場合は確率関数)を
$$f(x,\theta)$$とすれば、
標本$$(X_1,X_2, \cdots ,X_n)$$の実現値$$(x_1,x_2, \cdots ,x_n)$$から得る確率密度(確率)は、$$X_1,X_2, \cdots X_n$$が互いに独立なことから
L=L(\theta)=k=1nf(xk,\theta)
となる。このLを$$\theta$$の尤度関数という。
最尤法とは尤度Lを最大にするような\thetaを求める方法である。
実際には$$\log L$$を$$\theta$$で微分して0となるような$$\theta$$を求めることが多い。
3.第1種の誤りと第2種の誤り
統計的検定において棄却しようとする仮説を帰無仮説(H0)といい、それに対立する仮説を対立仮説(H1)という。
第1種の誤り:帰無仮説H0が真であるにもかかわらず、H0を棄却する誤り(「誤認逮捕」)
第2種の誤り:帰無仮説H0が偽(対立仮説H1が真)であるにもかかわらず、H0を採択する(棄却できない)誤り(「取り逃がし」)
第1種の誤りを起こす確率を「有意水準」という。
また1-「第2種の誤りを起こす確率」を「検出力」という。
5.有限母集団
$$N$$個の要素からなる有限母集団の母平均を$$\mu$$、母分散を$$\sigma^2$$とし、
標本(X1,X2, \cdots ,Xn)(1 \le n \le N)を非復元抽出によって取り出すものとする。
\bar{x}=1ni=1n Xiとおくとき、E(\bar{x})=\mu、V(\bar{x})=N-nN-1 \cdot \sigma2n
6.推定・検定法
(1)推定・検定の基本的な考え方
(a)「○○分布」に従う統計量を作る。
(b)推定の場合は、その統計量が与えられた「比率」(信頼区間)以内で収まる範囲を作る。
(c)検定の場合は、その統計量が与えられた「比率」(=1-有意水準)内で収まる範囲の中か外かを判定する。
(例1)推定の例
測定した25個の資料の平均値は\bar{x}=25.7であった。これが正規母集団N(\mu、64)からの標本であるとして、母平均\muの95%信頼区間を求めよ。
Y=\bar{x}-\mu 6425=\bar{x}-\mu85とおくと、Yは標準正規分布N(0,1)に従う
よって、Yは95%の確率で-u(0.025)<Y<u(0.025)となる。
(u(\epsilon)は、\Phi(x)を標準正規分布の分布関数とするとき、\Phi(u(\epsilon))=1-\epsilonとなる点。u(0.025)=1.96)
よって、\muの信頼区間は、(25.7-1.96×85,25.7+1.96×85)
=(22.56,28.84)
(例2)検定の例
得点がN(50,122)に従うように設計されたテストがある。これをあるクラス36人に実施したところ、平均点\bar{x}が53.7であった。このクラスは優秀(平均よりよい)といえるか。有意水準5%で検定せよ。
このクラスの平均点を\muとすると
帰無仮説H0:\mu=50、対立仮説H1:\mu>50
(帰無仮説を仮定すると)
36人の平均\bar{x}に対し、Y=\bar{x}-5012236=\bar{x}-502は標準正規分布N(0,1)に従う。
いま平均点\bar{x}=53.7に対するYはY=53.7-502=1.85>u(0.05)=1.645
よって有意水準5%でH0は棄却される。
(\mu=50とすると、「こんないい点数」をとる確率は5%未満)
(2)正規分布の平均:分散既知
正規分布$$N(\mu,\sigma^2)$$($$\sigma>0$$:既知)から$$n$$個の独立の標本をとり、標本平均を$$\bar{x}$$とすると、$$\frac{\bar{x}-\mu}{\sqrt{n}\sigma}$$が標準正規分布$$N(0,1)$$に従う
(3)正規分布の平均の差:分散既知
正規分布N(\mu1,\sigma12)N(\mu2,\sigma22)(\sigma1、\sigma2:既知)からそれぞれn1、n2個の独立の標本をとりそれらの標本平均値をそれぞれ、\bar{x}1、\bar{x}2とすると、\bar{x}1-\bar{x}2 \sigma12n1+\sigma22n2が標準正規分布N(0,1)に従う
(4)比率(正規近似)
集団Aで条件\alphaを満たすものがn個中k個あったとし、$$\hat{p}=\frac{k}{n}$$とする。nが十分大きいときには、集団Aで条件\alphaをみたすものの比率pの分布はN(p^,p^(1-p^)n)に従うとみなすことができる。これと、上記(3)を組み合わせて比率同士の差の推定、検定を行うことも可能。
(5)正規分布の平均:分散未知
正規分布$$N(\mu,\sigma^2)$$($$\sigma>0$$:未知)から$$n$$個の独立の標本をとり、標本平均を$$\bar{x}$$、標本分散を$$S^2$$とすると、T=\bar{x}-\mu Snが自由度(n-1)のt分布t(n-1)に従う
(6)正規分布の平均の差(分散未知だが、等分散性を仮定)
母分散は等しいが未知の2つの正規分布N(\mu1,\sigma2)、N(\mu2,\sigma2)からそれぞれ
n1、n2個の独立の標本をとり、標本平均をそれぞれ\bar{x}1、\bar{x}2、標本分散をS12、S22とすると、T=\bar{x}1-\bar{x}2-(\mu1-\mu2)S1n1+1n2が自由度(n1+n2-2)のt分布
t(n1+n2-2)に従う。ただし、S2=(n1-1)S12+(n2-1)S22n1+n2-2
(検定問題においては、下の(8)を使って等分散性を検定して、等分散性が仮定できれば(否定できなければ)この検定を行う。)
(等分散性が仮定できないときはウェルチの検定を行うが、アクチュアリー試験ではまず出題されない。)
(7)正規分布の分散
正規母集団$$N(\mu,\sigma^2)$$から$$n$$個の独立の標本の標本分散を$$S^2$$とするとき、
U=(n-1)S2\sigma2は自由度(n-1)のカイ2乗分布\chi2(n-1)に従う。
(8)2つの正規分布の分散比
2つの分散が同じ(と仮定される)母集団N(\mu1,\sigma2)、N(\mu2,\sigma2)からそれぞれ
n1、n2個の独立した標本をとり、標本分散をそれぞれS12、S22とすると、
S12S22は自由度(n1-1,n2-1)のF分布に従う。
(9)指数分布
$$X_1,X_2, \cdots ,X_n$$が独立で、平均$$\lambda$$の指数分布に従うとき、
2\lambda(X1+X2+ \cdots +Xn)は自由度2nのカイ2乗分布\chi2(2n)に従う。
これを利用して、\lambdaの信頼係数(1-\epsilon)の区間推定を考える。
今n個の標本の合計値がSnのとき、
P(\chi22n(1-\epsilon2) \le 2\lambdaSn \le \chi22n(\epsilon2))=1-\epsilon
よって、2Sn \chi22n(\epsilon2) \le \lambda \le 2Sn \chi22n(1-\epsilon2)
ただし、\chi22n(\epsilon)は、自由度2nのカイ2乗分布の上側\epsilon点)
(10)相関係数
2次元正規母集団N(\mu1,\mu2;\sigma12,\sigma22,\rho)からとった大きさnの標本
{(x1,y1),(x2,y2), \cdots ,(xn,yn),}
によって作られる母相関係数\rhoの推定値
r=
を標本相関係数という。
\rho=0ならばT=n-2r1-r2は自由度n-2のt分布t(n-2)に従う。
(11)ポワソン分布
Xがポワソン分布Po(\lambda)に従い、Y1、Y2はそれぞれ自由度2k、2(k+1)のカイ2乗分布\chi2(2k)、\chi2(2(k+1))に従うとすると、
P(X \ge k)=P(Y1 \le 2\lambda)、P(X \le k)=P(Y2>2\lambda)
これを利用して、\lambdaの信頼係数(1-\epsilon)の区間推定を考える。
いまPo(\lambda)からn個の独立な標本X1、X2、 \cdots 、Xnを抽出して、その合計値がkであったとする。
X=X1+X2+ \cdots +Xnとすると、Xはポワソン分布Po(n\lambda)に従うので、
P(X \ge k)=P(Y1 \le 2n\lambda)、P(X \le k)=P(Y2>2n\lambda)
よって、
\lambdaa=12n\chi22k(1-\epsilon2)、\lambdab=12n\chi22k+2(\epsilon2)
とおくと、
\lambdaa \le \lambdaならばP(X \ge k)=P(Y1 \le 2n\lambda) \ge P(Y1 \le \chi22k(1-\epsilon2))=\epsilon2
\lambda \le \lambdabならばP(X \le k)=P(Y2>2n\lambda) \ge P(Y2>\chi22k+2(\epsilon2))=\epsilon2
よって、推定区間は、
(\lambdaa,\lambdab)つまり(12n\chi22k(1-\epsilon2),12n\chi22k+2(\epsilon2))
(12)成功確率の区間推定(正規近似できないとき)
Xが2項分布Bi(n,p)に従い、Y1、Y2はそれぞれ自由度
(2(k+1),2(n-k))、(2(n-k+1),2k)のF分布に従うとすると、
P(X \le k)=P(Y1 \ge (n-k)p(k+1)(1-p))、
P(X \ge k)=P(Y2 \ge k(1-p)(n-k+1)p)
これを利用して、pの信頼係数(1-\epsilon)の区間推定を考える。
いま成功確率pのベルヌーイ試行をn回行ったときの成功回数は2項分布Bi(n,p)に従う。実際に、k回成功したとする。
ここで、
k(1-pa)(n-k+1)pa= をみたすpaを考えると、p \ge paに対し、
k(1-p)(n-k+1)p \le k(1-pa)(n-k+1)pa= なので、
P(X \ge k)=P(Y2 \ge k(1-p)(n-k+1)p) \ge P(Y2 \ge )=\epsilon2
が成り立つ。
また、(n-k)pb(k+1)(1-pb)= をみたすpbを考えると、p \le pbに対し、
k(1-p)(n-k+1)p \le (n-k)pb(k+1)(1-pb)= なので、
P(X \ge k)=P(Y1 \ge (n-k)p(k+1)(1-p)) \ge P(Y2 \ge )=\epsilon2
が成り立つ。
よって、推定区間は、(pa,pb)つまり
(kk+ \cdot (n-k+1),(s+1) n-k+(k+1) )
(13)適合度
母集団が、k個の排反する階級A1、A2、 \cdots Akに分類されている。
仮説$$H_0:A_1,A_2, \cdots A_k$$の現れる確率はそれぞれ$$p_1,p_2, \cdots p_k$$である。
母集団から大きさ$$n$$の標本をとったとき、各階級の観察度数と理論度数は下の表のようになった。($$m_i=n \cdot p_i$$)
このとき、
u=i=1k(ni-mi)2mi
は、miがあまり小さくない(各mi \ge 5)とき、近似的に自由度(k-1)のカイ2乗分布に従う。
(14)独立性(2×2分割表)
1つの試行の結果が性質AについてはAとA'に性質BについてはBとB'に分類され、結局排反する4つの階級A \cap B、A \cap B'、A' \cap B、A' \cap B'のいずれかただ1つに分類されるものとする。いまN回の独立試行の結果、下の2×2分割表に示す度数を得たものとする。
AとBが互いに独立なら、
u=(ad-bc)2N(a+b)(c+d)(a+c)(b+d)
は近似的に自由度1のカイ2乗分布に従う。
編集中