数学の基礎

「数学の基礎」の編集履歴(バックアップ)一覧はこちら

数学の基礎」(2008/09/11 (木) 15:16:27) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

第1章 確率の基礎概念 1.順列と組み合わせ 順列:$$n$$個の中から$$k$$個を並べる並べ方。$$_{n}P_k$$ $$_{n}P_k=n(n-1)(n-2) \cdots (n-k+1)=\frac{n!}{(n-k)!}$$ 組み合わせ:$$n$$個の中から$$k$$個を選ぶ選び方。$$_nC_k$$ $$_nC_k=\frac{n(n-1)(n-2) \cdots (n-k+1)}{k!}=\frac{n!(n-k)!}{k!}=\frac{_nP_k}{k!}$$ ここで、$$0!=1, \ _nC_0= \ _0C_0=1$$と「約束」する。 $$_nC_k$$を2項係数と呼ぶ 2項係数の性質 $$_nC_k= \ _nC_{n-k}$$ $$_{n}C_k= \ _{n-1}C_{k-1}+_{n-1}C_k$$ なお、$$_nC_k$$のかわりに、$$\left( \begin{array}{c} n \\ k \\ \end{array} \right) $$と書くこともある。 また、$$x$$が一般の実数について$$\left( \begin{array}{c} x \\ k \\ \end{array} \right) $$を考えることができる。つまり、 $$\left( \begin{array}{c} x \\ k \\ \end{array} \right) =\frac{x(x-1)(x-2) \cdots (x-k+1)}{k!}$$ と定義する。 2.2項定理 $$(a+b)^n=\sum_{k=0}^{n} _nC_k a^{n-k}b^k$$ 3.確率の基本公理 $$P(A)$$で事象$$A$$が起こる確率を表す。 (1)独立と排反 $$A$$と$$B$$が独立とは$$P(A \cap B)=P(A) \cdot P(B)$$が成り立つこと。 $$A$$と$$B$$が排反とは、$$A \cap B=\emptyset$$(空集合)であること。 $$A$$と$$B$$が排反のとき、$$P(A \cup B)=P(A)+P(B)$$が成り立つ (2)余事象 事象$$A$$に対して、$$A$$が起こらない事象を$$\overline{A}$$とあらわす。 (3)加法定理 $$P(A \cup B)=P(A)+P(B)-P(A \cap B)$$ $$P(A \cup B \cup C)=P(A)+P(B)+P(C)-P(A \cap B)-P(B \cap C)-P(B \cap C)+P(A \cap B \cap C) 4.条件付確率とベイズの定理 (1)条件付確率 事象$$A$$のもとで事象$$B$$が発生する確率を$$P(B|A)$$または$$P_{A}(B)$$と表記し、「$$A$$のもとで$$B$$が起こる条件付確率」という。 $$P(B|A)=P(A \cap B)P(A)$$ $$A$$と$$B$$が独立ならば、$$P(B|A)=P(B)$$ (2)ベイズの定理 事象$$X$$の生じる原因として$$A,B,C$$の3つだけがあり、$$A,B,C$$はそれぞれ排反とする。いま$$X$$が生じたときにその原因が$$A$$である確率$$P(A|X)$$は、 $$P(A|X)=P(X \cap A)P(X)$$ $$=\frac{P(X|A)P(A)}{P(X|A)P(A)+P(X|B)P(B)+P(X|C)P(C)}$$ (今、3つとしたが、それ以上の場合でも同様の式になる。) 第2章 確率変数 1.離散型確率変数 $$P(X=x)=a_x$$のような形で表される。 $$f(x)=P(X=x)$$のことを確率関数と呼ぶ 2.連続型確率変数 $$P(a \le X \le b)=\int_a^b f(x)dx$$ のような形で表される。 $$f(x)$$のことを確率密度関数と呼ぶ。 確率密度関数の性質 $$f(x)$$を(連続型)確率変数の確率密度関数とするとき、 (a)$$f(x) \ge 0$$ (b)$$\int_{-\infty}^{\infty} f(x)dx=1$$ 一方$$F(x)=P(X \le x)=\int_{-\infty}^{x} f(t)dt$$を確率分布関数と呼ぶ。 確率密度関数$$f(x)$$と確率分布関数$$F(x)$$の間には$$F'(x)=f(x)$$の関係がある。 また、$$F(x)$$は(広義の)単調増加関数。 つまり、$$x_1<x_2 \Rightarrow F(x_1) \le F(x_2)$$ さらに$$F(-\infty)=0,F(\infty)=1$$ 3.確率変数の独立 $$X$$と$$Y$$が独立とは $$P(X=m,Y=n)=P(X=m) \cdot P(Y=n)$$(離散型) $$P(a \le X \le b,c \le Y \le d)=P(a \le X \le b) \cdot P(c \le Y \le d)$$(連続型) 4.期待値(平均)と分散 $$E(X)=\sum x \cdot a_x$$(離散型) $$E(X)=\int xf(x)dx$$(連続型) を$$X$$の期待値(平均)という。 $$g(x)$$を$$x$$の関数とするとき、$$g(X)$$の平均として、 $$E(g(X))=\sum g(x)ax$$(離散型) $$E(g(X))=\int g(x)f(x)dx$$(連続型) が定義できる。 特に、$$g(x)=(x-\mu )^2 \ (\mu =E(X))$$としたとき、 つまり、$$E((X-\mu )^2)$$を$$V(X)$$とあらわし、$$X$$の分散という。 実際には、$$V(X)=E(X^2)-\{ E(X) \} ^2$$ で計算することがほとんど。 また、$$sigma (X)=\sqrt{V(X)}$$を$$X$$の標準偏差という。 5.期待値と分散の性質 $$E(X+Y)=E(X)+E(Y)$$ $$E(aX+b)=aE(X)$$($$a,b$$は$$X$$と無関係な定数) $$V(aX+b)=a^2 V(X)$$($$a,b$$は$$X$$と無関係な定数) さらに$$X$$と$$Y$$が独立の場合は、 $$E(f(X)g(Y))=E(f(X))E(g(Y))$$ 特に $$E(XY)=E(X)E(Y)$$ $$V(X+Y)=V(X)+V(Y)$$ 6.積率母関数 確率変数$$X$$に対し、 積率母関数$$m_X (t)=E(e^{tX})$$ つまり、 $$m_X(t)=\sum e^{tx}a_x$$(離散型) $$m_X (t)=\int e^{tx}f(x)dx$$(連続型) $$X$$は省略されることも多い。 7.積率母関数の性質 $$X$$と$$Y$$が独立$$\Leftrightarrow m_{X+Y}(t)=m_X(t)m_Y(t)$$ $$mX(t)=mY(t)\Leftrightarrow X=Y$$(積率母関数の一意性) $$E(X^n)=m_X^{(n)}(0)$$ ($$X$$の$$n$$次のモーメントは積率母関数に0を代入したものに等しい) 8.離散的確率変数の例 (1)2項分布 $$Bi(n,p)$$ ($$n$$は正の整数、$$0<p<1$$) $$P(X=x)=\ _nC_x \cdot p^xq^{n-x}(q=1-p \, , \, x=0,1,2, \cdots ,n)$$ 成功確率$$p$$のベルヌーイ試行を$$n$$回行ったときの成功回数 期待値$$E(X)=np$$、分散$$V(X)=npq$$ 積率母関数$$(p \cdot e^t+q)^n$$ (2)ポワソン分布 $$Po(\lambda) \ (\lambda>0)$$ $$P(X=x)=\frac{\lambda^x \cdot e^{-\lambda}}{x!} \ (x=0,1,2, \cdots)$$ 単位時間で平均$$\lambda$$回発生する事象が、単位時間内で発生する回数 2項分布で$$np=\lambda$$としながら、$$n \to \infty$$としたもの。 期待値$$E(X)=\lambda$$、分散$$V(X)=\lambda$$ 積率母関数$$\exp(\lambda \cdot e^t-\lambda)$$ (3)幾何分布 $$G(p) \ (0<p<1)$$ $$P(X=x)=p \cdot q^x(q=1-p, \ x=0,1,2, \cdots )$$ 成功確率$$p$$のベルヌーイ試行を繰り返すときに初めて成功するまでに失敗する回数。 期待値$$E(X)=\frac{q}{p}$$、分散$$V(X)=\frac{q}{p^2}$$ 積率母関数$$\frac{p}{1-q \cdot e^t}$$ (4)負の2項分布 $$NB(k,p) \ (0<k<\infty,0<p<1)$$ $$P(X=x)=p \cdot q^x(q=1-p, \ x=0,1,2, \cdots )$$P(X=x)=k+x-1Cxpkqx(q=1-p、x=0,1,2, \cdots ) 成功確率$$p$$のベルヌーイ試行を繰り返すときに、$$k$$回成功するまでに失敗する回数と考えることができる。 ($$k=1$$だと、幾何分布$$G(p)$$になる) 期待値$$E(X)=\frac{kq}{p}$$、分散$$V(X)=\frac{kq}{p^2}$$ 積率母関数$$V(X)=\frac{p}{1-q \cdot e^t}$$ 9.連続的確率変数の例 (1)一様分布 $$U(\alpha,\beta) \, (\alpha<\beta)$$ 確率密度関数$$f(x)=\frac{1}{\beta-\alpha} \, (\alpha<x<\beta)$$ 期待値$$E(X)=\frac{\alpha+\beta}{2}$$、分散$$V(X)=\frac{(\beta-\alpha)^2}{12}$$ 積率母関数\frac{e^{\beta t}-e^{\alpha t}}{t(\beta-\alpha)} (2)正規分布 $$N(\mu,\sigma^2) \, (\sigma>0)$$ 確率密度関数$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp(\frac{(x-\mu)^2}{2\sigma^2}) (-\infty<x<\infty)$$ 期待値$$E(X)=\mu$$、分散$$V(X)=\sigma^2$$ 積率母関数$$\exp(\mu t+\frac{\sigma^2}{2}t^2)$$ 正規分布の性質 (a)正規分布$$N(0,1)$$を標準正規分布という。 (b)$$X$$が正規分布$$N(\mu,\sigma^2)$$に従うとき、$$aX+b$$は正規分布$$N(a\mu+b,a^2\sigma^2)$$に従う。特に、$$\frac{X-\mu}{\sigma}$$は標準正規分布に従うが、この操作を規準化という。 (c)$$X$$が標準正規分布$$N(0,1)$$に従うとき、$$X^2$$は自由度1のカイ2乗分布(後述)$$\chi ^2(1)$$に従う。 (3)対数正規分布 $$X$$が正規分布のとき$$e^X$$が従う分布 確率密度関数f(x)= (0<x<\infty) 期待値E(X)= 、分散V(X)= 正規分布の積率母関数から容易に導出される。 積率母関数は存在しない。 (4)指数分布 $$e(\lambda) (\lambda>0)$$ 確率密度関数f(x)=\lambdae-\lambdax(0<x<\infty) 単位時間に発生する確率\lambdaの事象が発生してから次に発生するまでの時間。 期待値E(X)=1\lambda、分散V(X)=1\lambda2 積率母関数\lambda\lambda-t(t<\lambda) (5)ガンマ分布 \Gamma(\alpha,\beta) (0<\alpha<\infty,0<\beta<\infty) 確率密度関数f(x)=\beta\Gamma(\alpha)e-\betax(\betax)\alpha-1(0<x<\infty) ただし\Gamma(\alpha)はガンマ関数。 期待値E(X)=\alpha\beta、分散V(X)=\alpha\beta2 積率母関数\beta\beta-t \alpha(t<\beta) 前記の指数分布e(\lambda)は\Gamma(1,\lambda)とあらわされる。 また、\Gamma(n2,12)を自由度$$n$$のカイ2乗分布\chi^2(n)という。 第3章 多変量の確率変数 1.同時確率密度関数と周辺確率密度関数 (1)同時確率密度関数 P(a \le X \le b,c \le Y \le d)= となるとき、$$f(x,y)$$を$$(X,Y)$$の同時確率密度関数という。 =1がなりたつ。 (2)XとYの確率密度関数は fX(x)= 、fY(y)= となる。fX(x)、fY(y)をそれぞれ、X,Yの周辺確率密度関数とよぶ。 (3)XとYが独立である必要十分条件は (X,Y)の同時確率密度関数f(x,y)が、 f(x,y)=fX(x) \cdot fY(y)となること。 ここで、fX(x)はXの周辺確率密度関数で、fY(y)はYの周辺確率密度関数 (4)f(x,y)を(X,Y)の同時確率密度関数とし、X=\phi(U,V)、 y=ψ(U,V)(U,Vの関数)とし、(U,V)の同時確率密度関数をg(u,v)とおくと、 g(u,v)=\partial(x,y)\partial(u,v) \cdot f(\phi(u,v),\psi(u,v)) ここで、\partial(x,y)\partial(u,v)はヤコビ行列式(ヤコビアン)と呼ばれるもので、 $$\partial(x,y)\partial(u,v)=\partialx\partialu \partialx\partialv\partialy\partialu \partialy\partialv$$ 特に、Z=X+Yの確率密度関数g(z)は g(z)= とかける。 さらに、XとYが独立で、Xの確率密度関数がf(x),Yの確率密度関数がg(y)のとき、Z=X+Yの確率密度関数h(z)は、h(z)= とかけるが、これをfとgの畳み込みといい、h=f*gのようにあらわす。 2.共分散と相関係数 (1)共分散 $$X$$と$$Y$$の共分散$$Cov(X,Y)$$を $$Cov(X,Y)=E((X-\mu)(Y-\nu))$$で定義する。 ただし、$$\mu=E(X)\, , \, \nu=E(Y)$$ 実際には、$$Cov(X,Y)=E(XY)-E(X)E(Y)$$で計算することが多い。 (2)共分散の性質 $$Cov(Y,X)=Cov(X,Y)$$ $$Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)$$ $$Cov(aX+b,Y)=aCov(X,Y)$$ $$Cov(X,X)=V(X)$$ $$X,Y$$が独立なら$$Cov(X,Y)=0$$(逆は成立しない) (3)相関係数 $$\rho(X,Y)=\frac{Cov(X,Y)}{\sqrt{V(X)V(Y)}}$$ (4)相関係数の性質 $$-1 \le \rho(X,Y) \le 1$$ $$\rho(X,Y)= 1$$となるのは、$$Y=aX+b \, (a>0)$$のときに限る。 $$\rho(X,Y)=-1$$となるのは、$$Y=aX+b \, (a<0)$$のときに限る。 $$\rho(Y,X)=\rho(X,Y)$$ $$\rho(aX+b,cY+d)=\rho(X,Y) \ (a,c \ne 0)$$ 3.分布の再生性 以下、$$X$$と$$Y$$は独立とする。また「$$X \sim \bigcirc \bigcirc$$」は、「$$X$$が○○分布に従う」ことをあらわす。 (1)2項分布の再生性 $$X \sim Bi(m,p),Y \sim Bi(n,p)$$ならば$$X+Y \sim Bi(m+n,p)$$ (2)ポワソン分布の再生性 $$X \sim Po(\lambda),Y \sim Po(\mu)$$ならば$$X+Y \sim Po(\lambda+\mu)$$ (3)正規分布の再生性 $$X \sim N(\mu_1,\sigma_1^2),Y \sim N(\mu_2,\sigma_2^2)$$ならば $$X+Y \sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$$ (4)ガンマ分布の再生性 $$X \sim \Gamma(\alpha_1,\beta),Y \sim \Gamma(\alpha_2,\beta)$$ならば $$X+Y \sim \Gamma(\alpha_1+\alpha_2,\beta)$$ (5)カイ2乗分布の再生性 $$X \sim \chi^2(m),Y \sim \chi^2(n)$$ならば$$X+Y \sim \chi^2(m+n)$$ (6)負の2項分布の再生性 $$X \sim NB(k_1,p),Y \sim NB(k_2,p)$$ならば$$X+Y \sim NB(k_1+k_2,p)$$ 4.中心極限定理 $$X_1,X_2, \cdots $$は独立かつ同じ分布(期待値$$\mu$$、分散$$\sigma^2$$)に従うとき、任意の実数$$a,b$$に対して、 $$Y=\frac{(X_1+X_2+ \cdots +Xn)-n\mu}{\sqrt{n}\sigma}$$とおくと、 つまり、 「同一の分布に従う独立なn個の確率変数の平均$$\bar{x}$$を規準化(平均0、分散1にすること)した確率変数$$Y$$は、$$n \to \infty$$のとき標準正規分布$$N(0,1)$$に従う。」 または 「同一の分布に従う独立なn個の確率変数の平均$$\bar{x}$$は、$$n \to \infty$$のとき、 正規分布$$N(E(\bar{x}),V(\bar{x}))$$に従う。」 といえる。 実際の問題では、「中心極限定理を用いて」というのは、($$n$$が十分大きいときに)「正規分布とみなしてよい」(正規近似)と解釈してよい。 5.条件付期待値と条件付分散 (1)条件付期待値の理論(参考「損保数理」のテキスト0-11~0-13) $$E(X|Y)$$は$$Y$$のもとでの$$X$$の期待値をあらわす。 つまり、Y=yに対し、E(X|Y=y)(Y=yのもとでXの期待値)を対応させることになり、確率変数Yの関数で、また確率変数となる。 同様に条件付分散、V(X|Y)も定義できる。 (例1) 離散型確率変数(X,Y)を次のように定義する。 P(X=x,Y=y)=120(x+y)((x=1またはx=2)かつ(y=3またはy=4)) P(X=x,Y=y)=0 (上記以外) このとき、 P(X=1 \cap Y=3)=15、P(X=2 \cap Y=3)=14 P(X=1)=P(X=1 \cap Y=3)+P(X=2 \cap Y=3)=920 なので、 P(X=1|Y=3)=15÷920=49、P(X=2|Y=3)=14÷920=59 であり、 E(X|Y=3)=1×49+2×59=149 同様に計算すると、E(X|Y=4)=1711 つまり、E(X|Y=y)=y×3+5y×2+3(y=3,4) さらに条件付分散については、 V(X|Y=3)=2081,V(X|Y=4)=30121となるので、 V(X|Y=y)=y×10-10(y×2+3)2(y=3,4) (例2) X1,X2, \cdots は互いに独立で同じ分布 Nは0,1,2, \cdots をとる離散型分布で、Nと各Xiは独立 Y=X1+X2+ \cdots +XNとする。 E(Y|N=n)=E(i=1n Xi)=nE(X1) V(Y|N=n)=V(i=1n Xi)=nV(X1) なので、 E(Y|N)=N \cdot E(X1) V(Y|N)=N \cdot V(X1) と確率変数のNの関数で表すことができる。 (2)条件付期待値と条件付分散に関して次の公式が成立する。 a.E(X)=E(E(X|Y)) (「もとの期待値」=「条件付期待値の期待値」、左辺は確率変数Xの期待値、右辺は確率変数Yの関数の期待値) b.V(X)=V(E(X|Y))+E(V(X|Y)) (「もとの分散」=「条件付期待値の分散」+「条件付分散の期待値」、左辺は確率変数Xの分散、右辺は確率変数Yの関数の期待値や分散) 前記の(例1)でa.b.を確認する。 E(X=1)=920、E(X=2)=1120なので、 E(X)=1×920+2×1120=3120、V(X)=12×920+22×1120-3120 2=99400 一方、P(Y=3)=920、P(Y=4)=1120なので、 E(E(X|Y)) =E(X|Y=3)×P(Y=3)+E(X|Y=4)×P(Y=4) =149×920+1711×1120=3120=E(X) V(E(X|Y)) =E(X2|Y)-{E(E(X|Y))}2 =E(X2|Y=3)×P(Y=3)+E(X2|Y=4)×P(Y=4) -{E(E(X|Y))}2 =149 2×920+1711 2×1120-3120 2=139600 E(V(X|Y)) =V(X|Y=3)×P(Y=3)+V(X|Y=4)×P(Y=4) =2081×920+30121×1120=49198 V(E(X|Y))+E(V(X|Y))=49198+139600=99239600=99400=V(X) 第4章 統計 1.不偏推定量 推定しようとする(未知)母数(パラメーター)$$\theta$$の推定量として$$T$$をとったとき、 $$E(T)=\theta$$が成り立つ場合に、$$T$$を不偏推定量と呼ぶ。 (例)$$X_1,X_2, \cdots X_n$$を平均$$\mu$$の同じ分布から得た標本とすると、 \bar{x}=X1+X2+ \cdots +Xn nは、E(\bar{x})=\muを満たすので、\muの不偏推定量である。 2.有効推定量 2.最尤法 母集団の(未知)母数を$$\theta$$、母集団分布の確率密度関数(離散型の場合は確率関数)を $$f(x,\theta)$$とすれば、 標本$$(X_1,X_2, \cdots ,X_n)$$の実現値$$(x_1,x_2, \cdots ,x_n)$$から得る確率密度(確率)は、$$X_1,X_2, \cdots X_n$$が互いに独立なことから L=L(\theta)=k=1nf(xk,\theta) となる。このLを$$\theta$$の尤度関数という。 最尤法とは尤度Lを最大にするような\thetaを求める方法である。 実際には$$\log L$$を$$\theta$$で微分して0となるような$$\theta$$を求めることが多い。 3.第1種の誤りと第2種の誤り 統計的検定において棄却しようとする仮説を帰無仮説(H0)といい、それに対立する仮説を対立仮説(H1)という。 第1種の誤り:帰無仮説H0が真であるにもかかわらず、H0を棄却する誤り(「誤認逮捕」) 第2種の誤り:帰無仮説H0が偽(対立仮説H1が真)であるにもかかわらず、H0を採択する(棄却できない)誤り(「取り逃がし」) 第1種の誤りを起こす確率を「有意水準」という。 また1-「第2種の誤りを起こす確率」を「検出力」という。 5.有限母集団 $$N$$個の要素からなる有限母集団の母平均を$$\mu$$、母分散を$$\sigma^2$$とし、 標本(X1,X2, \cdots ,Xn)(1 \le n \le N)を非復元抽出によって取り出すものとする。 \bar{x}=1ni=1n Xiとおくとき、E(\bar{x})=\mu、V(\bar{x})=N-nN-1 \cdot \sigma2n 6.推定・検定法 (1)推定・検定の基本的な考え方 (a)「○○分布」に従う統計量を作る。 (b)推定の場合は、その統計量が与えられた「比率」(信頼区間)以内で収まる範囲を作る。 (c)検定の場合は、その統計量が与えられた「比率」(=1-有意水準)内で収まる範囲の中か外かを判定する。 (例1)推定の例 測定した25個の資料の平均値は\bar{x}=25.7であった。これが正規母集団N(\mu、64)からの標本であるとして、母平均\muの95%信頼区間を求めよ。 Y=\bar{x}-\mu 6425=\bar{x}-\mu85とおくと、Yは標準正規分布N(0,1)に従う よって、Yは95%の確率で-u(0.025)<Y<u(0.025)となる。 (u(\epsilon)は、\Phi(x)を標準正規分布の分布関数とするとき、\Phi(u(\epsilon))=1-\epsilonとなる点。u(0.025)=1.96) よって、\muの信頼区間は、(25.7-1.96×85,25.7+1.96×85) =(22.56,28.84) (例2)検定の例 得点がN(50,122)に従うように設計されたテストがある。これをあるクラス36人に実施したところ、平均点\bar{x}が53.7であった。このクラスは優秀(平均よりよい)といえるか。有意水準5%で検定せよ。 このクラスの平均点を\muとすると 帰無仮説H0:\mu=50、対立仮説H1:\mu>50 (帰無仮説を仮定すると) 36人の平均\bar{x}に対し、Y=\bar{x}-5012236=\bar{x}-502は標準正規分布N(0,1)に従う。 いま平均点\bar{x}=53.7に対するYはY=53.7-502=1.85>u(0.05)=1.645 よって有意水準5%でH0は棄却される。 (\mu=50とすると、「こんないい点数」をとる確率は5%未満) (2)正規分布の平均:分散既知 正規分布$$N(\mu,\sigma^2)$$($$\sigma>0$$:既知)から$$n$$個の独立の標本をとり、標本平均を$$\bar{x}$$とすると、$$\frac{\bar{x}-\mu}{\sqrt{n}\sigma}$$が標準正規分布$$N(0,1)$$に従う (3)正規分布の平均の差:分散既知 正規分布N(\mu1,\sigma12)N(\mu2,\sigma22)(\sigma1、\sigma2:既知)からそれぞれn1、n2個の独立の標本をとりそれらの標本平均値をそれぞれ、\bar{x}1、\bar{x}2とすると、\bar{x}1-\bar{x}2 \sigma12n1+\sigma22n2が標準正規分布N(0,1)に従う (4)比率(正規近似) 集団Aで条件\alphaを満たすものがn個中k個あったとし、$$\hat{p}=\frac{k}{n}$$とする。nが十分大きいときには、集団Aで条件\alphaをみたすものの比率pの分布はN(p^,p^(1-p^)n)に従うとみなすことができる。これと、上記(3)を組み合わせて比率同士の差の推定、検定を行うことも可能。 (5)正規分布の平均:分散未知 正規分布$$N(\mu,\sigma^2)$$($$\sigma>0$$:未知)から$$n$$個の独立の標本をとり、標本平均を$$\bar{x}$$、標本分散を$$S^2$$とすると、T=\bar{x}-\mu Snが自由度(n-1)のt分布t(n-1)に従う (6)正規分布の平均の差(分散未知だが、等分散性を仮定) 母分散は等しいが未知の2つの正規分布N(\mu1,\sigma2)、N(\mu2,\sigma2)からそれぞれ n1、n2個の独立の標本をとり、標本平均をそれぞれ\bar{x}1、\bar{x}2、標本分散をS12、S22とすると、T=\bar{x}1-\bar{x}2-(\mu1-\mu2)S1n1+1n2が自由度(n1+n2-2)のt分布 t(n1+n2-2)に従う。ただし、S2=(n1-1)S12+(n2-1)S22n1+n2-2 (検定問題においては、下の(8)を使って等分散性を検定して、等分散性が仮定できれば(否定できなければ)この検定を行う。) (等分散性が仮定できないときはウェルチの検定を行うが、アクチュアリー試験ではまず出題されない。) (7)正規分布の分散 正規母集団$$N(\mu,\sigma^2)$$から$$n$$個の独立の標本の標本分散を$$S^2$$とするとき、 U=(n-1)S2\sigma2は自由度(n-1)のカイ2乗分布\chi2(n-1)に従う。 (8)2つの正規分布の分散比 2つの分散が同じ(と仮定される)母集団N(\mu1,\sigma2)、N(\mu2,\sigma2)からそれぞれ n1、n2個の独立した標本をとり、標本分散をそれぞれS12、S22とすると、 S12S22は自由度(n1-1,n2-1)のF分布に従う。 (9)指数分布 $$X_1,X_2, \cdots ,X_n$$が独立で、平均$$\lambda$$の指数分布に従うとき、 2\lambda(X1+X2+ \cdots +Xn)は自由度2nのカイ2乗分布\chi2(2n)に従う。 これを利用して、\lambdaの信頼係数(1-\epsilon)の区間推定を考える。 今n個の標本の合計値がSnのとき、 P(\chi22n(1-\epsilon2) \le 2\lambdaSn \le \chi22n(\epsilon2))=1-\epsilon よって、2Sn \chi22n(\epsilon2) \le \lambda \le 2Sn \chi22n(1-\epsilon2) ただし、\chi22n(\epsilon)は、自由度2nのカイ2乗分布の上側\epsilon点) (10)相関係数 2次元正規母集団N(\mu1,\mu2;\sigma12,\sigma22,\rho)からとった大きさnの標本 {(x1,y1),(x2,y2), \cdots ,(xn,yn),} によって作られる母相関係数\rhoの推定値 r= を標本相関係数という。 \rho=0ならばT=n-2r1-r2は自由度n-2のt分布t(n-2)に従う。 (11)ポワソン分布 Xがポワソン分布Po(\lambda)に従い、Y1、Y2はそれぞれ自由度2k、2(k+1)のカイ2乗分布\chi2(2k)、\chi2(2(k+1))に従うとすると、 P(X \ge k)=P(Y1 \le 2\lambda)、P(X \le k)=P(Y2>2\lambda) これを利用して、\lambdaの信頼係数(1-\epsilon)の区間推定を考える。 いまPo(\lambda)からn個の独立な標本X1、X2、 \cdots 、Xnを抽出して、その合計値がkであったとする。 X=X1+X2+ \cdots +Xnとすると、Xはポワソン分布Po(n\lambda)に従うので、 P(X \ge k)=P(Y1 \le 2n\lambda)、P(X \le k)=P(Y2>2n\lambda) よって、 \lambdaa=12n\chi22k(1-\epsilon2)、\lambdab=12n\chi22k+2(\epsilon2) とおくと、 \lambdaa \le \lambdaならばP(X \ge k)=P(Y1 \le 2n\lambda) \ge P(Y1 \le \chi22k(1-\epsilon2))=\epsilon2 \lambda \le \lambdabならばP(X \le k)=P(Y2>2n\lambda) \ge P(Y2>\chi22k+2(\epsilon2))=\epsilon2 よって、推定区間は、 (\lambdaa,\lambdab)つまり(12n\chi22k(1-\epsilon2),12n\chi22k+2(\epsilon2)) (12)成功確率の区間推定(正規近似できないとき) Xが2項分布Bi(n,p)に従い、Y1、Y2はそれぞれ自由度 (2(k+1),2(n-k))、(2(n-k+1),2k)のF分布に従うとすると、 P(X \le k)=P(Y1 \ge (n-k)p(k+1)(1-p))、 P(X \ge k)=P(Y2 \ge k(1-p)(n-k+1)p) これを利用して、pの信頼係数(1-\epsilon)の区間推定を考える。 いま成功確率pのベルヌーイ試行をn回行ったときの成功回数は2項分布Bi(n,p)に従う。実際に、k回成功したとする。 ここで、 k(1-pa)(n-k+1)pa= をみたすpaを考えると、p \ge paに対し、 k(1-p)(n-k+1)p \le k(1-pa)(n-k+1)pa= なので、 P(X \ge k)=P(Y2 \ge k(1-p)(n-k+1)p) \ge P(Y2 \ge )=\epsilon2 が成り立つ。 また、(n-k)pb(k+1)(1-pb)= をみたすpbを考えると、p \le pbに対し、 k(1-p)(n-k+1)p \le (n-k)pb(k+1)(1-pb)= なので、 P(X \ge k)=P(Y1 \ge (n-k)p(k+1)(1-p)) \ge P(Y2 \ge )=\epsilon2 が成り立つ。 よって、推定区間は、(pa,pb)つまり (kk+ \cdot (n-k+1),(s+1) n-k+(k+1) ) (13)適合度 母集団が、k個の排反する階級A1、A2、 \cdots Akに分類されている。 仮説$$H_0:A_1,A_2, \cdots A_k$$の現れる確率はそれぞれ$$p_1,p_2, \cdots p_k$$である。 母集団から大きさ$$n$$の標本をとったとき、各階級の観察度数と理論度数は下の表のようになった。($$m_i=n \cdot p_i$$) このとき、 u=i=1k(ni-mi)2mi は、miがあまり小さくない(各mi \ge 5)とき、近似的に自由度(k-1)のカイ2乗分布に従う。 (14)独立性(2×2分割表) 1つの試行の結果が性質AについてはAとA'に性質BについてはBとB'に分類され、結局排反する4つの階級A \cap B、A \cap B'、A' \cap B、A' \cap B'のいずれかただ1つに分類されるものとする。いまN回の独立試行の結果、下の2×2分割表に示す度数を得たものとする。 AとBが互いに独立なら、 u=(ad-bc)2N(a+b)(c+d)(a+c)(b+d) は近似的に自由度1のカイ2乗分布に従う。
編集中

表示オプション

横に並べて表示:
変化行の前後のみ表示: