機率和統計回顧

Star

作者：阿夫辛·阿米迪和謝爾文·阿米迪

翻譯者： kevingo

審校者：徐承漢

幾率與組合數學介紹

樣本空間一個實驗的所有可能結果的集合稱之為這個實驗的樣本空間，記做 $S$

事件樣本空間的任何子集合 $E$ 被稱之為一個事件。也就是說，一個事件是實驗的可能結果的集合。如果該實驗的結果包含 $E$，我們稱我們稱 $E$ 發生

機率公理對於每個事件 $E$， we 用 $P(E)$ 表示事件 $E$ 發生的機率

公理 1 ― 每一個機率值介於 0 到 1 之間，包含兩端點。即：

\[\boxed{0\leqslant P(E)\leqslant 1}\]

公理 2 ― 至少一個基本事件出現在整個樣本空間中的機率是 1。即：

\[\boxed{P(S)=1}\]

公理 3 ― 對於任何互斥的事件 $E_1, ..., E_n$，我們定義如下：

\[\boxed{P\left(\bigcup_{i=1}^nE_i\right)=\sum_{i=1}^nP(E_i)}\]

排列排列指的是從 $n$ 個相異的物件中，取出 $r$ 個物件按照固定順序重新安排，這樣安排的數量用 $P(n, r)$ 來表示，定義為：

\[\boxed{P(n, r)=\frac{n!}{(n-r)!}}\]

組合組合指的是從 $n$ 個物件中，取出 $r$ 個物件，但不考慮他的順序。這樣組合要考慮的數量用 $C(n, r)$ 來表示，定義為：

\[\boxed{C(n, r)=\frac{P(n, r)}{r!}=\frac{n!}{r!(n-r)!}}\]

注意：對於 $0\leqslant r\leqslant n$，我們會有 $P(n,r)\geqslant C(n,r)$

條件機率

貝氏定理對於事件 $A$ 和 $B$ 滿足 $P(B)>0$ 時，我們定義如下：

\[\boxed{P(A|B)=\frac{P(B|A)P(A)}{P(B)}}\]

注意：$P(A\cap B)=P(A)P(B|A)=P(A|B)P(B)$

分割令 $\{A_i, i\in[\![1,n]\!]\}$ 對所有的 $i$，$A_i\neq\varnothing$，我們說 $\{A_i\}$ 是一個分割，當底下成立時：

\[\boxed{\forall i\neq j, A_i\cap A_j=\emptyset\quad\textrm{ 和 }\quad\bigcup_{i=1}^nA_i=S}\]

注意：對於任何在樣本空間的事件 $B$ 來說，$\displaystyle P(B)=\sum_{i=1}^nP(B|A_i)P(A_i)$

貝氏定理的擴展令 $\{A_i, i\in[\![1,n]\!]\}$ 為樣本空間的一個分割，我們定義：

\[\boxed{P(A_k|B)=\frac{P(B|A_k)P(A_k)}{\displaystyle\sum_{i=1}^nP(B|A_i)P(A_i)}}\]

獨立當以下條件滿足時，兩個事件 $A$ 和 $B$ 為獨立事件：

\[\boxed{P(A\cap B)=P(A)P(B)}\]

隨機變數

定義

隨機變數一個隨機變數 $X$，它是一個將樣本空間中的每個元素映射到實數域的函數

累積分佈函數 (CDF) 累積分佈函數 $F$ 是單調遞增的函數，其 $\underset{x\rightarrow-\infty}{\textrm{lim}}F(x)=0$ 且 $\underset{x\rightarrow+\infty}{\textrm{lim}}F(x)=1$，定義如下：

\[\boxed{F(x)=P(X\leqslant x)}\]

注意：$P(a < X\leqslant B)=F(b)-F(a)$

機率密度函數機率密度函數 $f$ 是隨機變數 $X$ 在兩個相鄰的實數值附近取值的機率

機率密度函數和累積分佈函數的關係底下是一些關於離散 (D) 和連續 (C) 的情況下的重要屬性

情況	累積分佈函數 $F$	機率密度函數 $f$	機率密度函數的屬性
(D)	$\displaystyle F(x)=\sum_{x_i\leqslant x}P(X=x_i)$	$f(x_j)=P(X=x_j)$	$\displaystyle0\leqslant f(x_j)\leqslant1\textrm{ 和 }\sum_{j}f(x_j)=1$
(C)	$\displaystyle F(x)=\int_{-\infty}^xf(y)dy$	$f(x)=\displaystyle \frac{dF}{dx}$	$\displaystyle f(x)\geqslant0\textrm{ 和 }\int_{-\infty}^{+\infty}f(x)dx=1$

分佈的期望值和動差底下是期望值 $E[X]$、一般期望值 $E[g(X)]$、第 $k$ 個動差和特徵函數 $\psi(\omega)$ 在離散和連續的情況下的表示式：

Case	$E[X]$	$E[g(X)]$	$E[X^k]$	$\psi(\omega)$
(D)	$\displaystyle \sum_{i=1}^nx_if(x_i)$	$\displaystyle \sum_{i=1}^ng(x_i)f(x_i)$	$\displaystyle \sum_{i=1}^nx_i^kf(x_i)$	$\displaystyle\sum_{i=1}^nf(x_i)e^{i\omega x_i}$
(C)	$\displaystyle \int_{-\infty}^{+\infty}xf(x)dx$	$\displaystyle \int_{-\infty}^{+\infty}g(x)f(x)dx$	$\displaystyle \int_{-\infty}^{+\infty}x^kf(x)dx$	$\displaystyle\int_{-\infty}^{+\infty}f(x)e^{i\omega x}dx$

變異數隨機變數的變異數通常表示為 Var$(X)$ 或 $\sigma^2$，用來衡量一個分佈離散程度的指標。其表示如下：

\[\boxed{\textrm{Var}(X)=E[(X-E[X])^2]=E[X^2]-E[X]^2}\]

標準差一個隨機變數的標準差通常表示為 $\sigma$，用來衡量一個分佈離散程度的指標，其單位和實際的隨機變數相容，表示如下：

\[\boxed{\sigma=\sqrt{\textrm{Var}(X)}}\]

隨機變數的轉換令變數 $X$ 和 $Y$ 由某個函式連結在一起。我們定義 $f_X$ 和 $f_Y$ 是 $X$ 和 $Y$ 的分佈函式，可以得到：

\[\boxed{f_Y(y)=f_X(x)\left|\frac{dx}{dy}\right|}\]

萊布尼茲積分法則令 $g$ 為 $x$ 和 $c$ 的函數，$a$ 和 $b$ 是依賴於 $c$ 的的邊界，我們得到：

\[\boxed{\frac{\partial}{\partial c}\left(\int_a^bg(x)dx\right)=\frac{\partial b}{\partial c}\cdot g(b)-\frac{\partial a}{\partial c}\cdot g(a)+\int_a^b\frac{\partial g}{\partial c}(x)dx}\]

機率分佈

柴比雪夫不等式令 $X$ 是一隨機變數，期望值為 $\mu$。對於 $k, \sigma>0$，我們有以下不等式：

\[\boxed{P(|X-\mu|\geqslant k\sigma)\leqslant\frac{1}{k^2}}\]

主要分佈底下是我們需要熟悉的幾個主要的分佈：

種類	分佈	PDF	$\psi(\omega)$	$E[X]$	$\textrm{Var}(X)$	示意圖
(D)	$X\sim\mathcal{B}(n, p)$	$\displaystyle \displaystyle\binom{n}{x} p^xq^{n-x}$	$(pe^{i\omega}+q)^n$	$np$	$npq$
(D)	$X\sim\textrm{Po}(\mu)$	$\displaystyle \frac{\mu^x}{x!}e^{-\mu}$	$e^{\mu(e^{i\omega}-1)}$	$\mu$	$\mu$
(C)	$X\sim\mathcal{U}(a, b)$	$\displaystyle \frac{1}{b-a}$	$\displaystyle\frac{e^{i\omega b}-e^{i\omega a}}{(b-a)i\omega}$	$\displaystyle\frac{a+b}{2}$	$\displaystyle\frac{(b-a)^2}{12}$
(C)	$X\sim\mathcal{N}(\mu, \sigma)$	$\displaystyle \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$	$e^{i\omega\mu-\frac{1}{2}\omega^2\sigma^2}$	$\mu$	$\sigma^2$
(C)	$X\sim\textrm{Exp}(\lambda)$	$\displaystyle \lambda e^{-\lambda x}$	$\displaystyle\frac{1}{1-\frac{i\omega}{\lambda}}$	$\displaystyle\frac{1}{\lambda}$	$\displaystyle\frac{1}{\lambda^2}$

聯合分佈隨機變數

邊緣密度和累積分佈從聯合密度機率函數 $f_{XY}$ 中我們可以得到：

種類	邊緣密度函數	累積函數
(D)	$\displaystyle f_X(x_i)=\sum_{j}f_{XY}(x_i,y_j)$	$\displaystyle F_{XY}(x,y)=\sum_{x_i\leqslant x}\sum_{y_j\leqslant y}f_{XY}(x_i,y_j)$
(C)	$\displaystyle f_X(x)=\int_{-\infty}^{+\infty}f_{XY}(x,y)dy$	$\displaystyle F_{XY}(x,y)=\int_{-\infty}^x\int_{-\infty}^yf_{XY}(x',y')dx'dy'$

條件密度 $X$ 對於 $Y$ 的條件密度，通常用 $f_{X|Y}$ 表示如下：

\[\boxed{f_{X|Y}(x)=\frac{f_{XY}(x,y)}{f_Y(y)}}\]

獨立當滿足以下條件時，我們稱隨機變數 $X$ 和 $Y$ 互相獨立：

\[\boxed{f_{XY}(x,y)=f_X(x)f_Y(y)}\]

共變異數我們定義隨機變數 $X$ 和 $Y$ 的共變異數為 $\sigma_{XY}^2$ 或 $\textrm{Cov}(X,Y)$ 如下：

\[\boxed{\textrm{Cov}(X,Y)\triangleq\sigma_{XY}^2=E[(X-\mu_X)(Y-\mu_Y)]=E[XY]-\mu_X\mu_Y}\]

相關我們定義 $\sigma_X$、$\sigma_Y$ 為 $X$ 和 $Y$ 的標準差，而 $X$ 和 $Y$ 的相關係數 $\rho_{XY}$ 定義如下：

\[\boxed{\rho_{XY}=\frac{\sigma_{XY}^2}{\sigma_X\sigma_Y}}\]

注意一：對於任何隨機變數 X 和 Y 來說，$\rho_{XY}\in[-1,1]$ 成立

注意二：當 $X$ 和 $Y$ 獨立時，$\rho_{XY} = 0$

參數估計

定義

隨機抽樣隨機抽樣指的是 $n$ 個隨機變數 $X_1, ..., X_n$ 和 $X$ 獨立且同分佈的集合

估計量估計量是一個資料的函數，用來推斷在統計模型中未知參數的值

偏差一個估計量的偏差 $\hat{\theta}$ 定義為 $\hat{\theta}$ 分佈期望值和真實值之間的差距：

\[\boxed{\textrm{Bias}(\hat{\theta})=E[\hat{\theta}]-\theta}\]

注意：當 $E[\hat{\theta}]=\theta$ 時，我們稱為不偏估計量

平均數

樣本平均一個隨機樣本的樣本平均是用來預估一個分佈的真實平均 $\mu$，通常我們用 $\overline{X}$ 來表示，定義如下：

\[\boxed{\overline{X}=\frac{1}{n}\sum_{i=1}^nX_i}\]

注意：當 $E[\overline{X}]=\mu$ 時，則為不偏樣本平均

中央極限定理當我們有一個隨機樣本 $X_1, ..., X_n$ 滿足一個給定的分佈，其平均數為 $\mu$，變異數為 $\sigma^2$，我們有：

\[\boxed{\overline{X}\underset{n\rightarrow+\infty}{\sim}\mathcal{N}\left(\mu, \frac{\sigma}{\sqrt{n}}\right)}\]

變異數

樣本變異數一個隨機樣本的樣本變異數是用來估計一個分佈的真實變異數 $\sigma^2$，通常使用 $s^2$ 或 $\hat{\sigma}^2$ 來表示，定義如下：

\[\boxed{s^2=\hat{\sigma}^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2}\]

注意：當 $E[s^2]=\sigma^2$ 時，稱之為不偏樣本變異數

與樣本變異數的卡方關聯令 $s^2$ 是一個隨機樣本的樣本變異數，我們可以得到：

\[\boxed{\frac{s^2(n-1)}{\sigma^2}\sim\chi_{n-1}^2}\]

如需上述概念的更詳細概述，請查看機率與統計速查表！