連續的概率分佈
Basic Concept
與discrets probability distribution不同的是, continuous probability distribution是連續的. 前者的變量只能是整數, 而後者是整個實數域.
與離散的寫法類似, 其概率通常寫做 $P(X \leq x)$. 但需要注意的是, 對於一個continuous probability distribution來說, $P(X=x)=0$, 意味着對於一個連續的概率分佈而言, 得到一個特定的值的概率爲0. 需要注意的是, 在這裏所指的“概率爲0”並不意味着一定不可能出現(可以和“在實數域上隨便取一點, 該點爲有理數的概率爲0”類比).
需要注意,和離散的概率分佈一樣,對於一個連續的概率分佈,它所有事件發生的概率的總和一定爲1,即
$$\int_{-\infty}^{\infty}f(x)=1$$
這個通常會作爲檢驗一個概率分佈是否有效的方式.
通常我們將Probability distribution function寫作$f(x)$. 那麼, 對於這樣一個distribution, $P(a \leq x \leq b)=\int_{a}^{b} f(x) \ \mathrm{d}x$. 其實從這裏也能得到和剛纔所說的一樣的結論, $P(X=x)=0$, 畢竟對於一個積分來說, 當上下限相等的時候, 他結果肯定等於0.
根據Probability distribution function, 我們可以得到Cumulative distribution function $F(x)= P(X \leq x)=\int_{-\infty}^{x} f(t) \ \mathrm{d}t$
Expactation: $\mu = \mathbb{E}[x]=\int_{-\infty}^{\infty}xf(x) \mathrm{d}x$
Varience: $Var(x) = \int_{-\infty}^{\infty}x^2 f(x) \mathrm{d}x - \mu^2$
Median (中位數): $m$ satisfies $P(x \leq m)=P(x \leq m) = 1/2$. 通常會用Cumulative distribution function形式,如
$$\int_{-\infty}^{m} f(x)\ \mathrm{d}x \ = \ \int_{m}^{\infty}f(x) \mathrm{d}x = 1/2$$
Mode (衆數): where the probability distribution has a maximum
Normal Distribution
Symbol: $X \sim N(\mu, {\sigma}^2)$, 其中$\mu$代表Expectation $\mathbb{E}(x)$, ${\sigma}^2$ 代表Variance $Var(x)$
Definition: $f(x) = \frac{1}{\sqrt{2 \pi \sigma}} e^{-\frac{(x-\mu)^{2}}{2{\mu}^{2}}}$
需要注意的是,對於這個函數,他的積分(也就是Cumulative distribution function)不能用初等函數表示. 題目裏通常會給,如 $\phi(z)=\int_{-\infty}^{t} f(x) \mathrm{d}x$
Facts:
對於一個正態分佈,它的mode(衆數)是$\mu$ (也就是這個圖像的最高點所對應的x值),並且這個函數圖像是沿$x=\mu$左右對稱.
If $x \sim B(u, p)$ (注:$B(u, p)$是Binomial distribution), and n is “large”, p is “close to” 1/2, then $x$ can be approximated as a normal distribution $x \sim N(np, np(1-p))$ (類似於“拋硬幣”).
If $x \sim Po(\lambda)$ (注: $Po(\lambda)$是Poisson distribution), and $\lambda$ is large, the $x$ can be approximated by a normal distribution $x \sim N(\lambda, \lambda)$.