Olasılık ve İstatistik hatırlatma
Giriş
Örnek alanı Bir deneyin olası tüm sonuçlarının kümesidir, deneyin örnek alanı olarak bilinir và $S$ ile gösterilir.
Olay Örnek alanın herhangi bir $E$ alt kümesi, olay olarak bilinir. Yani bir olay, deneyin olası sonuçlarından oluşan bir kümedir. Deneyin sonucu $E$'de varsa, $E$'nin gerçekleştiğini söyleriz.
Olasılık aksiyomları Her $E$ olayı için, $E$ olayının meydana gelme olasılığı $P(E)$ olarak ifade edilir.
Aksiyom 1 ― Her olasılık 0 và 1 de dahil olmak üzere 0 và 1 arasındadır, yani:
Aksiyom 2 ― Tüm örnek uzayındaki temel olaylardan en az birinin ortaya çıkma olasılığı 1'dir, yani:
Aksiyom 3 ― Karşılıklı özel olayların herhangi bir dizisi için, $E_1, ..., E_n$:
Permütasyon Permütasyon, $n$ nesneler havuzundan $r$ nesnelerinin belirli bir sıra ile düzenlenmesidir. Bu tür düzenlemelerin sayısı $P(n, r)$ tarafından aşağıdaki gibi tanımlanır:
Kombinasyon Bir kombinasyon, sıranın önemli olmadığı $n$ nesneler havuzundan $r$ nesnelerinin bir düzenlemesidir. Bu tür düzenlemelerin sayısı $C(n,r)$ tarafından aşağıdaki gibi tanımlanır:
Not: $0\leqslant r\leqslant n$ için $P(n,r)\geqslant C(n,r)$ değerine sahibiz.
Koşullu olasılık
Bayes kuralı $A$ và $B$ olayları için $P(B)>0$ olacak şekilde:
Not: $P(A\cap B)=P(A)P(B|A)=P(A|B)P(B)$.
Parça Tüm $i$ değerleri için $A_i\neq\varnothing$ olmak üzere $\{A_i, i\in[\![1,n]\!]\}$ olsun. $\{A_i\}$ bir parça olduğunu söyleriz eğer :
Not: Örneklem uzaydaki herhangi bir $B$ olayı için $\displaystyle P(B)=\sum_{i=1}^nP(B|A_i)P(A_i)$'ye sahibiz.
Genişletilmiş Bayes kuralı formu $\{A_i, i\in[\![1,n]\!]\}$ örneklem uzayının bir bölümü olsun. Elde edilen:
Bağımsızlık İki olay $A$ và $B$ birbirinden bağımsızdır ancak và ancak eğer:
Rastgele değişkenler
Tanımlamalar
Rastgele değişken Genellikle $X$ olarak ifade edilen rastgele bir değişken, bir örneklem uzayındaki her öğeyi gerçek bir çizgiye eşleyen bir fonksiyondur.
Kümülatif dağılım fonksiyonu (KDF) Monotonik olarak azalmayan và $\underset{x\rightarrow-\infty}{\textrm{lim}}F(x)=0$ và $\underset{x\rightarrow+\infty}{\textrm{lim}}F(x)=1$ olacak şekilde kümülatif dağılım fonksiyonu $F$ şu şekilde tanımlanır:
Not: $P(a < X\leqslant B)=F(b)-F(a)$.
Olasılık yoğunluğu fonksiyonu (OYF) Olasılık yoğunluğu fonksiyonu $f$, $X$'in rastgele değişkenin iki bitişik gerçekleşmesi arasındaki değerleri alması ihtimalidir.
OYF và KDF'yi içeren ilişkiler Ayrık (D) và sürekli (C) olaylarında bilmeniz gereken önemli özelliklerdir.
| Olay | KDF $F$ | OYF $f$ | OYF Özellikleri |
| (D) | $\displaystyle F(x)=\sum_{x_i\leqslant x}P(X=x_i)$ | $f(x_j)=P(X=x_j)$ | $\displaystyle0\leqslant f(x_j)\leqslant1\textrm{ and }\sum_{j}f(x_j)=1$ |
| (C) | $\displaystyle F(x)=\int_{-\infty}^xf(y)dy$ | $f(x)=\displaystyle \frac{dF}{dx}$ | $\displaystyle f(x)\geqslant0\textrm{ ve }\int_{-\infty}^{+\infty}f(x)dx=1$ |
Beklenti và Dağılım Momentleri Burada, ayrık và sürekli durumlar için beklenen değer $E[X]$, genelleştirilmiş beklenen değer $E[g(X)]$, $k$. Moment $E[X^k]$ và karakteristik fonksiyon $\psi(\omega)$ ifadeleri verilmiştir :
| Olay | $E[X]$ | $E[g(X)]$ | $E[X^k]$ | $\psi(\omega)$ |
| (D) | $\displaystyle \sum_{i=1}^nx_if(x_i)$ | $\displaystyle \sum_{i=1}^ng(x_i)f(x_i)$ | $\displaystyle \sum_{i=1}^nx_i^kf(x_i)$ | $\displaystyle\sum_{i=1}^nf(x_i)e^{i\omega x_i}$ |
| (C) | $\displaystyle \int_{-\infty}^{+\infty}xf(x)dx$ | $\displaystyle \int_{-\infty}^{+\infty}g(x)f(x)dx$ | $\displaystyle \int_{-\infty}^{+\infty}x^kf(x)dx$ | $\displaystyle\int_{-\infty}^{+\infty}f(x)e^{i\omega x}dx$ |
Varyans Genellikle Var$(X)$ veya $\sigma^2$ olarak ifade edilen rastgele değişkenin varyansı, dağılım fonksiyonunun yayılmasının bir ölçüsüdür. Aşağıdaki şekilde belirlenir:
Standart sapma Genellikle $\sigma$ olarak ifade edilen rastgele bir değişkenin standart sapması, gerçek rastgele değişkenin birimleriyle uyumlu olan dağılım fonksiyonunun yayılmasının bir ölçüsüdür. Aşağıdaki şekilde belirlenir:
Rastgele değişkenlerin dönüşümü $X$ và $Y$ değişkenlerinin bazı fonksiyonlarla bağlanır. $f_X$ và $f_Y$'ye sırasıyla $X$ và $Y$'nin dağılım fonksiyonu şöyledir:
Leibniz integral kuralı $g$, $x$'e và potansiyel olarak $c$'nin, $c$'ye bağlı olabilecek potansiyel $c$ và $a, b$ sınırlarının bir fonksiyonu olsun. Elde edilen:
Olasılık dağılımları
Chebyshev'in eşitsizliği $X$ beklenen değeri $\mu$ olan rastgele bir değişken olsun. $k, \sigma>0$ için aşağıdaki eşitsizliği elde edilir:
Ana dağılımlar İşte akılda tutulması gereken ana dağılımlar:
| Tür | Dağılım | OYF | $\psi(\omega)$ | $E[X]$ | $\textrm{Var}(X)$ | Illustration |
| (D) | $X\sim\mathcal{B}(n, p)$ | $\displaystyle P(X=x)=\displaystyle\binom{n}{x} p^xq^{n-x}$ | $(pe^{i\omega}+q)^n$ | $np$ | $npq$ | ![]() |
| (D) | $X\sim\textrm{Po}(\mu)$ | $\displaystyle P(X=x)=\frac{\mu^x}{x!}e^{-\mu}$ | $e^{\mu(e^{i\omega}-1)}$ | $\mu$ | $\mu$ | ![]() |
| (C) | $X\sim\mathcal{U}(a, b)$ | $\displaystyle f(x)=\frac{1}{b-a}$ | $\displaystyle\frac{e^{i\omega b}-e^{i\omega a}}{(b-a)i\omega}$ | $\displaystyle\frac{a+b}{2}$ | $\displaystyle\frac{(b-a)^2}{12}$ | ![]() |
| (C) | $X\sim\mathcal{N}(\mu, \sigma)$ | $\displaystyle f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$ | $e^{i\omega\mu-\frac{1}{2}\omega^2\sigma^2}$ | $\mu$ | $\sigma^2$ | ![]() |
| (C) | $X\sim\textrm{Exp}(\lambda)$ | $\displaystyle f(x) = \lambda e^{-\lambda x}$ | $\displaystyle\frac{1}{1-\frac{i\omega}{\lambda}}$ | $\displaystyle\frac{1}{\lambda}$ | $\displaystyle\frac{1}{\lambda^2}$ | ![]() |
Ortak dağınık rastgele değişkenler
Marjinal yoğunluk và kümülatif dağılım $f_{XY}$ ortak yoğunluk olasılık fonksiyonundan:
| Olay | Marjinal yoğunluk | Kümülatif fonksiyon |
| (D) | $\displaystyle f_X(x_i)=\sum_{j}f_{XY}(x_i,y_j)$ | $\displaystyle F_{XY}(x,y)=\sum_{x_i\leqslant x}\sum_{y_j\leqslant y}f_{XY}(x_i,y_j)$ |
| (C) | $\displaystyle f_X(x)=\int_{-\infty}^{+\infty}f_{XY}(x,y)dy$ | $\displaystyle F_{XY}(x,y)=\int_{-\infty}^x\int_{-\infty}^yf_{XY}(x',y')dx'dy'$ |
Koşullu yoğunluk $Y$'ye göre $X$'in koşullu yoğunluğu, genellikle $f_{X|Y}$ olarak elde edilir:
Bağımsızlık İki rastgele değişkenin $X$ và $Y$ olması durumunda bağımsız olduğu söylenir:
Kovaryans $\sigma_{XY}^2$ veya daha genel olarak $\textrm{Cov}(X,Y)$ olarak elde ettiğimiz iki rastgele değişken olan $X$ và $Y$'nin kovaryansını aşağıdaki gibi tanımlarız:
Korelasyon $\sigma_X, \sigma_Y$, $X$ và $Y$'nin standart sapmalarını elde ederek, $\rho_{XY}$ olarak belirtilen rastgele $X$ và $Y$ değişkenleri arasındaki korelasyonu şu şekilde tanımlarız:
Not 1: $X, Y$'nin herhangi bir rastgele değişkeni için $\rho_{XY}\in[-1,1]$ olduğuna dikkat edin.
Not 2: Eğer $X$ và $Y$ bağımsızsa, $\rho_{XY} = 0$ olur.
Parametre tahmini
Tanımlamalar
Rastgele örnek Rastgele bir örnek, bağımsız và aynı şekilde $X$ ile dağıtılan $X_1, ..., X_n$ değişkeninin rastgele değişkenidir.
Tahminci (Kestirimci) Tahmin edici, istatistiksel bir modelde bilinmeyen bir parametrenin değerini ortaya çıkarmak için kullanılan verilerin bir fonksiyonudur.
Önyargı Bir tahmin edicinin önyargısı $\hat{\theta}$, $\hat{\theta}$ dağılımının beklenen değeri ile gerçek değer arasındaki fark olarak tanımlanır, yani:
Not: $E[\hat{\theta}]=\theta$ olduğunda bir tahmincinin tarafsız olduğu söylenir.
Ortalamayı tahmin etme
Örnek ortalaması Rastgele bir numunenin numune ortalaması, dağılımın gerçek ortalamasını tahmin etmek için kullanılır, genellikle $\overline{X}$ olarak belirtilir và şöyle tanımlanır:
Not: örnek ortalama tarafsız, yani: $E[\overline{X}]=\mu$.
Merkezi Limit Teoremi Ortalama $\mu$ và varyans $\sigma^2$ ile verilen bir dağılımın ardından rastgele bir $X_1, ..., X_n$ örneğine sahip olalım.
Varyansı tahmin etmek
Örnek varyansı Rastgele bir örneğin örnek varyansı, bir dağılımın $\sigma^2$ gerçek varyansını tahmin etmek için kullanılır, genellikle $s^2$ veya $\hat{\sigma}^2$ olarak elde edilir và aşağıdaki gibi tanımlanır:
Not: Örneklem sapması yansızdır, $E[s^2]=\sigma^2$.
Örnek varyansı ile ki-kare ilişkisi $s^2$, rastgele bir örneğin örnek varyansı olsun. Elde edilir:
CS 229 - Makine Öğrenimi 



