29 - Zufallsvektoren
Ist \(\Omega\) abzählbar, dann wird eine Abbildung $$\boldsymbol{X}: \Omega \rightarrow\mathbb{R}^n, \quad \omega\mapsto\boldsymbol{X}(\omega)=(X_1(\omega),\ldots,X_n(\omega)),$$ Zufallsvektor genannt.
Ist \(\Omega\) überabzählbar und mit einer Ergebnisalgebra \(\mathcal{A}\) versehen, dann müssen alle \(X_i,i=1,\ldots,n,\) die folgende Bedingung erfüllen: Alle Teilmengen der Form \(\{\omega\in\Omega:X_i(\omega)\in B\}\), wobei \(B\) eine Borelsche Menge ist, müssen Ereignisse von \(\Omega\) sein.
Verteilung
Für einen Zufallsvektor \(\boldsymbol{X}=(X_1,\ldots,X_n)\) mit Werten in \(\mathcal{X}\subset\mathbb{R}^n\) wird durch $$P_X(A)=P(\boldsymbol{X}\in A)=P((X_1,\ldots,X_n)\in A)$$ eine Wahrscheinlichkeitsverteilung auf \(\mathcal{X}\) definiert, wobei jedem Ereignis \(A\in\mathcal{X}\) die Wahrscheinlichkeit zugeordnet wird, dass \(\boldsymbol{X}\) in der Menge \(A\) realisiert wird. \(P_X\) heißt Verteilung von \(\boldsymbol{X}\).
Sei \(\boldsymbol{X}=(X_1,\ldots,X_n)\) ein Zufallsvektor mit Werten in \(\mathcal{X}\subset\mathbb{R}^n\). Dann heißt die Funktion \(F:\mathbb{R}^n\rightarrow[0,1],\) $$F(x_1,\ldots,x_n)=P(X_1\leq x_1,\ldots,X_n\leq x_n), \quad x_1,\ldots,x_n\in\mathbb{R},$$ Verteilungsfunktion von \(\boldsymbol{X}\).
Eigenschaften
- \(F(x_1,\ldots,x_n)\) ist in jedem Argument monoton wachsend.
- $$\lim_{x_i\rightarrow\infty}F(x_1,\ldots,x_n)=P(X_1\leq x_1,\ldots,X_{i-1}\leq x_{i-1},X_{i+1}\leq x_{i+1},\ldots,X_n\leq x_n).$$
- $$\lim_{x_i\rightarrow-\infty}F(x_1,\ldots,x_n)=0, \quad \lim_{x_1,\ldots,x_n\rightarrow\infty}F(x_1,\ldots,x_n)=1.$$
Produktverteilung
Wenn \(F_1(x),\ldots,F_n(x)\) Verteilungsfunktionen auf \(\mathbb{R}\) sind, dann ist $$F(x_1,\ldots,x_n)=F_1(x_1)\cdot F_2(x_2)\cdot\ldots\cdot F_n(x_n)$$ eine Verteilungsfunktion auf \(\mathbb{R}^n\), deren zugehörige Verteilung Produktverteilung heißt.
Für einen Zufallsvektor \(\boldsymbol{X}=(X_1,\ldots,X_n)\sim F_1(x_1)\cdot F_2(x_2)\cdot\ldots\cdot F_n(x_n)\) gilt:
- \(X_i\sim F_i(x)\), \(x\in\mathbb{R}\), für alle \(i=1,\ldots,n\),
- \(X_1,\ldots,X_n\) sind stochastisch unabhängig.
Diskrete Zufallsvektoren
Nimmt ein Zufallsvektor nur Werte in einer diskreten Menge an, dann wird er diskreter Zufallsvektor genannt.
Zähldichte
Die Funktion \(p_{\boldsymbol{X}}:\mathbb{R}^n\rightarrow[0,1],\) $$p_{\boldsymbol{X}}(\boldsymbol{x})=P(\boldsymbol{X}=\boldsymbol{x}), \quad \boldsymbol{x}\in\mathbb{R}^n,$$ wird (multivariate) Zähldichte (oder Wahrscheinlichkeitsfunktion) von \(\boldsymbol{X}\) genannt.
Sind \(\mathcal{X}=\{x_1,x_2,\ldots\}\subset\mathbb{R}^n\) eine diskrete Punktmenge und \(p_1,p_2,\ldots\) Zahlen aus dem Intervall \([0,1]\) mit \(\sum_{i=1}^np_i=1\), dann erhält man durch $$p(\boldsymbol{x})=\left\{\begin{aligned}p_i, \quad &\boldsymbol{x}=\boldsymbol{x}_i\\ 0, \ \quad &\boldsymbol{x}\notin\mathcal{X}\end{aligned}\right.$$ eine Zähldichte \(p\).
Produkt-Zähldichte
Sind \(p_1(x),\ldots,p_n(x)\) Zähldichten auf den Mengen \(\mathcal{X}_1,\ldots,\mathcal{X}_n\), dann ist $$p(x_1,\ldots,x_n)=p(x_1)\cdot\ldots\cdot p(x_n)$$ eine Zähldichte auf \(\mathcal{X}_1\times\ldots\times\mathcal{X}_n\) und heißt Produkt-Zähldichte.
Ist \((X_1,\ldots,X_n)\sim p(x_1)\cdot\ldots\cdot p(x_n)\), dann sind die Koordinaten unabhängig mit \(X_i\sim p_i(x),i=1,\ldots,n\).
Rand-Zähldichte
Ist \((X,Y)\sim p_{(X,Y)}(x,y)\), dann heißen $$p_X(x)=\sum_{y\in\mathcal{Y}}\,p_{(X,Y)}(x,y) \quad \text{und} \quad p_y(y)=\sum_{x\in\mathcal{X}}\,p_{(X,Y)}(x,y)$$ Rand-Zähldichten.
Allgemein erhält man die Rand-Zähldichte eines Teilvektors durch Summation über alle Komponenten, die nicht zum Teilvektor gehören.
Stetige Zufallsvektoren
Ein Zufallsvektor \(\boldsymbol{X}=(X_1,\ldots,X_n)\) ist stetig (verteilt), wenn eine nichtnegative Funktion \(f_{\boldsymbol{X}}(x_1,\ldots,x_n)\) existiert, sodass $$P(\boldsymbol{X}\in(\boldsymbol{a},\boldsymbol{b}])=P(a_1<X_1\leq b_1,\ldots,a_n<X_n\leq b_n)$$$$\qquad\qquad\qquad\qquad\,\,\,\,=\int_{a_n}^{b_n}\cdots\int_{a_1}^{b_1}f_{\boldsymbol{X}}(x_1,\ldots,x_n)dx_1\ldots dx_n$$ für alle Intervalle \((\boldsymbol{a},\boldsymbol{b}]\subset\mathbb{R}^n, \boldsymbol{a}=(a_1,\ldots,a_n),\boldsymbol{b}=(b_1,\ldots,b_n)\in\mathbb{R}^n,\) gilt. Notation: \(\boldsymbol{X}\sim f_{\boldsymbol{X}}\).
Dichtefunktion
Eine nicht-negative Funktion \(f(x_1,\ldots,x_n)\) heißt (multivariate) Dichtefunktion, wenn $$\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}f(x_1,\ldots,x_n)dx_1\ldots dx_n=1.$$ Durch sie ist eine eindeutige Wahrscheinlichkeitsverteilung auf \(\mathbb{R}^n\) definiert.
Randdichte
Ist \((X_1,\ldots,X_n)\sim f(x_1,\ldots,x_n)\), dann ist die \(i\)-te Randdichte gegeben durch $$f_{X_i}(x_i)=\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}f(x_1,\ldots,x_n)dx_1\ldots dx_{i-1}dx_{i+1}\ldots dx_n.$$
Allgemein erhält man die Randdichte eines Teilvektors, indem man die gemeinsame Dichte über alle anderen Variablen integriert.
Produktdichte
Sind \(f_1(x),\ldots,f_n(x)\) Dichtefunktionen auf \(\mathbb{R}\), dann ist die Produktdichte definiert durch $$f(x_1,\ldots,x_n)=f_1(x_1)\cdot\ldots\cdot f_n(x_n).$$
Ist \((X_1,\ldots,X_n)\sim f_1(x_1)\cdot\ldots\cdot f_n(x_n)\), dann sind die Koordinaten unabhängig mit \(X_i\sim f_i(x_i), i=1,\ldots,n\).
Bedingte Verteilung
Bedingte Zähldichte für diskrete Zufallsvektoren
Ist \((X,Y)\) ein diskret verteilter Zufallsvektor mit Zähldichte \(p(x,y)\), dann definiert die bedingte Zähldichte $$p_{X|Y}(x|y)=P(X=x|Y=y)=\left\{\begin{aligned}\frac{p(x,y)}{p_Y(y)}, \quad &y\in\{y_1,y_2,\ldots\}\\ p_X(x), \ \ \quad &y\notin\{y_1,y_2,\ldots\}\end{aligned}\right.$$ die bedingte Verteilung von \(X\) gegeben \(Y\). Notation: \(X|Y=y\sim p_{X|Y}(x|y)\).
Bedingte Dichtefunktion für stetige Zufallsvektoren
Sind \(X\) und \(Y\) stetige Zufallsvektoren mit gemeinsamer Dichtefunktion \(f(x,y)\), dann wird $$f_{X|Y}(x|y)=\left\{\begin{aligned}\frac{f(x,y)}{f_Y(y)}, \quad &f_Y(y)>0\\ f_X(x), \ \ \quad &f_Y(y)=0\end{aligned}\right.$$ bedingte Dichtefunktion von \(X\) gegeben \(Y=y\) genannt. Notation: \(X|Y=y\sim f_{X|Y}(x|y)\).
Faktorisierung
Ist \(X|Y=y\sim f(x|y)\), dann gilt für die gemeinsame Dichtefunktion $$f(x,y)=f(x|y)f(y)=f(y|x)f(x).$$
Bedingte Erwartung
Ist \((X,Y)\) diskret verteilt mit Zähldichte \(p(x,y)\), dann ist der bedingte Erwartungswert von \(X\) gegeben \(Y=y\) definiert durch $$E(X|Y=y)=\sum_{x\in\mathcal{X}}\,xp_{X|Y}(x|y).$$
Ist \((X,Y)\sim f_{(X,Y)}(x,y)\) stetig, dann gilt $$E(X|Y=y)=\int xf_{X|Y}(x|y)dx.$$
Kritierien für stochastische Unabhängigkeit
Sind \(X\) und \(Y\) diskret verteilt mit gemeinamer Zähldichte \(p_{X,Y}(x,y)\), dann sind \(X\) und \(Y\) genau dann stochastisch unabhängig, wenn $$p_{X|Y}(x|y)=p_X(x) \quad \text{bzw.} \quad p_{Y|X}(y|x)=p_Y(y) \quad \text{für alle \(x\) und \(y\)}.$$
Sind \(X\) und \(Y\) stetig verteilt mit gemeinsamer Dichte \(f(x,y)\), dann sind \(X\) und \(Y\) genau dann stochastisch unabhängig, wenn $$f_{X|Y}(x)=f_X(x) \quad \text{bzw.} \quad f_{Y|X}(y)=f_Y(y) \quad \text{für alle \(x\) und \(y\)}.$$
Produktkriterium
Ein Zufallsvektor \((X,Y)\) ist genau dann stochastisch unabhängig, wenn $$F_{X,Y}(x,y)=F_X(x)\cdot F_Y(y) \quad \text{für alle \(x,y\in\mathbb{R}\)}.$$
Erwartungswertvektor und Kovarianzmatrix
Erwartungswertvektor
Ist \(\boldsymbol{X}=(X_1,\ldots,X_n)'\) ein Zufallsvektor, und existieren die \(n\) Erwartungswerte \(\mu_i=E(X_i), i=1,\ldots,n,\) dann heißt \(\mu=(E(X_1),\ldots,E(X_n))'\) Erwartungswertvektor von \(\boldsymbol{X}\).
Die Rechenregeln für den Erwartungswert übertragen sich auf Erwartungswertvektoren.
Kovarianzmatrix
Ist \(\boldsymbol{X}=(X_1,\ldots,X_n)\) ein Zufallsvektor, dann heißt die \((n\times n)\)-Matrix \(\text{Var}(\boldsymbol{X})=(\text{Cov}(X_i,X_j))_{i,j}\) Kovarianzmatrix von \(\boldsymbol{X}\).