29 - Zufallsvektoren

Ist $\Omega$ abzählbar, dann wird eine Abbildung $$\boldsymbol{X}: \Omega \rightarrow\mathbb{R}^n, \quad \omega\mapsto\boldsymbol{X}(\omega)=(X_1(\omega),\ldots,X_n(\omega)),$$ Zufallsvektor genannt.

Ist $\Omega$ überabzählbar und mit einer Ergebnisalgebra $\mathcal{A}$ versehen, dann müssen alle $X_i,i=1,\ldots,n,$ die folgende Bedingung erfüllen: Alle Teilmengen der Form $\{\omega\in\Omega:X_i(\omega)\in B\}$, wobei $B$ eine Borelsche Menge ist, müssen Ereignisse von $\Omega$ sein.

Verteilung

Für einen Zufallsvektor $\boldsymbol{X}=(X_1,\ldots,X_n)$ mit Werten in $\mathcal{X}\subset\mathbb{R}^n$ wird durch $$P_X(A)=P(\boldsymbol{X}\in A)=P((X_1,\ldots,X_n)\in A)$$ eine Wahrscheinlichkeitsverteilung auf $\mathcal{X}$ definiert, wobei jedem Ereignis $A\in\mathcal{X}$ die Wahrscheinlichkeit zugeordnet wird, dass $\boldsymbol{X}$ in der Menge $A$ realisiert wird. $P_X$ heißt Verteilung von $\boldsymbol{X}$.

Sei $\boldsymbol{X}=(X_1,\ldots,X_n)$ ein Zufallsvektor mit Werten in $\mathcal{X}\subset\mathbb{R}^n$. Dann heißt die Funktion $F:\mathbb{R}^n\rightarrow[0,1],$ $$F(x_1,\ldots,x_n)=P(X_1\leq x_1,\ldots,X_n\leq x_n), \quad x_1,\ldots,x_n\in\mathbb{R},$$ Verteilungsfunktion von $\boldsymbol{X}$.

Eigenschaften

$F(x_1,\ldots,x_n)$ ist in jedem Argument monoton wachsend.
$$\lim_{x_i\rightarrow\infty}F(x_1,\ldots,x_n)=P(X_1\leq x_1,\ldots,X_{i-1}\leq x_{i-1},X_{i+1}\leq x_{i+1},\ldots,X_n\leq x_n).$$
$$\lim_{x_i\rightarrow-\infty}F(x_1,\ldots,x_n)=0, \quad \lim_{x_1,\ldots,x_n\rightarrow\infty}F(x_1,\ldots,x_n)=1.$$

Produktverteilung

Wenn $F_1(x),\ldots,F_n(x)$ Verteilungsfunktionen auf $\mathbb{R}$ sind, dann ist $$F(x_1,\ldots,x_n)=F_1(x_1)\cdot F_2(x_2)\cdot\ldots\cdot F_n(x_n)$$ eine Verteilungsfunktion auf $\mathbb{R}^n$, deren zugehörige Verteilung Produktverteilung heißt.

Für einen Zufallsvektor $\boldsymbol{X}=(X_1,\ldots,X_n)\sim F_1(x_1)\cdot F_2(x_2)\cdot\ldots\cdot F_n(x_n)$ gilt:

$X_i\sim F_i(x)$, $x\in\mathbb{R}$, für alle $i=1,\ldots,n$,
$X_1,\ldots,X_n$ sind stochastisch unabhängig.

Diskrete Zufallsvektoren

Nimmt ein Zufallsvektor nur Werte in einer diskreten Menge an, dann wird er diskreter Zufallsvektor genannt.

Zähldichte

Die Funktion $p_{\boldsymbol{X}}:\mathbb{R}^n\rightarrow[0,1],$ $$p_{\boldsymbol{X}}(\boldsymbol{x})=P(\boldsymbol{X}=\boldsymbol{x}), \quad \boldsymbol{x}\in\mathbb{R}^n,$$ wird (multivariate) Zähldichte (oder Wahrscheinlichkeitsfunktion) von $\boldsymbol{X}$ genannt.

Sind $\mathcal{X}=\{x_1,x_2,\ldots\}\subset\mathbb{R}^n$ eine diskrete Punktmenge und $p_1,p_2,\ldots$ Zahlen aus dem Intervall $[0,1]$ mit $\sum_{i=1}^np_i=1$, dann erhält man durch $$p(\boldsymbol{x})=\left\{\begin{aligned}p_i, \quad &\boldsymbol{x}=\boldsymbol{x}_i\\ 0, \ \quad &\boldsymbol{x}\notin\mathcal{X}\end{aligned}\right.$$ eine Zähldichte $p$.

Produkt-Zähldichte

Sind $p_1(x),\ldots,p_n(x)$ Zähldichten auf den Mengen $\mathcal{X}_1,\ldots,\mathcal{X}_n$, dann ist $$p(x_1,\ldots,x_n)=p(x_1)\cdot\ldots\cdot p(x_n)$$ eine Zähldichte auf $\mathcal{X}_1\times\ldots\times\mathcal{X}_n$ und heißt Produkt-Zähldichte.

Ist $(X_1,\ldots,X_n)\sim p(x_1)\cdot\ldots\cdot p(x_n)$, dann sind die Koordinaten unabhängig mit $X_i\sim p_i(x),i=1,\ldots,n$.

Rand-Zähldichte

Ist $(X,Y)\sim p_{(X,Y)}(x,y)$, dann heißen $$p_X(x)=\sum_{y\in\mathcal{Y}}\,p_{(X,Y)}(x,y) \quad \text{und} \quad p_y(y)=\sum_{x\in\mathcal{X}}\,p_{(X,Y)}(x,y)$$ Rand-Zähldichten.

Allgemein erhält man die Rand-Zähldichte eines Teilvektors durch Summation über alle Komponenten, die nicht zum Teilvektor gehören.

Stetige Zufallsvektoren

Ein Zufallsvektor $\boldsymbol{X}=(X_1,\ldots,X_n)$ ist stetig (verteilt), wenn eine nichtnegative Funktion $f_{\boldsymbol{X}}(x_1,\ldots,x_n)$ existiert, sodass $$P(\boldsymbol{X}\in(\boldsymbol{a},\boldsymbol{b}])=P(a_1<X_1\leq b_1,\ldots,a_n<X_n\leq b_n)$$$$\qquad\qquad\qquad\qquad\,\,\,\,=\int_{a_n}^{b_n}\cdots\int_{a_1}^{b_1}f_{\boldsymbol{X}}(x_1,\ldots,x_n)dx_1\ldots dx_n$$ für alle Intervalle $(\boldsymbol{a},\boldsymbol{b}]\subset\mathbb{R}^n, \boldsymbol{a}=(a_1,\ldots,a_n),\boldsymbol{b}=(b_1,\ldots,b_n)\in\mathbb{R}^n,$ gilt. Notation: $\boldsymbol{X}\sim f_{\boldsymbol{X}}$.

Dichtefunktion

Eine nicht-negative Funktion $f(x_1,\ldots,x_n)$ heißt (multivariate) Dichtefunktion, wenn $$\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}f(x_1,\ldots,x_n)dx_1\ldots dx_n=1.$$ Durch sie ist eine eindeutige Wahrscheinlichkeitsverteilung auf $\mathbb{R}^n$ definiert.

Randdichte

Ist $(X_1,\ldots,X_n)\sim f(x_1,\ldots,x_n)$, dann ist die $i$-te Randdichte gegeben durch $$f_{X_i}(x_i)=\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}f(x_1,\ldots,x_n)dx_1\ldots dx_{i-1}dx_{i+1}\ldots dx_n.$$

Allgemein erhält man die Randdichte eines Teilvektors, indem man die gemeinsame Dichte über alle anderen Variablen integriert.

Produktdichte

Sind $f_1(x),\ldots,f_n(x)$ Dichtefunktionen auf $\mathbb{R}$, dann ist die Produktdichte definiert durch $$f(x_1,\ldots,x_n)=f_1(x_1)\cdot\ldots\cdot f_n(x_n).$$

Ist $(X_1,\ldots,X_n)\sim f_1(x_1)\cdot\ldots\cdot f_n(x_n)$, dann sind die Koordinaten unabhängig mit $X_i\sim f_i(x_i), i=1,\ldots,n$.

Bedingte Verteilung

Bedingte Zähldichte für diskrete Zufallsvektoren

Ist $(X,Y)$ ein diskret verteilter Zufallsvektor mit Zähldichte $p(x,y)$, dann definiert die bedingte Zähldichte $$p_{X|Y}(x|y)=P(X=x|Y=y)=\left\{\begin{aligned}\frac{p(x,y)}{p_Y(y)}, \quad &y\in\{y_1,y_2,\ldots\}\\ p_X(x), \ \ \quad &y\notin\{y_1,y_2,\ldots\}\end{aligned}\right.$$ die bedingte Verteilung von $X$ gegeben $Y$. Notation: $X|Y=y\sim p_{X|Y}(x|y)$.

Bedingte Dichtefunktion für stetige Zufallsvektoren

Sind $X$ und $Y$ stetige Zufallsvektoren mit gemeinsamer Dichtefunktion $f(x,y)$, dann wird $$f_{X|Y}(x|y)=\left\{\begin{aligned}\frac{f(x,y)}{f_Y(y)}, \quad &f_Y(y)>0\\ f_X(x), \ \ \quad &f_Y(y)=0\end{aligned}\right.$$ bedingte Dichtefunktion von $X$ gegeben $Y=y$ genannt. Notation: $X|Y=y\sim f_{X|Y}(x|y)$.

Faktorisierung

Ist $X|Y=y\sim f(x|y)$, dann gilt für die gemeinsame Dichtefunktion $$f(x,y)=f(x|y)f(y)=f(y|x)f(x).$$

Bedingte Erwartung

Ist $(X,Y)$ diskret verteilt mit Zähldichte $p(x,y)$, dann ist der bedingte Erwartungswert von $X$ gegeben $Y=y$ definiert durch $$E(X|Y=y)=\sum_{x\in\mathcal{X}}\,xp_{X|Y}(x|y).$$

Ist $(X,Y)\sim f_{(X,Y)}(x,y)$ stetig, dann gilt $$E(X|Y=y)=\int xf_{X|Y}(x|y)dx.$$

Kritierien für stochastische Unabhängigkeit

Sind $X$ und $Y$ diskret verteilt mit gemeinamer Zähldichte $p_{X,Y}(x,y)$, dann sind $X$ und $Y$ genau dann stochastisch unabhängig, wenn $$p_{X|Y}(x|y)=p_X(x) \quad \text{bzw.} \quad p_{Y|X}(y|x)=p_Y(y) \quad \text{für alle $x$ und $y$}.$$

Sind $X$ und $Y$ stetig verteilt mit gemeinsamer Dichte $f(x,y)$, dann sind $X$ und $Y$ genau dann stochastisch unabhängig, wenn $$f_{X|Y}(x)=f_X(x) \quad \text{bzw.} \quad f_{Y|X}(y)=f_Y(y) \quad \text{für alle $x$ und $y$}.$$

Produktkriterium

Ein Zufallsvektor $(X,Y)$ ist genau dann stochastisch unabhängig, wenn $$F_{X,Y}(x,y)=F_X(x)\cdot F_Y(y) \quad \text{für alle $x,y\in\mathbb{R}$}.$$

Erwartungswertvektor und Kovarianzmatrix

Erwartungswertvektor

Ist $\boldsymbol{X}=(X_1,\ldots,X_n)'$ ein Zufallsvektor, und existieren die $n$ Erwartungswerte $\mu_i=E(X_i), i=1,\ldots,n,$ dann heißt $\mu=(E(X_1),\ldots,E(X_n))'$ Erwartungswertvektor von $\boldsymbol{X}$.

Die Rechenregeln für den Erwartungswert übertragen sich auf Erwartungswertvektoren.

Kovarianzmatrix

Ist $\boldsymbol{X}=(X_1,\ldots,X_n)$ ein Zufallsvektor, dann heißt die $(n\times n)$-Matrix $\text{Var}(\boldsymbol{X})=(\text{Cov}(X_i,X_j))_{i,j}$ Kovarianzmatrix von $\boldsymbol{X}$.