22 - Deskriptive Zeitreihenanalyse

Zeitreihen

Eine Zeitreihe ist ein Datensatz $$(y_1,t_1),\ldots,(y_n,t_n),$$ wobei \(t_1,\ldots,t_n\) strikt geordnete Zeitpunkte sind, d.h. \(t_1 < \ldots < t_n\) und \(y_i\) zur Zeit \(t_i\) erhoben wird, \(i=1,\ldots,n\). Die Zeitpunkte sind äquidistant, wenn es ein \(\Delta>0\) gibt, sodass \(t_i=\Delta i, i=1,\ldots,n\).

Üblicherweise spricht man von einer Zeitreihe \(y_1,\ldots,y_T\), wenn \(y_t\) am \(t\)-ten Zeitpunkt erhoben wurde.

Preisindizes

Betrachte einen fiktiven Warenkorb mit \(I\) Gütern. Seien $$p_i(t), \quad t=1,\ldots,T, \ i=1,\ldots,I,$$ Preise der \(I\) Güter an \(T\) Zeitpunkten. \(x_1(t),\ldots,x_I(t)\) seien die Mengen der Güter zur Zeit \(t\).

Preisindex nach Laspeyres

Der Preisindex nach Laspeyres ist definiert durch das gewichtete Mittel $$P_L(t)=\sum_{i=1}^I\ w_i\frac{p_i(t)}{p_i(0)}=\frac{\sum_{i=1}^I\ p_i(t)x_i(0)}{\sum_{j=1}^I\ p_j(0)x_j(0)}$$ der Preisänderungen, wobei $$w_i=\frac{p_i(0)x_i(0)}{\sum_{j=1}^I\ p_j(0)x_j(0)}, \quad i=1,\ldots,I.$$ Die Gewichte \(w_i\) entsprechen dem Ausgabenanteil des \(i\)-ten Guts bei Kauf des Warenkorbs.

Preisindex nach Paasche

Der Preisindex nach Paasche berechnet sich durch $$P_P(t)=\sum_{i=1}^I\ \frac{p_i(t)}{p_i(0)}w_i(t),$$ wobei $$w_i(t)=\frac{p_i(t)x_i(t)}{\sum_{j=1}^I\ p_j(t)x_j(t)}, \quad i=1,\ldots,I.$$ Die Gewichte \(w_i(t)\) entsprechen dem anteiligen Wert des \(i\)-ten Guts zum Zeitpunkt \(t\) bei jeweils angepasstem Warenkorb.

Zerlegung von Zeitreihen

Oft wird angenommen, dass sich eine Zeitreihe additiv aus mehreren Komponenten zusammen setzt: $$y_t=m_t+k_t+s_t+\epsilon_t, \quad t=1,\ldots,T.$$ Dabei heißt \(m_t\) Trendkomponente, \(k_t\) Konjunkturkomponente, \(s_t\) Saisonkomponente und \(\epsilon_t\) irreguläre Komponente. \(m_t, k_t\) und \(s_t\) bilden zusammen die systematische Komponente (oder glatte Komponente).

Bestimmung und Bereinigung der Trendkomponente

Das gängigste parametrische Trendmodell unterstellt einen linearen Zeittrend in den Daten: $$Y_t=a+bt+\epsilon_t, \quad t=1,\ldots,T.$$ Die Schätzung wird in der Regel mit der KQ-Methode durchgeführt.

Die sogenannte Bereinigung um den linearen Trend erreicht man durch den Übergang zu den geschätzten Residuen: $$\hat{\epsilon}_t=y_t-\hat{a}-\hat{b}t, \quad t=1,\ldots,T.$$ Man spricht dann auch von trendbereinigten Daten.

Gleitender Durchschnitt

Bei einem gleitenden Durchschnitt der Ordnung \(2q+1\) erfolgt an jedem Zeitpunkt \(t\) eine Mittelung der \(2q\) zeitlich nächsten Beobachtungen: $$\hat{m}_t=\frac{y_{t-q}+\ldots+y_t+\ldots+y_{t+q}}{2q+1}, \quad t=q+1,\ldots,n-q.$$ Für \(t\leq q\) und \(t>n-q\) ist \(\hat{m}_t\) nicht definiert.

Bestimmung einer periodischen Komponente

Die parametrische Modellierung einer periodischen Komponente (Saison- oder Konjunkturkomponente) kann durch $$s_t=b_0+c_1\sin(2\pi t /L), \quad t=1,\ldots,T,$$ oder allgemeiner $$s_t=b_0+\sum_{k=1}^K\ b_k\cos(2\pi t/L)+\sum_{k=1}^{K-1}\ c_k\sin(2\pi t/L)$$ erfolgen. Dabei ist \(L\) die Periode. Die Schätzung der Koeffizienten \(b_0,b_1,c_1,\ldots,b_K,c_K\) wird meist mit der KQ-Methode durchgeführt.