Blog dydaktyczny tomasza przechlewskiego: Analiza dynamiki zjawisk

Średnia ruchoma (moving average)

Oblicznie $k$-okresowej średniej ruchomej w przypadku gdy $k$ jest liczbą nieparzystą: $$ y_{t + (k-1)/2} = \frac{1}{k} \sum_{i=t}^{t + k -1} y_i \quad t = 1,\dots,n - \frac{k-1}{2} \label{S-MovingAverage} $$

Przykładowo powyższy wzorek można rozpisać dla $k=3$ następująco: $$ \begin{aligned} \bar y_2 &= \frac{y_1 + y_2 + y_3}{3} \\ \bar y_3 &= \frac{y_2 + y_3 + y_4}{3} \\ \dots & \dots \\ \bar y_{n-1} &= \frac{y_{n-2} + y_{n-1} + y_n}{3} \end{aligned} $$

Oblicznie $k$-okresowej średniej ruchomej w przypadku gdy $k$ jest liczbą parzystą (średnia ruchoma scentrowana): $$ y_{t + k/2} = \frac{1}{k} (0,5 y_t + \sum_{i=t}^{t+k-1}y_i + 0,5 y_{t+k}) \quad t=1,\dots,n - \frac{k}{2} \label{S-MovingAverage-C} $$

Przykładowo powyższy wzorek można rozpisać dla $k=4$ następująco: $$ \begin{aligned} \bar y_3 &= \frac{0,5 y_1 + y_2 + y_3 + y_4 + 0,5 y_5}{4} \\ \bar y_4 &= \frac{0,5 y_2 + y_3 + y_4 + y_5 + 0,5 y_6}{4} \\ \dots & \dots \\ \bar y_{n-2} &= \frac{0,5 y_{n-4} + y_{n-3} + y_{n-2} + y_{n-1} + 0,5 y_n}{4} \end{aligned} $$

Ocena jakości dopasowania

Błędy prognoz ex-post

Średni błąd kwadratowy ($n^*=n -(k-1)/2$ lub $n^*=n -k/2$) w zależności od rodzaju średniej ruchomej: $$ MSE = \frac{1}{n^*} \sum_{i=1}^{n^*} (y_i -\bar y_i)^2 $$

Pierwiastek błędu średniokwadratowego: $$ RMSE = \sqrt{MSE} $$

Wykorzystanie modelu średniej ruchomej do prognozowania polega na wyznaczeniu prognozy jako średniej arytmetycznej zwykłej bądź ważonej z $k$ ostatnich wartości zmiennej, tj. $y^*_t = \frac{1}{k}\sum_{i=t-k}^{t-1}y_i$ przy czym $k$ należy wyznaczyć tak aby średni kwadratowy błąd ex post był minimalny.

Metoda analityczna

Liniowa funkcja trendu ma postać: $$y_t = \alpha + \beta t + \xi_t$$ gdzie: $y_t$ -- poziom zjawiska w okresie $t$; $\alpha$, $\beta$ -- parametry; $t$ -- zmienna czasowa (np. $t= 1,...n$) oraz $\xi_t$ -- składnik losowy.

Wartości (oceny) parametrów wyznaczone metodą najmniejszych kwadratów są następujące: $$ \begin{aligned} \hat \beta &= \frac{\sum_{t=1}^n (y_t -\bar y)(t - \bar t) }{ \sum_{i=1}^n (t - \bar t)^2 } \\ \hat \alpha &= \bar y - \bar \beta t \end{aligned} $$

Ocena jakości dopasowania

Standardowe odchylenie składnika resztowego: $$ s_{\xi} = \sqrt { \frac{1}{n-2} \sum_{t=1}^n (y_t - \hat y_t)^2 } $$

Odchylenie ocen parametrów (błąd standardowy oceny) $$ \begin{aligned} s(\beta) &= \sqrt { \frac{ s_{\xi}^2 }{\sum (t-\bar t)^2} } \\ s(\alpha) &= s_{\xi} \sqrt { \frac{\sum t^2}{n \sum (t-\bar t)^2} } \end{aligned} $$

Istotność parametrów strukturalnych ($H_0: \beta=0$). Statystyka: $$T_{n-2} = \frac{\hat \beta}{ s(\beta) } $$ ma rozkład $t$-Studenta z $n-2$ stopniami swobody.

Współczynnik zbieżności: $$ \phi^2 = \frac{\sum_{t=1}^n (y_t -\hat y_t)^2 }{ \sum_{t=1}^n (y_t -\bar y_t)^2 } \cdot 100% \quad 0\leq \phi^2 \leq 100 $$ Im $\phi^2$ jest bliższy 0, tym dopasowanie jest lepsze. Wartość $\phi^2$ interpretuje się jako ,,procent zmienności zmiennej $y$ nie objaśniony przez liniową funkcję trendu.''

Współczynnik determinacji $R^2=100-\phi^2$ interpretuje się jako ,,procent zmienności zmiennej $y$ objaśniony przez liniową funkcję trendu.''

Analiza wahań sezonowych

Zakładamy, że szereg dzieli się na $s$ powtórzeń a każde powtórzenie składa się z $k$ faz. Np. w szeregu 12 elementowym zawierającym obserwacje kwartalne $k=4$ a $s=3$.

Działania mające na celu wyodrębnienie wahań sezonowych są następujce:

Wygładzamy szereg czasowy analitycznie lub mechanicznie (średnia ruchoma).

Uwalniamy szereg czasowy od trendu. W tym celu wyliczamy wielkości $w_t = y_t/\hat y_t$

Pozbywamy się wahań przypadkowych w wielkościach $w_t$. W tym celu obliczamy średnie dla okresów jednoimiennych (surowe wskaźniki sezonowości): $$ c_i' = \frac{\sum_{j=1}^{s-1} w_{i+j\cdot k} }{s} \quad i=1, 2, \ldots ,k $$ Interpretacja: $(wskaźnik-surowy -1)\cdot 100%$ oznacza o ile procent poziom zjawiska w danej fazie jest wyższy/niższy od poziomu wyznaczonego przez trend.

Suma wskaźników surowych powinna być równa $k$, tj. $\sum c_i'=k$. Jeżeli tak nie jest, to należy wskaźniki surowe pomnożyć przez współczynnik korygujący: $$ wk=\frac{k}{\sum c_i'} $$ Otrzymując w ten sposób czyste wskaźnik sezonowości.

Jeżeli pomnożymy w każdym okresie teoretyczny poziom zjawiska $\hat y_t$ przez odpowiedni dla danego okresu wskaźnik sezonowości, to otrzymamy teoretyczny poziom zjawiska uwzględniający wahania sezonowe.

poniedziałek, 14 maja 2012

Analiza dynamiki zjawisk

Średnia ruchoma (moving average)

Metoda analityczna

Analiza wahań sezonowych