Statistik: Trend und Saisonkomponente
Üblicherweise wird bei der Schätzung des Trends Q und der Saisonkomponente S so vorgegangen, dass zuerst der Trend Q bestimmt wird. Es wird dann y vom Trend bereinigt, d.h. von Beobachtungen yt werden die Trendwerte Qt abgezogen. Aus den resultierenden Restwerten wird dann die saisonale Komponente errechnet. Man kann auch beide Komponenten mit Hilfe der multiplen Regression auf einmal bestimmen.
Schätzung des Trends mit der Regressionsgerade
Wenn wir von einem linear verlaufenden Trend ausgehen können, schätzen wir ihn mit dem Regressionsmodell
- bzw.
mit den Lösungen
bzw. mit Verschiebungssatz ausgedrückt
und
Die Trendwerte Qt sind dann
- .
Beispiel Herrenbekleidung
Die monatlichen Aufträge für die letzten 3 Jahre eines Herstellers für Herrenbekleidung (in 1000 Stück) sind durch die unten folgende Zeitreihe in der Zeitreihe Herrenbekleidung gegeben, von der ein Ausschnitt vorliegt. Die Grafik zeigt, daß offensichtlich ein steigender linearer Trend mit saisonalem Jahreszyklus vorliegt.
t | yt | t·yt | t2 |
---|---|---|---|
1 |
20 |
20 |
1 |
2 |
22 |
44 |
4 |
3 |
24 |
72 |
9 |
4 |
21 |
84 |
16 |
... | ... | ... | ... |
666 |
828 |
15889 |
16206 |
Wir ermitteln zuerst die arithmetischen Durchschnitte:
und entsprechend . Dann erhalten wir für den Regressionsansatz
die Regressionskoeffizienten nach dem Verschiebungssatz
und
Die geschätzten Trendwerte sind , z.B.
- ,
- ,
usw.
Die Residuen sind
- ,
- ,
usw.
t |
yt |
a + bt |
dt |
---|---|---|---|
1 |
20 |
20,43 |
-0,43 |
2 |
22 |
20,57 |
1,43 |
3 |
24 |
20,72 |
3,28 |
4 |
21 |
20,87 |
0,13 |
5 |
18 |
21,02 |
-3,02 |
6 |
20 |
21,16 |
-1,16 |
... |
... |
... |
... |
34 |
26 |
25,28 |
0,72 |
35 |
23 |
25,43 |
-2,43 |
36 |
24 |
25,57 |
-1,57 |
Liegt ein nichtlinearer Trendverlauf vor, kann auch ein nichtlinearer Regressionsansatz gewählt werden. Es können neben t auch andere exogene Variablen in das Modell aufgenomen werden.
Schätzung der Saisonkomponente
Gehen wir von dem additiven Modell
aus, bleibt nach Schätzung der Trendkomponente Q noch die Abweichung
übrig, die sich zusammensetzt aus
Wir nennen deshalb dt auch den trendbereinigten Zeitreihenwert. Es soll nun noch die saisonale Komponente St ermittelt werden. Wir könnten etwa versuchen, diese zyklische Komponente mit einer Sinusfunktion zu schätzen. Einfacher ist aber folgendes Vorgehen: Wir ermitteln die trendbereinigten Zeitreihenwerte dt. Dann wird aus allen Werten dt, die die gleiche Saison betreffen, ein arithmetischer Durchschnitt gebildet, der als Schätzung für die saisonale Komponente verwendet wird.
Beispiel Herrenbekleidung
Für die Januar-Saisonkomponente werden alle Januarwerte der dt gemittelt:
usw.
ergibt dann die nichterklärte Restschwankung.
Wir können jetzt eine Prognose für den Zeitpunkt T+k ermitteln als
wobei wir für St den Saisonwert für diejenige Saison wählen, die in T+k auftritt.
Beispiel für eine Prognose:
Wir wollen für März des 4. Jahres eine Prognose des Auftragseingangs machen. Es handelt sich um den Zeitpunkt t = 39.
Wir erhalten den Trend als
und die Saisonkomponente als
- .
Die Prognose errechnet sich nun als
- .
Multiplikative Verknüpfung der Zeitreihen-Komponenten
Bisher wurde von einer additiven Überlagerung des Trends durch die Saisonkomponente ausgegangen, d. h. die Komponenten wurden als unabhängig angesehen. Häufig nehmen aber die zyklischen Schwankungen mit steigendem Trend zu. Es könnte hier beispielsweise das multiplikative Modell
vorliegen. Wir können den Ansatz logarithmieren und erhalten
Mit dem logarithmierten Ansatz führen wir die Zerlegung des Modells in seine Komponenten durch, wie oben beschrieben.