Predykcja na podstawie nieliniowego modelu przyczynowo-skutkowegoPrognozowanie i symulacjeStrona główna | Ekonometria | Statystyka | Prognozowanie i symulacje | Formularz kontaktowy
|
W warunkach nieliniowości modelu ekonometrycznego, jako predykatu w procesie prognozowania, wyróżniamy dwa zupełnie odrębne przypadki. Otóż, w pierwszym przypadku gdy model nie jest sprowadzalny do postaci liniowej (np. model logistyczny lub niektóre funkcje Törnquista) - co skutkuje niemożnością stosowania metody najmniejszych kwadratów - nie możemy przeprowadzić pełnej procedury predykcji punktowej, a w ogóle nie możemy wyznaczyć prognozy przedziałowej. Jesteśmy w stanie obliczyć prognozowaną wartość zmiennej objaśnianej - przez podstawienie do wzoru ustalonych wartości zmiennych objaśniających. Niestety, nie obliczymy ani wariancji, ani błędu średniego predykcji, gdyż nie dysponujemy macierzą wariancji i kowariancji. Nie zbudujemy prognozy przedziałowej, gdyż nie jesteśmy w stanie ustalić błędu średniego predykcji oraz niemożliwe jest obliczenie-odczytanie z tablic statystycznych wartości zmiennej losowej o rozkładzie t-Studenta. Składnik losowy modelu najprawdopodobniej nie jest zmienną losową o rozkładzie normalnym!
W przypadku modelu nieliniowego sprowadzalnego do postaci liniowej dostępna jest cała procedura predykcji punktowej. Wszystkie obliczenia w trybie ex ante, tj. wyznaczenie prognozowanej wartości zmiennej objaśnianej, wariancji i błędu średniego predykcji, wykonujemy w oparciu o zlinearyzowaną "wersję" modelu. Jeżeli linearyzacja pierwotnego modelu nieliniowego oznaczała wprowadzenie doń przekształconej zmiennej objaśnianej, to - dla uzyskania wartości tej zmiennej, zgodnej z postacią analityczną modelu - należy zarówno ostateczną prognozę punktową, jak i błąd średni predykcji obliczyć ponownie przeciwnie do zastosowanej transformanty linearyzacyjnej. Z prognozą przedziałową zasadniczo nie ma większych problemów, ale pod warunkiem, że do utrzymania jest założenie o normalności rozkładu składnika losowego modelu.
Oto przykład: w n = 10 gospodarstwach domowych zmierzono kształtowanie się wydatków na odzież i obuwie (zmienna objaśniana Y - w setkach złotych, w pewnym okresie czasu) w zależności od wydatków ogółem tegoż gospodarstwa domowego (zmienna objaśniająca X - w setkach złotych). Uzyskano taki oto liczbowy materiał empiryczny (kolumna i - indeks gospodarstwa domowego):
i |
xi |
yi |
1 |
3 |
3 |
2 |
4 |
3 |
3 |
6 |
5 |
4 |
8 |
7 |
5 |
11 |
8 |
6 |
14 |
9 |
7 |
16 |
10 |
8 |
20 |
9 |
9 |
23 |
12 |
10 |
25 |
14 |
Zupełnie dobre dopasowanie do danych empirycznych daje model liniowy
,
ale zgodnie z wymogiem poszukiwania możliwie najlepszej aproksymanty, decydujemy się na korzystanie z modelu potęgowego:
gdzie:
a0 - wartość Y dla X = 1,
a1 ¹ 0 - elastyczność Y względem X ("o ile procent zmieni się Y, jeżeli X wzrośnie o 1%"),
ui - składnik losowy.
Jest to model nieliniowy, ale linearyzacja jest stosunkowo prostym zabiegiem - wystarczy logarytmowanie i nie musi to być logarytm naturalny. I tak:
... i już mamy postać liniową
... gdzie poszczególne zmienne i parametry "z gwiazdkami" oznaczają:
Do obliczeń ocen parametrów strukturalnych i struktury stochastycznej bierzemy zlogarytmowane wartości obserwacji na zmiennych X i Y:
i |
xi* |
yi* |
1 |
1,09861 |
1,09861 |
2 |
1,38629 |
1,09861 |
3 |
1,79176 |
1,60944 |
4 |
2,07944 |
1,94591 |
5 |
2,39790 |
2,07944 |
6 |
2,63906 |
2,19722 |
7 |
2,77259 |
2,30259 |
8 |
2,99573 |
2,19722 |
9 |
3,13549 |
2,48491 |
10 |
3,21888 |
2,63906 |
Oto przebieg obliczeń:
XTX = |
|
10,00000 |
23,51575 |
|
|
23,51575 |
60,23191 |
|
Det(XTX) = 49,32855
(XTX)-1 = |
|
1,22104 |
-0,47672 |
|
|
-0,47672 |
0,20272 |
|
XTy = |
|
19,65301 |
|
|
49,69759 |
|
a* = |
|
0,30535 |
|
|
0,70589 |
|
Jest to wektor kolumnowy estymatorów parametrów modelu zlinearyzowanego:
= 0,30535 - estymator parametru ,
= 0,70589 - estymator parametru a1.
Macierz wariancji i kowariancji:
D2(a*) = |
|
0,01979 |
-0,00773 |
|
|
-0,00773 |
0,00329 |
|
... oraz wektor kolumnowy błędów ocen parametrów strukturalnych:
D(a*) = |
|
0,14068 |
|
|
0,05732 |
|
= |
0,30535 |
+ |
0,70589 |
+ |
|
|
(0,14068) |
|
(0,05732) |
|
(0,127311) |
= 1,96530 (średnia arytmetyczna zmiennej objaśnianej)
S2 = 0,016208 (ocena wariancji składnika losowego)
S = 0,127311 (ocena odchylenia standardowego składnika losowego)
VS = 6,48% (współczynnik zmienności losowej)
j2 = 0,050110 (współczynnik zbieżności)
R2 = 0,949890 (współczynnik determinacji)
R = 0,974623 (współczynnik korelacji wielokrotnej)
Przeglądając oceny parametrów strukturalnych i parametrów stochastycznych stwierdzamy, że model bardzo dobrze opisuje badany związek przyczynowo-skutkowy i uzasadnione jest przypuszczenie, że będzie on dobrym predyktorem w ekonometrycznym prognozowaniu wartości zmiennej Y. Równie dobrym modelem będzie zatem model "macierzysty", czyli pierwotny model potęgowy. Ocenę parametru a1 już znamy - a1 = 0,70589. Ocenę parametru a0 poznamy ze wzoru:
... i tak a0 = 1,35709.
A teraz obliczymy prognozę punktową zmiennej Y przy założeniu, że X = 15:
· z modelu liniowego
y*P = 0,30535 + 0,70589 ln(15) = 2,216934, czyli
yP = e2,216934 = 9,1791415837 [setek złotych]
· z modelu potęgowego
yP = 1,35709*150,70589 = 9,1791415837 [setek złotych]
Nie ma zatem różnicy w sposobie obliczania prognozy punktowej, można ją obliczyć na podstawie modelu liniowego, jak i pierwotnego modelu nieliniowego. Inaczej ma się sprawa obliczania ocen dokładności prognozy. Wszystkie niezbędne ku temu dane mamy jedynie dla modelu liniowego. I tak:
0,018246
Wariancja predykcji nie dość, że nie ma interpretacji ekonomicznej, to dodatkowo, w przypadku konieczności przeliczania zmiennej prognozowanej do pierwotnej postaci analitycznej, nie da się jej obliczyć dla zmiennej objaśnianej modelu potęgowego. Mniejsza z tym; bardziej nas interesuje...
· błąd średni predykcji
0,135079
co stanowi V% = (0,135079 / 2,216934) * 100% = 6,09% wartości prognozy punktowej zmiennej modelu zlinearyzowanego. Aby błąd średni predykcji przeliczyć dla zmiennej objaśnianej modelu potęgowego, należy wykonać przekształcenie przeciwne do logarytmu naturalnego:
V(model potęgowy) = e0,135079 = 1,144628 [setek złotych]
co stanowi (1,144628 / 9,1791415837) * 100% = 12,47% wartości prognozy punktowej zmiennej modelu potęgowego.
Prognozę przedziałową budujemy na podstawie modelu zlinearyzowanego, jednak pod warunkiem, że składnik losowy tego modelu jest zmienną losową o rozkładzie normalnym. Przyjmujemy poziom istotności a = 0,05, co oznacza, że poziom ufności, 1-a = 0,95. Z tablicy statystycznej rozkładu rozkładzie t-Studenta odczytujemy liczbę na przecięciu wiersza n-k = 8 (liczba stopni swobody) i kolumny a = 0,05; ta = 2,306. Połowa rozpiętości przedziału ufności jest równa V* ta = 0,135079 * 2,306 = 0,311493 – dla zmiennej y*, oraz e0,311493 = 1,365463 - dla zmiennej y.
Przedział ufności dla zmiennej modelu zlinearyzowanego:
P{1,905440 < y* < 2,528427} = 0,95
Przedział ufności dla zmiennej modelu potęgowego:
P{7,813679 < y < 10,544604} = 0,95
Ostatecznie prognozujemy "przedziałowo": jeżeli wydatki ogółem gospodarstawa domowego wyniosą 1500 zł, to z prawdopodobieństwem 95% (czyli w 95 przypadkach na 100) wydatki na odzież i obuwie zmieszczą się w przedziale od 781,37 zł do 1054,46 zł.
Mapa strony ekonometria.4me.pl
Copyright © ekonometria.4me.pl 2005-2013. Wszelkie prawa zastrzeżone. Zabrania się kopiowania, redystrybucji, publikacji lub modyfikacji jakichkolwiek materiałów zawartych na stronie internetowej , bez wcześniejszej pisemnej zgody autorów.
Predykcja na podstawie nieliniowego modelu przyczynowo-skutkowego