Predykcja na podstawie nieliniowego modelu przyczynowo-skutkowego

Prognozowanie i symulacje

Strona główna | Ekonometria | Statystyka | Prognozowanie i symulacje | Formularz kontaktowy

 

 

 

W warunkach nieliniowości modelu ekonometrycznego, jako predykatu w procesie prognozowania, wyróżniamy dwa zupełnie odrębne przypadki. Otóż, w pierwszym przypadku gdy model nie jest sprowadzalny do postaci liniowej (np. model logistyczny lub niektóre funkcje Törnquista) - co skutkuje niemożnością stosowania metody najmniejszych kwadratów - nie możemy przeprowadzić pełnej procedury predykcji punktowej, a w ogóle nie możemy wyznaczyć prognozy przedziałowej. Jesteśmy w stanie obliczyć prognozowaną wartość zmiennej objaśnianej - przez podstawienie do wzoru ustalonych wartości zmiennych objaśniających. Niestety, nie obliczymy ani wariancji, ani błędu średniego predykcji, gdyż nie dysponujemy macierzą wariancji i kowariancji. Nie zbudujemy prognozy przedziałowej, gdyż nie jesteśmy w stanie ustalić błędu średniego predykcji oraz niemożliwe jest obliczenie-odczytanie z tablic statystycznych wartości zmiennej losowej o rozkładzie t-Studenta. Składnik losowy modelu najprawdopodobniej nie jest zmienną losową o rozkładzie normalnym!

W przypadku modelu nieliniowego sprowadzalnego do postaci liniowej dostępna jest cała procedura predykcji punktowej. Wszystkie obliczenia w trybie ex ante, tj. wyznaczenie prognozowanej wartości zmiennej objaśnianej, wariancji i błędu średniego predykcji, wykonujemy w oparciu o zlinearyzowaną "wersję" modelu. Jeżeli linearyzacja pierwotnego modelu nieliniowego oznaczała wprowadzenie doń przekształconej zmiennej objaśnianej, to - dla uzyskania wartości tej zmiennej, zgodnej z postacią analityczną modelu - należy zarówno ostateczną prognozę punktową, jak i błąd średni predykcji obliczyć ponownie przeciwnie do zastosowanej transformanty linearyzacyjnej. Z prognozą przedziałową zasadniczo nie ma większych problemów, ale pod warunkiem, że do utrzymania jest założenie o normalności rozkładu składnika losowego modelu.

Oto przykład: w n = 10 gospodarstwach domowych zmierzono kształtowanie się wydatków na odzież i obuwie (zmienna objaśniana Y - w setkach złotych, w pewnym okresie czasu) w zależności od wydatków ogółem tegoż gospodarstwa domowego (zmienna objaśniająca X - w setkach złotych). Uzyskano taki oto liczbowy materiał empiryczny (kolumna i - indeks gospodarstwa domowego):

 

i

xi

yi

1

3

3

2

4

3

3

6

5

4

8

7

5

11

8

6

14

9

7

16

10

8

20

9

9

23

12

10

25

14

 

Zupełnie dobre dopasowanie do danych empirycznych daje model liniowy

 ,

ale zgodnie z wymogiem poszukiwania możliwie najlepszej aproksymanty, decydujemy się na korzystanie z modelu potęgowego:

gdzie:

a0 - wartość Y dla X = 1,

a1 ¹ 0 - elastyczność Y względem X ("o ile procent zmieni się Y, jeżeli X wzrośnie o 1%"),

ui - składnik losowy.

Jest to model nieliniowy, ale linearyzacja jest stosunkowo prostym zabiegiem - wystarczy logarytmowanie i nie musi to być logarytm naturalny. I tak:

... i już mamy postać liniową

... gdzie poszczególne zmienne i parametry "z gwiazdkami" oznaczają:

Do obliczeń ocen parametrów strukturalnych i struktury stochastycznej bierzemy zlogarytmowane wartości obserwacji na zmiennych X i Y:

i

xi*

yi*

1

1,09861

1,09861

2

1,38629

1,09861

3

1,79176

1,60944

4

2,07944

1,94591

5

2,39790

2,07944

6

2,63906

2,19722

7

2,77259

2,30259

8

2,99573

2,19722

9

3,13549

2,48491

10

3,21888

2,63906

 

Oto przebieg obliczeń:

XTX =

 

10,00000

23,51575

 

 

23,51575

60,23191

 

 

Det(XTX) = 49,32855

 

(XTX)-1 =

 

1,22104

-0,47672

 

 

-0,47672

0,20272

 

 

XTy =

 

19,65301

 

 

49,69759

 

 

a* =

 

0,30535

 

 

0,70589

 

Jest to wektor kolumnowy estymatorów parametrów modelu zlinearyzowanego:

= 0,30535 - estymator parametru ,

= 0,70589 - estymator parametru a1.


 

Macierz wariancji i kowariancji:

D2(a*) =

 

0,01979

-0,00773

 

 

-0,00773

0,00329

 

... oraz wektor kolumnowy błędów ocen parametrów strukturalnych:

D(a*) =

 

0,14068

 

 

0,05732

 

 

Zapisujemy liniowy model oszacowany:

 =

0,30535

+

0,70589

+

 

(0,14068)

 

(0,05732)

 

(0,127311)

 

 = 1,96530 (średnia arytmetyczna zmiennej objaśnianej)

S2 = 0,016208 (ocena wariancji składnika losowego)

S = 0,127311 (ocena odchylenia standardowego składnika losowego)

VS = 6,48% (współczynnik zmienności losowej)

j2 = 0,050110 (współczynnik zbieżności)

R2 = 0,949890 (współczynnik determinacji)

R = 0,974623 (współczynnik korelacji wielokrotnej)

 

Przeglądając oceny parametrów strukturalnych i parametrów stochastycznych stwierdzamy, że model bardzo dobrze opisuje badany związek przyczynowo-skutkowy i uzasadnione jest przypuszczenie, że będzie on dobrym predyktorem w ekonometrycznym prognozowaniu wartości zmiennej Y. Równie dobrym modelem będzie zatem model "macierzysty", czyli pierwotny model potęgowy. Ocenę parametru a1 już znamy - a1 = 0,70589. Ocenę parametru a0 poznamy ze wzoru:

... i tak a0 = 1,35709.

Zapisujemy potęgowy model oszacowany:

 

A teraz obliczymy prognozę punktową zmiennej Y przy założeniu, że X = 15:

·        z modelu liniowego

y*P = 0,30535 + 0,70589 ln(15) = 2,216934, czyli

yP = e2,216934 = 9,1791415837 [setek złotych]

·        z modelu potęgowego

yP = 1,35709*150,70589 = 9,1791415837 [setek złotych]

Nie ma zatem różnicy w sposobie obliczania prognozy punktowej, można ją obliczyć na podstawie modelu liniowego, jak i pierwotnego modelu nieliniowego. Inaczej ma się sprawa obliczania ocen dokładności prognozy. Wszystkie niezbędne ku temu dane mamy jedynie dla modelu liniowego. I tak:

0,018246

Wariancja predykcji nie dość, że nie ma interpretacji ekonomicznej, to dodatkowo, w przypadku konieczności przeliczania zmiennej prognozowanej do pierwotnej postaci analitycznej, nie da się jej obliczyć dla zmiennej objaśnianej modelu potęgowego. Mniejsza z tym; bardziej nas interesuje...

·        błąd średni predykcji

 0,135079

co stanowi V% = (0,135079 / 2,216934) * 100% = 6,09% wartości prognozy punktowej zmiennej modelu zlinearyzowanego. Aby błąd średni predykcji przeliczyć dla zmiennej objaśnianej modelu potęgowego, należy wykonać przekształcenie przeciwne do logarytmu naturalnego:

V(model potęgowy) = e0,135079 = 1,144628 [setek złotych]

co stanowi (1,144628 / 9,1791415837) * 100% = 12,47% wartości prognozy punktowej zmiennej modelu potęgowego.

Prognozę przedziałową budujemy na podstawie modelu zlinearyzowanego, jednak pod warunkiem, że składnik losowy tego modelu jest zmienną losową o rozkładzie normalnym. Przyjmujemy poziom istotności a = 0,05, co oznacza, że poziom ufności, 1-a = 0,95. Z tablicy statystycznej rozkładu rozkładzie t-Studenta odczytujemy liczbę na przecięciu wiersza n-k = 8 (liczba stopni swobody) i kolumny a = 0,05; ta = 2,306. Połowa rozpiętości przedziału ufności jest równa V* ta = 0,135079 * 2,306 = 0,311493 – dla zmiennej y*, oraz e0,311493 = 1,365463 - dla zmiennej y.

Przedział ufności dla zmiennej modelu zlinearyzowanego:

P{1,905440 < y* < 2,528427} = 0,95

Przedział ufności dla zmiennej modelu potęgowego:

P{7,813679 < y < 10,544604} = 0,95

Ostatecznie prognozujemy "przedziałowo": jeżeli wydatki ogółem gospodarstawa domowego wyniosą 1500 zł, to z prawdopodobieństwem 95% (czyli w 95 przypadkach na 100) wydatki na odzież i obuwie zmieszczą się w przedziale od 781,37 zł do 1054,46 zł.

 

 


 

Mapa strony ekonometria.4me.pl

 

Ekonometria
Model ekonometryczny teoria
Jednorównaniowy model ekonometryczny
Metoda Hellwiga
MNK
Podstawy weryfikacji
Hipoteza o istotności parametrów strukturalnych
Funkcja produkcji
Ekonometria  korelacja i regresja  wzory
Założenia i własności predykcji ekonometrycznej
Jak to robią profesjonaliści ?
Analiza przepływów międzygałęziowych
Programowanie liniowe
Analiza popytu
Analiza kosztów
Współczynniki Pearsona  dwie zmienne objaśniające
Współczynniki Pearsona trzy zmienne objaśniające
Zadania obowiązujące na SGH cz.1

 

Statystyka

Statystyka  pojęcia podstawowe

Parametry statystyczne

Opracowanie materiału statystycznego

Tablica korelacyjna

Podstawowe prawdy statystyki

Kilka rozkładów

Statystyka  wzory

Dystrybuanta rozkładu normalnego N

Rozkład Durbina Watsona

Rozkład t Studenta

Rozkład wartości krytycznej współczynnika korelacji dla 0,05

Rozkład F dla 0,05

Rozkład F dla 0,01

Rozkład liczby serii

Rozkład Poissona

Rozkład G.Cochrana

Rozkład chi kwadrat

Prognozowanie i symulacje

Prognozowanie sprzedaży

Prognozowanie popytu
Prognozowanie -metody heurystyczne
Składowe szeregów czasowych
Modele szeregów czasowych
Metody naiwne
Metoda średniej ruchomej

Wygładzanie wykładnicze
Prognozowanie ekonometryczne
Modele tendencji rozwojowej
Modele analityczne
Trend pełzający
Modele składowej periodycznej
Metoda wskaźników
Analiza harmoniczna
Modele autoregresyjne
Modele ARMA i ARIMA
Model nieliniowy
Model tendencji rozwojowej
Metoda prognozowania Hellwiga
Metoda trendu pełazającego
Prognozowanie ekonometryczne


Copyright © ekonometria.4me.pl 2005-2013. Wszelkie prawa zastrzeżone. Zabrania się kopiowania, redystrybucji, publikacji lub modyfikacji jakichkolwiek materiałów zawartych na stronie internetowej , bez wcześniejszej pisemnej zgody autorów.


 

Predykcja na podstawie nieliniowego modelu przyczynowo-skutkowego