JÄRJESTELMÄ STATA
Markov-kytkentämallit
Highlights
- Markov-siirtymismallinnus
- Autoregressiivinen malli
- Dynaaminen regressiomalli
- Tilasta riippuvaiset regressioparametrit
- State-riippuvaiset varianssiparametrit
- Taulukot
- Siirtymätodennäköisyydet
- Odotetut tilojen kestot
- Ennusteet
- Riippuvan muuttujan odotusarvot
- Todennäköisyydet olla jossakin tilassa
- Staattiset (yksi-step)
- Dynamic (multistep)
- RMSEs of predictions
Mistä tässä on kyse?
Joskus prosessit kehittyvät ajan kuluessa, jolloin tulokset muuttuvat diskreetisti.
Ajattele talouden taantumia ja laajenemisia. Taantuman alkaessa tuotanto ja työllisyys laskevat ja pysyvät alhaisina, ja myöhemmin tuotanto ja työllisyys kasvavat. Ajatelkaa kaksisuuntaisia mielialahäiriöitä, joissa on maanisia jaksoja, joita seuraavat masennusjaksot, ja prosessi toistuu. Tilastollisesti keskiarvot, varianssit ja muut parametrit muuttuvat jaksojen (järjestelmien) välillä. Ongelmanamme on arvioida, milloin järjestelmät vaihtuvat ja kuhunkin järjestelmään liittyvien parametrien arvot. Kysymys siitä, milloin järjestelmät muuttuvat, vastaa kysymystä siitä, kuinka kauan järjestelmät jatkuvat.
Markov-siirtymämalleissa estimoimme kunkin regiimin keskiarvojen, varianssien jne. estimoinnin lisäksi myös regiimin muutoksen todennäköisyyden. Estimoidut siirtymätodennäköisyydet jollekin ongelmalle voivat olla, seuraavat:
alkaen/alkaen | |||
tilasta | . 1 2 | ||
1 | 0.82 0.18 | ||
2 | 0.75 0.25 |
Aloita tilasta 1. Todennäköisyys siirtyä tilasta 1 tilaan 1 on 0,82. Toisin sanoen, kun prosessi on kerran tilassa 1, sillä on taipumus pysyä siellä. Todennäköisyydellä 0,18 prosessi kuitenkin siirtyy tilaan 2. Tila 2 ei ole yhtä pysyvä. Todennäköisyydellä 0,75 prosessit palaavat tilasta 2 tilaan 1 seuraavalla ajanjaksolla.
Markov-kytkentämallit eivät rajoitu kahteen tilaan, vaikka kahden tilan mallit ovatkin yleisiä.
Edellä olevassa esimerkissä kuvasimme kytkentää äkilliseksi; todennäköisyys muuttui välittömästi. Tällaisia Markov-malleja kutsutaan dynaamisiksi malleiksi. Markov-malleihin voidaan sovittaa myös tasaisempia muutoksia mallintamalla siirtymätodennäköisyydet autoregressiivisenä prosessina.
Kytkentä voi siis olla pehmeä tai äkillinen.
Katsotaanpa, miten se toimii
Tarkastellaan keskiarvomuutoksia eri järjestelmien välillä. Analysoimme erityisesti Federal Funds Ratea. Federal Funds Rate on korko, jota Yhdysvaltain keskuspankki perii liikepankeilta yön yli -lainoista. Tarkastelemme Federal Funds Rate -korkojen muutoksia vuodesta 1954 vuoden 2010 loppuun. Tässä ovat tiedot:
Meillä on neljännesvuosittaiset tiedot. Korkeat korot näyttävät leimaavan 70- ja 80-lukuja. Oletamme, että on olemassa toinen järjestelmä alhaisemmille koroille, jotka näyttävät luonnehtivan muita vuosikymmeniä.
Sovittaaksemme dynaamisesti vaihtuvan (abrupt-change) mallin, jossa on kaksi regimiä, kirjoitamme
. mswitch dr fedfundsPerforming EM optimizaton:Performing gradient-based optimization:
Iteraatio 0: | log likelihood = -508.66031 |
Iteraatio 1: | log likelihood = -508.6382 |
Iteraatio 2: | log likelihood = -508.63592 |
Iteraatio 3: | log likelihood = -508.63592 |
Markov-kytkentäinen dynaaminen regressioOsake: 1954q3 – 2010q4 No. of obs = 226Number of states = 2 AIC = 4,5455Unconditional probabilities: transition HQIC = 4,5760 SBIC = 4,6211Log likelihood = -508.63592
fedfunds | Coef. Std. Err. z P>|z| | ||||
State1 | |||||
_cons | |||||
State2 | |||||
_cons | 9.556793 .2999889 31.86 0.000 8.968826 10.14476 | ||||
sigma | 2.107562 .1008692 1.918851 2.314831 | ||||
p11 | .9820939 .0104002 .9450805 .9943119 | ||||
p21 | .0503587 .0268434 .0173432 .137434344 | ||||
Yllä olevassa tulosteessa ilmoitetaan
- kahden tilan keskiarvot (_cons);
- koko prosessin yksi keskihajonta (sigma); ja
- siirtymistodennäköisyydet tilalle 1 tilaan 1 ja tilalle 2 tilaan 1 (p11 ja p21).
Tila1 on kohtuullisen nopea tila (keskiarvo 3,71 %).
Tila2 on korkean todennäköisyyden tila (keskiarvo 9,56 %).
lta/lle | |||
valtio | . 1 2 | ||
1 | 0.98 1 – 0.98 | ||
2 | 0.05 1 – 0.05 |
Molemmat tilat ovat uskomattoman pysyviä (1->1- ja 2->2-todennäköisyydet 0.98 ja 0.95).
Arvioinnin jälkeen voidaan muun muassa ennustaa todennäköisyys olla eri tiloissa. Meillä on vain kaksi tilaa, joten todennäköisyys olla (vaikkapa) tilassa 2 kertoo todennäköisyyden molemmille tiloille. Voimme saada ennustetun todennäköisyyden ja graafisesti esittää sen yhdessä alkuperäisen datan kanssa:
. predict prfed, pr
Mallissa on vain vähän epävarmuutta siitä, mikä on tila kullakin hetkellä. Näemme kolme korkeakorkoisten tilojen jaksoa ja neljä keskikorkeakorkoisten tilojen jaksoa.
Katsotaanpa, miten se toimii
Tarkastellaan esimerkkinä taudin puhkeamista, nimittäin sikotautia 10 000 asukasta kohti New Yorkissa vuosina 1929-1972. Voisi ajatella, että taudinpurkaukset vastaavat keskiarvomuutoksia, mutta se, mitä näemme aineistossa, on vielä suurempi muutos varianssissa:
Graafioimme muuttujan S12.mumpspc, joka tarkoittaa kausitasoitettuja sikotautitapauksia asukasta kohti 12 kuukauden jakson aikana, ja aiomme analysoida S12.mumpspc.
Oletamme kaksi järjestelmää, joissa S12.mumpspc:n keskiarvo ja varianssi muuttuvat. Sovittaaksemme dynaamisen (abrupt-change) mallin kirjoitamme
. mswitch dr S12.mumpspc, varswitch switch(LS12.mumpspc, noconstant)Performing EM optimizaton:Performing gradient-based optimization:
Iteraatio 0: | log likelihood = 110.9372 (ei kovera) |
Iteraatio 1: | log likelihood = 120.68028 |
Iteraatio 2: | log likelihood = 123.23244 |
Iteraatio 3: | log likelihood = 131.47084 |
Iteraatio 3: | log likelihood = 131.72182 |
Iteraatio 3: | log likelihood = 131.7225 |
Iteraatio 3: | log likelihood = 131.7225 |
Markov-kytkentäinen dynaaminen regressioOsake: 1929m2 – 1972m6 No. of obs = 521Number of states = 2 AIC = -0.4826Unconditional probabilities: transition HQIC = -0.4634 SBIC = -0.4336Log likelihood = 131.7225
S12.mumspc | Coef. Std. Err. z P>|z| | ||
State1 | |||
mumpspc | |||
LS12. | .4202751 .0167461 25.10 0.000 .3874533 .4530968 | ||
State2 | |||
mumpspc | |||
LS12. | .9847369 .0258383 38.11 0.000 .9340947 1.035379 | ||
sigma1 | .0562405 .0050954 .0470901 .067169 | ||
sigma2 | .2611362 .0111191 .2402278 .2838644 | ||
p11 | .762733 .0362619 .6846007 .205294 | ||
Ilmoitetaan
- S12:n kahden tilan keskiarvot.mumpspc (0.42 ja 0.98);
- kahden tilan keskihajonnat (0.06 ja 0.26); ja
- tilan 1 siirtymistodennäköisyydet tilasta 1 tilaan 1 ja tilasta 2 tilaan 1 (0.76 ja 0.15).
Tila 1 on matalan varianssin tila.
Siirtymätodennäköisyyksien koko joukko on seuraava: