Saturday, October 1, 2016

Arma bewegende gemiddelde voorbeeld

ARMA en ARIMA (Box-Jenkins) modelle ARMA en ARIMA (Box-Jenkins) modelle in die voorafgaande gedeeltes het ons gesien hoe die waarde van 'n eenveranderlike tydreekse op tydstip t. x t. gemodelleer kan word met behulp van 'n verskeidenheid van bewegende gemiddelde uitdrukkings. Ons het ook getoon dat komponente soos tendense en periodisiteit in die tydreeks uitdruklik gemodelleer kan word en / of geskei het, met die data wat ontbind word in tendens, seisoenale en oorblywende komponente. Ons het ook gewys, in die vorige besprekings oor outokorrelasie. dat die volle en gedeeltelike outokorrelasie koëffisiënte is baie nuttig in die identifisering en modellering patrone in tydreekse. Hierdie twee aspekte van tydreeksanalise en modellering kan gekombineer word in 'n meer algemene en dikwels baie effektief, algehele modellering raamwerk. In sy basiese vorm hierdie benadering staan ​​bekend as ARMA modellering (outoregressiewe bewegende gemiddelde), of wanneer breukmetodes is ingesluit in die proses, ARIMA of Posbus-Jenkins modellering, nadat die twee skrywers wat sentraal tot die ontwikkeling daarvan was (sien kassie amp Jenkins, 1968 BOX1, en Box, Jenkins amp Reinsel, 1994 BOX2). Daar is geen vaste reël met betrekking tot die aantal tydperke wat nodig is vir 'n suksesvolle model oefening, maar vir meer komplekse modelle, en vir 'n groter vertroue in prosedures fiks en validering, reeks met 50 keer stappe word dikwels aanbeveel. ARMA modelle kombineer outokorrelasie metodes (AR) en bewegende gemiddeldes (MA) in 'n saamgestelde model van die tydreeks. Voor oorweging van hoe hierdie modelle kan gekombineer word, ons kyk na elkeen afsonderlik. Ons het reeds gesien dat bewegende gemiddelde (MA) modelle kan gebruik word om 'n goeie passing te gee aan 'n paar datastelle en variasies op hierdie modelle wat dubbel of trippel eksponensiële gladstryking kan hanteer tendens en periodieke komponente in die data behels. Verder kan sulke modelle word gebruik om voorspellings dat die gedrag van die vorige tydperke naboots skep. 'N eenvoudige vorm van sulke modelle, gebaseer op vorige data, kan geskryf word as: Waar die beta Ek terme is die toepassing op voor waardes in die tyd reeks gewigte, en dit is gewoonlik om beta i 1 definieer, sonder verlies van algemeenheid. So vir 'n eerste orde proses, q 1 en het ons die model: dit wil sê die bewegende gemiddelde waarde word geskat as 'n geweegde gemiddelde van die huidige en onmiddellike verlede waardes. Dit gemiddelde proses is, in 'n sekere sin, 'n pragmatiese uitstrykingsmeganisme sonder 'n direkte skakel na 'n statistiese model. Ons kan egter 'n statistiese (of stogastiese) model wat die prosedures van bewegende gemiddeldes in samewerking met 'n arbitrêre prosesse behels spesifiseer. Dit is duidelik dat die verwagte waarde van xt onder: As ons toelaat dat 'n stel van 'n onafhanklike en identies verdeelde variate ( 'n ewekansige proses) met 'n nul gemiddelde en bekende vaste afwyking, dan kan ons die proses as 'n bewegende gemiddelde van orde q in terme van skryf hierdie model is 0, sodat die model is slegs geldig indien die xt is reeds aangepas om 'n nul beteken nie of as 'n vaste konstante (die gemiddelde van die XT) is bygevoeg om die opsomming. Dit is ook duidelik dat die variansie van xt is eenvoudig: Bogenoemde analise kan uitgebrei word om die kovariansie, cov (x t xtk.), Wat ons vind opbrengste te evalueer: Let daarop dat nie die gemiddelde waarde, of die kovariansie (of outokovariansiefunksie) by lag k is 'n funksie van die tyd, t. sodat die proses is tweede orde stilstaande. Die bogenoemde uitdrukking stel ons in staat om 'n uitdrukking te kry vir die outokorrelasie funksie (ACF): As k 0 rho k 1 en vir k GT Q rho k 0. Verder is die ACF is simmetriese en rho k rho-k. Die ACF kan bereken word vir 'n eerste orde MA proses: Die outoregressiewe of AR komponent van 'n ARMA model geskryf kan word in die vorm: waar die terme in is outokorrelasie koëffisiënte op lags 1,2. p en Z t is 'n residuele foutterm. Let daarop dat hierdie foutterm spesifiek betrekking het op die huidige tydperk, t. So vir 'n eerste orde proses, p 1 en ons het die model: Hierdie uitdrukkings meld dat die beraamde waarde van x op tydstip t word bepaal deur die onmiddellik voorafgaande waarde van x (dws op tydstip t -1) vermenigvuldig met 'n maat, Alpha . van die mate waarin die waardes vir alle pare waardes by tydperke lag 1 uitmekaar gekorreleer (dit wil sê hulle outokorrelasie), plus 'n residuele foutterm, z. op tyd t. Maar dit is juis die definisie van 'n Markov-proses. so 'n Markov-proses is 'n eerste orde outoregressiewe proses. As alfa 1 die model bepaal dat die volgende waarde van x is eenvoudig die vorige waarde plus 'n ewekansige foutterm, en dus is 'n eenvoudige 1D ewekansige loop. Indien meer terme ingesluit die model skat die waarde van x op tydstip t deur 'n geweegde som van hierdie terme plus 'n ewekansige fout komponent. As ons hierbo vervang die tweede uitdrukking in die eerste, ons het: en herhaal toediening van hierdie vervanging opbrengste: Nou as alfa LT1 en k is groot, kan hierdie uitdrukking word geskryf in die omgekeerde volgorde, met dalende terme en met bydrae van die term in x op die regterkant van die uitdrukking besig vanishingly klein, so ons het: Omdat die regterkant van hierdie uitdrukking modelle xt as die som van 'n geweegde stel voor waardes, in hierdie geval ewekansige fout terme, is dit duidelik dat hierdie AR model is, in werklikheid, 'n vorm van MA model. En as ons aanneem dat die fout terme nul gemiddelde en konstante stryd, dan soos in die MA-model wat ons het die verwagte waarde van die model as ook 0, die aanvaarding van die xt is aangepas om 'n nul gemiddelde verskaf, met variansie: Nou as solank Alpha LT1 hierdie opsomming is beperk en is eenvoudig 1 / (1- alfa), so ons het: (. x t x tk) soos met die MA-model hierbo, kan hierdie analise word uitgebrei na die kovariansie, cov evalueer van 'n eerste orde AR proses, wat ons vind opbrengste: vir Alpha LT1 hierdie opsomming is beperk en is eenvoudig Alpha k / (1- alfa 2), so ons het: dit blyk dat vir 'n eerste orde outoregressiewe model die outokorrelasie funksie (ACF) is eenvoudig gedefinieer deur opeenvolgende magte van die eerste orde outokorrelasie, met die voorwaarde Alpha LT1. Vir Alpha gt0 is dit net 'n vinnig dalende krag of eksponensiële kurwe, neig na nul, of vir lt0 dit is 'n dempende ossillasie kurwe, weer neig na nul. As 'n aanname gemaak word dat die tydreeks stilstaan ​​bogenoemde ontleding kan uitgebrei word om die tweede en hoër orde outokorrelasies. Ten einde 'n AR model geskik is om 'n waargenome dataset, poog ons om die som van 'n vierkant foute (a kleinste kwadrate pas) met behulp van die kleinste aantal terme wat 'n bevredigende passing om die data te verskaf verminder. Modelle van hierdie tipe word beskryf as outoregressiewe. en toegepas kan word om beide tydreekse en ruimtelike datastelle (sien verder, ruimtelike Outoregressiemodelle). Hoewel dit in teorie 'n outoregressiewe model kan 'n goeie passing vir 'n waargeneem dataset verskaf, sou dit oor die algemeen vereis voor verwydering van en tendens en periodieke komponente, en selfs dan kan 'n groot aantal terme nodig het om 'n goeie passing te gee aan die data. Maar deur die kombinasie van die AR modelle met MA modelle, ons kan 'n gesin van gemengde modelle wat in 'n wye verskeidenheid situasies te kommunikeer toegepas kan word te produseer. Hierdie modelle is bekend as ARMA en ARIMA modelle, en word beskryf in die volgende onderafdelings. In die vorige twee onderafdelings het ons die MA modus van orde Q: en die AR model van orde p: Ons kan hierdie twee modelle kombineer deur hulle eenvoudig bymekaar te tel as 'n model van orde (P Q.), Waar ons p AR terme en q MA terme: In die algemeen, hierdie vorm van gesamentlike ARMA model gebruik kan word om 'n tydreeks met minder terme algehele as óf 'n MA of 'n AR model deur hulself te modelleer. Dit gee uitdrukking aan die geskatte waarde op tydstip t as die som van Q terme wat die gemiddelde variasie van ewekansige variasie oor Q vorige tydperke (die MA komponent) verteenwoordig, plus die bedrag van P AR terme wat die huidige waarde van x te bereken as die geweegde som van die p mees onlangse waardes. Maar hierdie vorm van model veronderstel dat die tydreeks stilstaan, wat selde die geval. In die praktyk, tendense en periodisiteit bestaan ​​in baie datastelle, so daar is 'n behoefte om hierdie effekte te verwyder voordat hulle aansoek doen sulke modelle. Die opheffing is tipies deur onder meer in die model 'n aanvanklike breukmetodes stadium, gewoonlik een keer, twee of drie keer gedoen, totdat die reeks is ten minste ongeveer stilstaande - uitstal nie voor die hand liggend tendense of periodiciteiten. Soos met die MA en AR prosesse, is die breukmetodes proses beskryf word deur die einde van breukmetodes, byvoorbeeld 1, 2, 3. Gesamentlik hierdie drie elemente waaruit 'n driedubbele: (.. P d Q) wat die aard van die model toegepas definieer. In hierdie vorm, is die model beskryf word as 'n ARIMA model. Die brief wat ek in ARIMA verwys na die feit dat die dataset aanvanklik was differenced (vgl differensiasie) en wanneer die modellering voltooi die resultate moet dan word opgesom of geïntegreer tot die finale skattings en voorspellings te produseer. ARIMA modellering word hieronder bespreek. Soos in die vorige subartikel, die kombinasie van breukmetodes van 'n nie-stasionêre tydreekse met die ARMA model bied 'n kragtige familie van modelle wat in 'n wye verskeidenheid situasies te kommunikeer toegepas kan word. Ontwikkeling van hierdie uitgebreide vorm van model is grootliks te danke aan G E P Box en G M Jenkins, en as gevolg daarvan ARIMA modelle is ook bekend as Box-Jenkins modelle. Die eerste stap in die Box-Jenkins prosedure is om verskil die tydreeks totdat dit stilstaan, en daardeur te verseker dat die tendens en seisoenale komponente verwyder. In baie gevalle is een of twee stadium breukmetodes voldoende. Die differenced reeks sal korter as die bron reeks deur c tyd stappe, waar c die omvang van die breukmetodes wees. 'N ARMA model word dan toegerus om die gevolglike tydreekse. Omdat ARIMA modelle het drie parameters is daar baie variasies op die moontlike modelle wat gebruik kan word toegerus. Maar die besluit oor watter hierdie parameters kan moet gelei word deur 'n aantal basiese beginsels: (i) die model moet so eenvoudig as moontlik wees, dit wil sê bevat so min terme as moontlik, wat op sy beurt beteken dat die waardes van p en q moet klein wees (ii) die pas aan historiese data moet so goed as moontlik te wees, dit wil sê die grootte van die kwadraat verskille tussen die geskatte waarde op enige vorige tydperk en die werklike waarde, moet tot die minimum beperk (kleinste kwadrate beginsel) - die residue van die gekose model kan dan ondersoek om te sien of enige oorblywende residue is aansienlik verskil van 0 (sien verder hieronder) (iii) die gemeet gedeeltelike outokorrelasie op lags 1,2,3. moet 'n aanduiding van die einde van die AR komponent verskaf, met ander woorde die wat gekies is vir Q waarde (iv) die vorm van outokorrelasie funksie (ACF) plot kan raai die tipe ARIMA model vereis - die tabel hieronder (uit die NIST) verskaf riglyne oor interpretasie van die vorm van die ACF in terme van model seleksie. ARIMA Model tipe seleksie behulp ACF vorm Reeks is nie stilstaan. Standard ARIMA modelle word dikwels beskryf deur die driedubbele: (.. P d Q) soos hierbo. Hierdie definieer die struktuur van die model in terme van die orde van AR, breukmetodes en MA modelle te gebruik. Dit is ook moontlik om soortgelyke parameters vir seisoenaliteit in die data in te sluit, hoewel sulke modelle is meer kompleks te pas en te interpreteer - die afval (P. D. Q) word algemeen gebruik om so 'n model komponente te identifiseer. In die kiekie van SPSS hieronder getoon, is die dialoog vir die hand te kies nie-seisoenale en seisoenale strukturele elemente vertoon (soortgelyke fasiliteite is beskikbaar in ander geïntegreerde pakkette, soos SAS / ETS). Soos gesien kan word, die dialoog stel ook die data te omskep (tipies om te help met variansie stabilisering) en om gebruikers in staat stel om 'n konstante in die model (die verstek) insluit. Hierdie spesifieke sagteware hulpmiddel kan uitskieters te bespeur indien nodig, volgens 'n verskeidenheid van opsporing prosedures, maar in baie gevalle sal uitskieters is ondersoek en aangepas of verwyder en vervang waardes beraam, voor enige sodanige ontleding. SPSS Tyd Reeks Modeler: ARIMA modellering, kundige modus Verskeie ARIMA modelle kan toegerus om die data, met die hand of deur middel van 'n outomatiese proses (bv 'n stapsgewyse proses), en een of meer maatreëls gebruik om te oordeel wat is die beste in terme van pas en parsimonie. Model vergelyking maak tipies gebruik van een of meer van die vroeëre beskryf in hierdie handboek inligting teoretiese maatreëls - AIC, BIC en / of MDL (die R funksie, ARIMA (), bied die AIC meet, terwyl SPSS bied 'n verskeidenheid van geskikte maatreëls, ingesluit 'n weergawe van die BIC statistiek ander instrumente wissel in die voorsien maatreëls -. Minitab wat 'n verskeidenheid van TSA metodes bied, sluit nie AIC / BIC tipe statistieke). In die praktyk 'n wye verskeidenheid van maatreëls (dws anders as / bykomend tot die kleinste kwadrate gebaseer maatreëls, kan gebruik word om die model gehalte te evalueer. Byvoorbeeld, kan die gemiddelde absolute fout en die maksimum absolute fout wees bruikbare maatreëls, aangesien selfs 'n goeie kleinste kwadrate passing kan steeds swak wees in plekke. verskeie sagteware pakkette kan ook 'n algehele maatstaf van die outokorrelasie wat in die residue na pas die model kan bly. 'n statistiek dikwels toegepas is te danke aan Ljung en Box (1978 LJU1) en is van die vorm: waar n die aantal monsters (datawaardes), ri is die monster outokorrelasie op lag ek en k is die totale aantal lags waaroor die berekening uitgevoer word Q k is ongeveer versprei as.. 'n chi-kwadraat verspreiding met k -. m grade van vryheid, waar m die aantal parameters wat gebruik word in pas die model, met uitsluiting van enige konstante term of voorspeller veranderlikes (dit wil sê net insluitende die PD Q drietalle) As die maatstaf is statisties beduidend dit dui daarop dat die residue beduidende outokorrelasie bevat steeds na die model is toegerus, wat daarop dui dat 'n verbeterde model gesoek moet word. Voorbeeld: Modellering die groei van die lugredery passasiersgetalle Die volgende is 'n voorbeeld van outomatiese toebehore, met behulp van SPSS te the Box-Jenkins-Reinsel toetsdata van die lugredery passasiersgetalle REI1 vroeër in hierdie handboek. Aanvanklik geen spesifikasie van die datums wat maande binne jaar is vermeld. Die wat deur die outomatiese proses model was 'n ARIMA model (0,1,12), dit wil sê die proses korrek geïdentifiseer dat die reeks vereis een vlak van breukmetodes en toegepas n bewegende gemiddelde model met 'n periodisiteit van 12 en geen outokorrelasie komponent om die pas data. Die model pas geproduseer n R 2 waarde van 0,966, wat baie hoog is, en 'n maksimum absolute fout (MAE) van 75. Die visuele passing van die model om die data lyk uitstekend, maar die plot van die oorblywende outokorrelasie ná pas en Ljung - kader toets toon dat beduidende outokorrelasie bly, wat daarop dui dat 'n verbeterde model is moontlik. Outomatiese ARIMA geskik is om Internasionale Airline Passasiers: Maandeliks totale, 1949-1960 Om te ondersoek dit verder 'n hersiene model is toegerus, gebaseer op die bespreking van hierdie datastel deur Box en Jenkins (1968) en die opgedateerde uitgawe van Chatfields (1975 CHA1) boek in wat hy gebruik Minitab sy ontleding (6de uitgawe, 2003) illustreer. Die tydreekse is gedefinieer as 'n periodisiteit van 12 maande en 'n ARIMA model met komponente (0,1,1), (0,1,1). Grafies die resultate lyk baie soortgelyk aan die grafiek hierbo, maar met hierdie model die R-kwadraat is 0,991, die MAE41 en die Ljung-Box statistiek is nie meer beduidende (12.6, met 16 grade van vryheid). Die model is dus 'n verbetering op die oorspronklike (outomaties gegenereer) weergawe, wat bestaan ​​uit 'n nie-seisoenale MA en 'n seisoenale MA komponent, geen outoregressiewe komponent, en een vlak van breukmetodes vir die seisoenale en nie-seisoenale strukture. Of pas is handleiding of outomatiese, kan 'n ARIMA model 'n goeie raamwerk vir die modellering van 'n tydreeks, of dit kan wees dat alternatiewe modelle of benaderings 'n meer bevredigende resultaat. Dikwels is dit moeilik om vooraf te weet hoe goed 'n gegewe voorspelling model is geneig om te wees, want dit is net in die lig van sy vermoë om toekomstige waardes van die data-reeks wat dit werklik kan geoordeel word voorspel. Dikwels word hierdie proses benader word deur die pas van die model om die verlede data uitgesluit onlangse tydperke (ook bekend as die hande-out monsters), en dan met behulp van die model om hierdie bekende toekomstige gebeure te voorspel, maar selfs hierdie bied slegs 'n beperkte vertroue in die toekoms geldigheid. Langer termyn vooruitskatting kan uiters onbetroubaar wees gebruik van sulke metodes. Dit is duidelik dat die internasionale lugverkeer statistieke model hierbo beskryf is nie in staat om korrek te voorspel passasiers getalle deur in die 1990's en daarna, of die 5-jaar daling in Amerikaanse internasionale lugredery passasiersgetalle post 2001/09/11. Net so kan 'n ARIMA model toegerus om historiese waardes van aandelebeurs pryse of indekswaardes (bv die NYSE of FTSE indekse) en sal tipies bied 'n uitstekende geskik is om die data (opbrengs 'n R-kwadraat-waarde van beter as 0.99), maar is dikwels van weinig nut vir die voorspelling van toekomstige waardes van hierdie pryse of indekse. Tipies ARIMA modelle word gebruik vir vooruitskatting, veral op die gebied van makro - en mikro-ekonomiese modelle. Hulle kan egter toegepas word in 'n wye verskeidenheid van dissiplines, hetsy in die vorm wat hier beskryf word, of aangevul met bykomende voorspeller veranderlikes wat geglo om die betroubaarheid van die voorspellings gemaak verbeter. Laasgenoemde is belangrik, want die hele struktuur van die ARMA modelle wat hierbo bespreek is, hang af van voor waardes en onafhanklike ewekansige gebeure met verloop van tyd, nie op enige verduidelikende of veroorsakende faktore. Vandaar ARIMA modelle sal slegs weerspieël en uit te brei afgelope patrone, wat nodig mag in voorspellings te verander deur faktore soos die makro-ekonomiese omgewing, tegnologie skofte, of langer termyn hulpbron en / of omgewingsveranderinge. BOX1 Box G E P, Jenkins G M (1968). Sommige onlangse vooruitgang in vooruitskatting en beheer. Toegepaste Statistiek, 17 (2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Tydreeksanalise, voorspelling en beheer. 3rd ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen (sien ook, 6 ed. 2003) LJU1 Ljung G M, Posbus G E P (1978) Op 'n mate van 'n gebrek aan Fit in Tydreeksmodelle. Biometrika, 65, 297303 NIST / SEMATECH e-handboek statistiese metodes, www. itl. nist. gov/div898/handbook/ Afdeling 6.4: Inleiding tot tyd reeks. 2010 SPSS / PASW 17 (2008) AnalyzeForecasting (Tydreeksmodelle) REI1 Reinsel GC Datastelle vir Box-Jenkins modelle: www. stat. wisc. edu/2.1 bewegende gemiddelde modelle (MA modelle) tydreeksmodelle bekend as ARIMA modelle kan outoregressiewe sluit terme en / of bewegende gemiddelde terme. In Week 1, het ons geleer 'n outoregressiewe term in 'n tydreeks model vir die veranderlike x t is 'n vertraagde waarde van x t. Byvoorbeeld, 'n lag 1 outoregressiewe termyn is x t-1 (vermenigvuldig met 'n koëffisiënt). Hierdie les definieer bewegende gemiddelde terme. 'N bewegende gemiddelde termyn in 'n tydreeks model is 'n verlede fout (vermenigvuldig met 'n koëffisiënt). Laat (WT omslaan N (0, sigma2w)), wat beteken dat die w t is identies, onafhanklik versprei, elk met 'n normaalverdeling met gemiddelde 0 en dieselfde afwyking. Die 1 ste orde bewegende gemiddelde model, aangedui deur MA (1) is (xt mu wt theta1w) Die 2de orde bewegende gemiddelde model, aangedui deur MA (2) is (xt mu wt theta1w theta2w) Die Q de orde bewegende gemiddelde model , aangedui deur MA (Q) is (xt mu wt theta1w theta2w kolle thetaqw) Nota. Baie handboeke en sagteware programme definieer die model met negatiewe tekens voor die terme. Dit nie die geval verander die algemene teoretiese eienskappe van die model, hoewel dit flip die algebraïese tekens van beraamde koëffisiënt waardes en (unsquared) terme in formules vir ACFs en afwykings. Jy moet jou sagteware kyk om te kontroleer of negatiewe of positiewe tekens is gebruik om korrek te skryf die beraamde model. R gebruik positiewe tekens in sy onderliggende model, soos ons hier doen. Teoretiese Eienskappe van 'n tydreeks met 'n MA (1) Model Let daarop dat die enigste nie-nul waarde in die teoretiese ACF is vir lag 1. Alle ander outokorrelasies is 0. So 'n monster ACF met 'n beduidende outokorrelasie net by lag 1 is 'n aanduiding van 'n moontlike MA (1) model. Vir belangstellende studente, bewyse van hierdie eienskappe is 'n bylae tot hierdie opdragstuk. Voorbeeld 1 Veronderstel dat 'n MA (1) model is x t 10 w t 0,7 w t-1. waar (WT omslaan N (0,1)). So het die koëffisiënt 1 0.7. Die teoretiese ACF gegee word deur 'n plot van hierdie volg ACF. Die plot net aangedui is die teoretiese ACF vir 'n MA (1) met 1 0.7. In die praktyk, 'n monster gewoond gewoonlik verskaf so 'n duidelike patroon. Die gebruik van R, gesimuleerde ons N 100 monster waardes gebruik te maak van die model x t 10 w t 0,7 w t-1 waar w t IID N (0,1). Vir hierdie simulasie, 'n tydreeks plot van die steekproefdata volg. Ons kan nie sê baie van hierdie plot. Die monster ACF vir die gesimuleerde data volg. Ons sien 'n skerp styging in lag 1 gevolg deur die algemeen nie-beduidende waardes vir lags afgelope 1. Let daarop dat die monster ACF kom nie ooreen met die teoretiese patroon van die onderliggende MA (1), en dit is dat al outokorrelasies vir lags afgelope 1 sal wees 0 . 'n ander voorbeeld sou 'n effens verskillende monster ACF hieronder getoon, maar sal waarskynlik dieselfde breë funksies. Theroretical Eienskappe van 'n tydreeks met 'n MA (2) model vir die MA (2) model, teoretiese eienskappe is soos volg: Let daarop dat die enigste nie-nul waardes in die teoretiese ACF is vir lags 1 en 2. outokorrelasies vir hoër lags is 0 . So, 'n monster ACF met 'n beduidende outokorrelasies by lags 1 en 2, maar nie-beduidende outokorrelasies vir hoër lags dui op 'n moontlike MA (2) model. IID N (0,1). Die koëffisiënte is 1 0.5 en 2 0.3. Want dit is 'n MA (2), sal die teoretiese ACF nul waardes het net by lags 1 en 2. Waardes van die twee nie-nul outokorrelasies is 'n plot van die teoretiese ACF volg. Soos byna altyd die geval is, monster data gewoond te tree heeltemal so perfek as teorie. Ons gesimuleerde N 150 monster waardes vir die model x t 10 w t 0,5 w t-1 0,3 w t-2. waar w t IID N (0,1). Die tydreekse plot van die data volg. Soos met die tydreeks plot vir die MA (1) voorbeeld van die data, kan nie vir jou sê baie daaruit. Die monster ACF vir die gesimuleerde data volg. Die patroon is tipies vir situasies waar 'n MA (2) model nuttig kan wees. Daar is twee statisties beduidende spykers by lags 1 en 2, gevolg deur nie-beduidende waardes vir ander lags. Let daarop dat as gevolg van steekproeffout, die monster ACF nie die teoretiese patroon presies ooreenstem. ACF vir Algemene MA (Q) Models n eiendom van MA (Q) modelle in die algemeen is dat daar nie-nul outokorrelasies vir die eerste Q lags en outokorrelasies 0 vir alle lags GT q. Nie-uniekheid van verband tussen waardes van 1 en (rho1) in MA (1) Model. In die MA (1) model, vir enige waarde van 1. die wedersydse 01/01 gee dieselfde waarde vir so 'n voorbeeld, gebruik 0,5 vir 1. en gebruik dan 1 / (0,5) 2 vir 1. Jy sal kry (rho1) 0.4 in beide gevalle. Om 'n teoretiese beperking genoem inverteerbaarheid bevredig. Ons beperk MA (1) modelle om waardes met absolute waarde minder as 1. In die voorbeeld net gegee, 1 0.5 sal 'n toelaatbare parameter waarde wees nie, terwyl 1 1 / 0.5 2 nie. Inverteerbaarheid van MA modelle 'n MA-model word gesê omkeerbare te wees indien dit algebraïes gelykstaande aan 'n konvergerende oneindige orde AR model. Bevestig deur die, bedoel ons dat die AR koëffisiënte daal tot 0 as ons terug beweeg in die tyd. Inverteerbaarheid is 'n beperking geprogrammeer in die tyd reeks sagteware wat gebruik word om die koëffisiënte van modelle te skat met MA terme. Dit is nie iets wat ons gaan vir die data-analise. Bykomende inligting oor die inverteerbaarheid beperking vir MA (1) modelle word in die bylaag. Gevorderde teorie Nota. Vir 'n MA (Q) model met 'n bepaalde ACF, daar is net een omkeerbare model. Die noodsaaklike voorwaarde vir inverteerbaarheid is dat die koëffisiënte waardes sodanig dat die vergelyking 1- 1 y. - Q y q 0 het oplossings vir y wat buite die eenheidsirkel val. R-kode vir die voorbeelde in Voorbeeld 1, ons geplot die teoretiese ACF van die model x t 10 w t. 7W t-1. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik word om die teoretiese ACF plot was: acfma1ARMAacf (Mac (0,7), lag. max10) 10 lags van ACF vir MA (1) met theta1 0.7 lags0: 10 skep 'n veranderlike genaamd lags wat wissel van 0 tot 10. plot (lags, acfma1, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (1) met theta1 0.7) abline (H0) voeg n horisontale as om die plot die eerste opdrag bepaal die ACF en slaan dit in 'n voorwerp vernoem acfma1 (ons keuse van naam). Die plot opdrag (die 3de gebod) erwe lags teenoor die ACF waardes vir lags 1 tot 10. Die ylab parameter etikette die y-as en die belangrikste parameter sit 'n titel op die plot. Om te sien die numeriese waardes van die ACF net gebruik die opdrag acfma1. Die simulasie en erwe is gedoen met die volgende opdragte. xcarima. sim (N150, lys (Mac (0,7))) Simuleer N 150 waardes van MA (1) xxc10 voeg 10 tot gemiddelde 10. Simulasie gebreke maak beteken 0. plot (x, typeb, mainSimulated MA (1) data) ACF (x, xlimc (1,10), mainACF vir gesimuleerde steekproefdata) In Voorbeeld 2, ons geplot die teoretiese ACF van die model xt 10 wt 0,5 w t-1 0,3 w t-2. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik was acfma2ARMAacf (Mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (2) met theta1 0.5, theta20.3) abline (H0) xcarima. sim (N150, lys (Mac (0.5, 0.3))) xxc10 plot (x, typeb, hoof Gesimuleerde MA (2) Series) ACF (x, xlimc (1,10), mainACF vir gesimuleerde MA (2) Data) Bylae: Bewys van eiendomme van MA (1) vir belangstellende studente, hier is bewyse vir teoretiese eienskappe van die MA (1) model. Variansie: (teks (xt) teks (mu wt theta1 w) 0 teks (WT) teks (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wanneer h 1, die vorige uitdrukking 1 W 2. Vir enige h 2, die vorige uitdrukking 0 . die rede hiervoor is dat per definisie van onafhanklikheid van die WT. E (w k w j) 0 vir enige k j. Verder, omdat die w t het intussen 0, E (w j w j) E (w j 2) w 2. Vir 'n tydreeks, Pas hierdie resultaat aan die ACF hierbo kry. 'N omkeerbare MA model is die een wat geskryf kan word as 'n oneindige orde AR model wat konvergeer sodat die AR koëffisiënte konvergeer na 0 as ons oneindig terug in die tyd beweeg. Wel demonstreer inverteerbaarheid vir die MA (1) model. Ons het toe plaasvervanger verhouding (2) vir w t-1 in vergelyking (1) (3) (ZT wt theta1 (Z - theta1w) wt theta1z - theta2w) op tydstip t-2. vergelyking (2) word Ons het toe plaasvervanger verhouding (4) vir w t-2 in vergelyking (3) (ZT wt theta1 Z - theta21w wt theta1z - theta21 (Z - theta1w) wt theta1z - theta12z theta31w) As ons voortgaan ( oneindig), sou ons die oneindige orde AR model kry (ZT wt theta1 Z - theta21z theta31z - theta41z kolletjies) Nota egter dat as 1 1, die koëffisiënte die lags van Z vermenigvuldig sal toeneem (oneindig) in grootte as ons terug beweeg in tyd. Om dit te voorkom, moet ons 1 LT1. Dit is die voorwaarde vir 'n omkeerbare MA (1) model. Oneindige Bestel MA model In week 3, goed sien dat 'n AR (1) model kan omgeskakel word na 'n oneindige orde MA model: (xt - mu wt phi1w phi21w kolle phik1 w kolle som phij1w) Hierdie opsomming van verlede wit geraas terme is bekende as die oorsaaklike voorstelling van 'n AR (1). Met ander woorde, x t is 'n spesiale tipe MA met 'n oneindige aantal terme terug gaan in die tyd. Dit is 'n oneindige orde MA of MA () genoem. 'N Eindige orde MA is 'n oneindige orde AR en enige eindige orde AR is 'n oneindige orde MA. Onthou in Week 1, het ons opgemerk dat 'n vereiste vir 'n stilstaande AR (1) is dat 1 LT1. Kom ons bereken die Var (x t) met behulp van die oorsaaklike verteenwoordiging. Die laaste stap gebruik 'n basiese feit oor meetkundige reeks wat vereis (phi1lt1) anders sal die reeks divergeer. NavigationDocumentation is die onvoorwaardelike gemiddelde van die proses, en x03C8 (L) is 'n rasionele, oneindige-graad lag operateur polinoom, (1 x03C8 1 L x03C8 2 L 2 x2026). Let wel: Die konstante eienskap van 'n ARIMA model voorwerp ooreenstem met c. en nie die onvoorwaardelike gemiddelde 956. Deur Wolds ontbinding 1. Vergelyking 5-12 ooreenstem met 'n stilstaande stogastiese proses op voorwaarde dat die koëffisiënte x03C8 Ek is absoluut summable. Dit is die geval wanneer die AR polinoom, x03D5 (L). is stabiel. wat beteken dat al sy wortels lê buite die eenheidsirkel. Daarbenewens het die proses is kousale op voorwaarde dat die MA polinoom is omkeerbaar. wat beteken dat al sy wortels lê buite die eenheidsirkel. Ekonometrie Gereedskap dwing stabiliteit en inverteerbaarheid van ARMA prosesse. Wanneer jy 'n ARMA model spesifiseer met behulp van ARIMA. jy 'n fout as jy koëffisiënte wat nie ooreenstem met 'n stabiele AR polinoom of omkeerbare MA polinoom betree. Net so, skat lê stasionariteit en inverteerbaarheid beperkings tydens beraming. Verwysings 1 Wold, H. 'n studie in die ontleding van tydreekse. Uppsala, Swede: Almqvist amp Wiksell, 1938. Kies jou CountryARMA en ARIMA (Box-Jenkins) modelle ARMA en ARIMA (Box-Jenkins) modelle in die voorafgaande gedeeltes het ons gesien hoe die waarde van 'n eenveranderlike tydreekse op tydstip t. x t. gemodelleer kan word met behulp van 'n verskeidenheid van bewegende gemiddelde uitdrukkings. Ons het ook getoon dat komponente soos tendense en periodisiteit in die tydreeks uitdruklik gemodelleer kan word en / of geskei het, met die data wat ontbind word in tendens, seisoenale en oorblywende komponente. Ons het ook gewys, in die vorige besprekings oor outokorrelasie. dat die volle en gedeeltelike outokorrelasie koëffisiënte is baie nuttig in die identifisering en modellering patrone in tydreekse. Hierdie twee aspekte van tydreeksanalise en modellering kan gekombineer word in 'n meer algemene en dikwels baie effektief, algehele modellering raamwerk. In sy basiese vorm hierdie benadering staan ​​bekend as ARMA modellering (outoregressiewe bewegende gemiddelde), of wanneer breukmetodes is ingesluit in die proses, ARIMA of Posbus-Jenkins modellering, nadat die twee skrywers wat sentraal tot die ontwikkeling daarvan was (sien kassie amp Jenkins, 1968 BOX1, en Box, Jenkins amp Reinsel, 1994 BOX2). Daar is geen vaste reël met betrekking tot die aantal tydperke wat nodig is vir 'n suksesvolle model oefening, maar vir meer komplekse modelle, en vir 'n groter vertroue in prosedures fiks en validering, reeks met 50 keer stappe word dikwels aanbeveel. ARMA modelle kombineer outokorrelasie metodes (AR) en bewegende gemiddeldes (MA) in 'n saamgestelde model van die tydreeks. Voor oorweging van hoe hierdie modelle kan gekombineer word, ons kyk na elkeen afsonderlik. Ons het reeds gesien dat bewegende gemiddelde (MA) modelle kan gebruik word om 'n goeie passing te gee aan 'n paar datastelle en variasies op hierdie modelle wat dubbel of trippel eksponensiële gladstryking kan hanteer tendens en periodieke komponente in die data behels. Verder kan sulke modelle word gebruik om voorspellings dat die gedrag van die vorige tydperke naboots skep. 'N eenvoudige vorm van sulke modelle, gebaseer op vorige data, kan geskryf word as: Waar die beta Ek terme is die toepassing op voor waardes in die tyd reeks gewigte, en dit is gewoonlik om beta i 1 definieer, sonder verlies van algemeenheid. So vir 'n eerste orde proses, q 1 en het ons die model: dit wil sê die bewegende gemiddelde waarde word geskat as 'n geweegde gemiddelde van die huidige en onmiddellike verlede waardes. Dit gemiddelde proses is, in 'n sekere sin, 'n pragmatiese uitstrykingsmeganisme sonder 'n direkte skakel na 'n statistiese model. Ons kan egter 'n statistiese (of stogastiese) model wat die prosedures van bewegende gemiddeldes in samewerking met 'n arbitrêre prosesse behels spesifiseer. Dit is duidelik dat die verwagte waarde van xt onder: As ons toelaat dat 'n stel van 'n onafhanklike en identies verdeelde variate ( 'n ewekansige proses) met 'n nul gemiddelde en bekende vaste afwyking, dan kan ons die proses as 'n bewegende gemiddelde van orde q in terme van skryf hierdie model is 0, sodat die model is slegs geldig indien die xt is reeds aangepas om 'n nul beteken nie of as 'n vaste konstante (die gemiddelde van die XT) is bygevoeg om die opsomming. Dit is ook duidelik dat die variansie van xt is eenvoudig: Bogenoemde analise kan uitgebrei word om die kovariansie, cov (x t xtk.), Wat ons vind opbrengste te evalueer: Let daarop dat nie die gemiddelde waarde, of die kovariansie (of outokovariansiefunksie) by lag k is 'n funksie van die tyd, t. sodat die proses is tweede orde stilstaande. Die bogenoemde uitdrukking stel ons in staat om 'n uitdrukking te kry vir die outokorrelasie funksie (ACF): As k 0 rho k 1 en vir k GT Q rho k 0. Verder is die ACF is simmetriese en rho k rho-k. Die ACF kan bereken word vir 'n eerste orde MA proses: Die outoregressiewe of AR komponent van 'n ARMA model geskryf kan word in die vorm: waar die terme in is outokorrelasie koëffisiënte op lags 1,2. p en Z t is 'n residuele foutterm. Let daarop dat hierdie foutterm spesifiek betrekking het op die huidige tydperk, t. So vir 'n eerste orde proses, p 1 en ons het die model: Hierdie uitdrukkings meld dat die beraamde waarde van x op tydstip t word bepaal deur die onmiddellik voorafgaande waarde van x (dws op tydstip t -1) vermenigvuldig met 'n maat, Alpha . van die mate waarin die waardes vir alle pare waardes by tydperke lag 1 uitmekaar gekorreleer (dit wil sê hulle outokorrelasie), plus 'n residuele foutterm, z. op tyd t. Maar dit is juis die definisie van 'n Markov-proses. so 'n Markov-proses is 'n eerste orde outoregressiewe proses. As alfa 1 die model bepaal dat die volgende waarde van x is eenvoudig die vorige waarde plus 'n ewekansige foutterm, en dus is 'n eenvoudige 1D ewekansige loop. Indien meer terme ingesluit die model skat die waarde van x op tydstip t deur 'n geweegde som van hierdie terme plus 'n ewekansige fout komponent. As ons hierbo vervang die tweede uitdrukking in die eerste, ons het: en herhaal toediening van hierdie vervanging opbrengste: Nou as alfa LT1 en k is groot, kan hierdie uitdrukking word geskryf in die omgekeerde volgorde, met dalende terme en met bydrae van die term in x op die regterkant van die uitdrukking besig vanishingly klein, so ons het: Omdat die regterkant van hierdie uitdrukking modelle xt as die som van 'n geweegde stel voor waardes, in hierdie geval ewekansige fout terme, is dit duidelik dat hierdie AR model is, in werklikheid, 'n vorm van MA model. En as ons aanneem dat die fout terme nul gemiddelde en konstante stryd, dan soos in die MA-model wat ons het die verwagte waarde van die model as ook 0, die aanvaarding van die xt is aangepas om 'n nul gemiddelde verskaf, met variansie: Nou as solank Alpha LT1 hierdie opsomming is beperk en is eenvoudig 1 / (1- alfa), so ons het: (. x t x tk) soos met die MA-model hierbo, kan hierdie analise word uitgebrei na die kovariansie, cov evalueer van 'n eerste orde AR proses, wat ons vind opbrengste: vir Alpha LT1 hierdie opsomming is beperk en is eenvoudig Alpha k / (1- alfa 2), so ons het: dit blyk dat vir 'n eerste orde outoregressiewe model die outokorrelasie funksie (ACF) is eenvoudig gedefinieer deur opeenvolgende magte van die eerste orde outokorrelasie, met die voorwaarde Alpha LT1. Vir Alpha gt0 is dit net 'n vinnig dalende krag of eksponensiële kurwe, neig na nul, of vir lt0 dit is 'n dempende ossillasie kurwe, weer neig na nul. As 'n aanname gemaak word dat die tydreeks stilstaan ​​bogenoemde ontleding kan uitgebrei word om die tweede en hoër orde outokorrelasies. Ten einde 'n AR model geskik is om 'n waargenome dataset, poog ons om die som van 'n vierkant foute (a kleinste kwadrate pas) met behulp van die kleinste aantal terme wat 'n bevredigende passing om die data te verskaf verminder. Modelle van hierdie tipe word beskryf as outoregressiewe. en toegepas kan word om beide tydreekse en ruimtelike datastelle (sien verder, ruimtelike Outoregressiemodelle). Hoewel dit in teorie 'n outoregressiewe model kan 'n goeie passing vir 'n waargeneem dataset verskaf, sou dit oor die algemeen vereis voor verwydering van en tendens en periodieke komponente, en selfs dan kan 'n groot aantal terme nodig het om 'n goeie passing te gee aan die data. Maar deur die kombinasie van die AR modelle met MA modelle, ons kan 'n gesin van gemengde modelle wat in 'n wye verskeidenheid situasies te kommunikeer toegepas kan word te produseer. Hierdie modelle is bekend as ARMA en ARIMA modelle, en word beskryf in die volgende onderafdelings. In die vorige twee onderafdelings het ons die MA modus van orde Q: en die AR model van orde p: Ons kan hierdie twee modelle kombineer deur hulle eenvoudig bymekaar te tel as 'n model van orde (P Q.), Waar ons p AR terme en q MA terme: In die algemeen, hierdie vorm van gesamentlike ARMA model gebruik kan word om 'n tydreeks met minder terme algehele as óf 'n MA of 'n AR model deur hulself te modelleer. Dit gee uitdrukking aan die geskatte waarde op tydstip t as die som van Q terme wat die gemiddelde variasie van ewekansige variasie oor Q vorige tydperke (die MA komponent) verteenwoordig, plus die bedrag van P AR terme wat die huidige waarde van x te bereken as die geweegde som van die p mees onlangse waardes. Maar hierdie vorm van model veronderstel dat die tydreeks stilstaan, wat selde die geval. In die praktyk, tendense en periodisiteit bestaan ​​in baie datastelle, so daar is 'n behoefte om hierdie effekte te verwyder voordat hulle aansoek doen sulke modelle. Die opheffing is tipies deur onder meer in die model 'n aanvanklike breukmetodes stadium, gewoonlik een keer, twee of drie keer gedoen, totdat die reeks is ten minste ongeveer stilstaande - uitstal nie voor die hand liggend tendense of periodiciteiten. Soos met die MA en AR prosesse, is die breukmetodes proses beskryf word deur die einde van breukmetodes, byvoorbeeld 1, 2, 3. Gesamentlik hierdie drie elemente waaruit 'n driedubbele: (.. P d Q) wat die aard van die model toegepas definieer. In hierdie vorm, is die model beskryf word as 'n ARIMA model. Die brief wat ek in ARIMA verwys na die feit dat die dataset aanvanklik was differenced (vgl differensiasie) en wanneer die modellering voltooi die resultate moet dan word opgesom of geïntegreer tot die finale skattings en voorspellings te produseer. ARIMA modellering word hieronder bespreek. Soos in die vorige subartikel, die kombinasie van breukmetodes van 'n nie-stasionêre tydreekse met die ARMA model bied 'n kragtige familie van modelle wat in 'n wye verskeidenheid situasies te kommunikeer toegepas kan word. Ontwikkeling van hierdie uitgebreide vorm van model is grootliks te danke aan G E P Box en G M Jenkins, en as gevolg daarvan ARIMA modelle is ook bekend as Box-Jenkins modelle. Die eerste stap in die Box-Jenkins prosedure is om verskil die tydreeks totdat dit stilstaan, en daardeur te verseker dat die tendens en seisoenale komponente verwyder. In baie gevalle is een of twee stadium breukmetodes voldoende. Die differenced reeks sal korter as die bron reeks deur c tyd stappe, waar c die omvang van die breukmetodes wees. 'N ARMA model word dan toegerus om die gevolglike tydreekse. Omdat ARIMA modelle het drie parameters is daar baie variasies op die moontlike modelle wat gebruik kan word toegerus. Maar die besluit oor watter hierdie parameters kan moet gelei word deur 'n aantal basiese beginsels: (i) die model moet so eenvoudig as moontlik wees, dit wil sê bevat so min terme as moontlik, wat op sy beurt beteken dat die waardes van p en q moet klein wees (ii) die pas aan historiese data moet so goed as moontlik te wees, dit wil sê die grootte van die kwadraat verskille tussen die geskatte waarde op enige vorige tydperk en die werklike waarde, moet tot die minimum beperk (kleinste kwadrate beginsel) - die residue van die gekose model kan dan ondersoek om te sien of enige oorblywende residue is aansienlik verskil van 0 (sien verder hieronder) (iii) die gemeet gedeeltelike outokorrelasie op lags 1,2,3. moet 'n aanduiding van die einde van die AR komponent verskaf, met ander woorde die wat gekies is vir Q waarde (iv) die vorm van outokorrelasie funksie (ACF) plot kan raai die tipe ARIMA model vereis - die tabel hieronder (uit die NIST) verskaf riglyne oor interpretasie van die vorm van die ACF in terme van model seleksie. ARIMA Model tipe seleksie behulp ACF vorm Reeks is nie stilstaan. Standard ARIMA modelle word dikwels beskryf deur die driedubbele: (.. P d Q) soos hierbo. Hierdie definieer die struktuur van die model in terme van die orde van AR, breukmetodes en MA modelle te gebruik. Dit is ook moontlik om soortgelyke parameters vir seisoenaliteit in die data in te sluit, hoewel sulke modelle is meer kompleks te pas en te interpreteer - die afval (P. D. Q) word algemeen gebruik om so 'n model komponente te identifiseer. In die kiekie van SPSS hieronder getoon, is die dialoog vir die hand te kies nie-seisoenale en seisoenale strukturele elemente vertoon (soortgelyke fasiliteite is beskikbaar in ander geïntegreerde pakkette, soos SAS / ETS). Soos gesien kan word, die dialoog stel ook die data te omskep (tipies om te help met variansie stabilisering) en om gebruikers in staat stel om 'n konstante in die model (die verstek) insluit. Hierdie spesifieke sagteware hulpmiddel kan uitskieters te bespeur indien nodig, volgens 'n verskeidenheid van opsporing prosedures, maar in baie gevalle sal uitskieters is ondersoek en aangepas of verwyder en vervang waardes beraam, voor enige sodanige ontleding. SPSS Tyd Reeks Modeler: ARIMA modellering, kundige modus Verskeie ARIMA modelle kan toegerus om die data, met die hand of deur middel van 'n outomatiese proses (bv 'n stapsgewyse proses), en een of meer maatreëls gebruik om te oordeel wat is die beste in terme van pas en parsimonie. Model vergelyking maak tipies gebruik van een of meer van die vroeëre beskryf in hierdie handboek inligting teoretiese maatreëls - AIC, BIC en / of MDL (die R funksie, ARIMA (), bied die AIC meet, terwyl SPSS bied 'n verskeidenheid van geskikte maatreëls, ingesluit 'n weergawe van die BIC statistiek ander instrumente wissel in die voorsien maatreëls -. Minitab wat 'n verskeidenheid van TSA metodes bied, sluit nie AIC / BIC tipe statistieke). In die praktyk 'n wye verskeidenheid van maatreëls (dws anders as / bykomend tot die kleinste kwadrate gebaseer maatreëls, kan gebruik word om die model gehalte te evalueer. Byvoorbeeld, kan die gemiddelde absolute fout en die maksimum absolute fout wees bruikbare maatreëls, aangesien selfs 'n 3rd ed.


No comments:

Post a Comment