Autocorrelação do processo de média móvel Este exemplo mostra como introduzir a autocorrelação em um processo de ruído branco por meio de filtragem. Quando introduzimos autocorrelação em um sinal aleatório, manipulamos seu conteúdo de frequência. Um filtro de média móvel atenua os componentes de alta freqüência do sinal, efetivamente suavizando-o. Crie a resposta ao impulso para um filtro de média móvel de 3 pontos. Filtre uma sequência de ruído branco N (0,1) com o filtro. Defina o gerador de números aleatórios para as configurações padrão para resultados reproduzíveis. Obtenha a autocorrelação de amostra parcial para 20 lags. Plote a autocorrelação da amostra junto com a autocorrelação teórica. A autocorrelação da amostra captura a forma geral da autocorrelação teórica, mesmo que as duas seqüências não concordem em detalhes. Neste caso, é claro que o filtro introduziu uma autocorrelação significativa apenas nos desfasamentos de -2,2. O valor absoluto da sequência decai rapidamente para zero fora desse intervalo. Para verificar se o conteúdo da freqüência foi afetado, traçar estimativas de Welch das densidades espectrais de potência dos sinais originais e filtrados. O ruído branco foi colorido pelo filtro da média móvel. MATLAB e Simulink são marcas registradas da The MathWorks, Inc. Consulte a mathworks / trademarks para obter uma lista de outras marcas registradas de propriedade da The MathWorks, Inc. Outros nomes de produtos ou marcas são marcas comerciais ou registradas de seus respectivos proprietários. Selecione seu país2.1 Modelos de média móvel (modelos MA) Modelos de séries temporais conhecidos como modelos ARIMA podem incluir termos autoregressivos e / ou termos médios móveis. Na semana 1, aprendemos um termo autoregressivo em um modelo de série temporal para a variável x t é um valor defasado de x t. Por exemplo, um termo autorregressivo lag 1 é x t-1 (multiplicado por um coeficiente). Esta lição define os termos da média móvel. Um termo de média móvel em um modelo de série temporal é um erro passado (multiplicado por um coeficiente). Let (wt overset N (0, sigma2w)), significando que wt são idênticos, independentemente distribuídos, cada um com uma distribuição normal tendo média 0 e a mesma variância. O modelo de média móvel de 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w teta2w) O modelo de média móvel de ordem q , indicado por MA (q) é (xt mu wt theta1w theta2w pontos thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora inverta os sinais algébricos de valores de coeficientes estimados e termos (não-quadrados) em fórmulas para ACFs e variâncias. Você precisa verificar seu software para verificar se sinais positivos ou negativos foram usados para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades Teóricas de uma Série Temporal com um Modelo MA (1) Observe que o único valor diferente de zero no ACF teórico é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma amostra de ACF com uma autocorrelação significativa somente no lag 1 é um indicador de um possível modelo MA (1). Para estudantes interessados, as provas dessas propriedades são um apêndice a este folheto. Exemplo 1 Suponha que um modelo MA (1) seja x t 10 w t .7 w t-1. onde (wet overset N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por Um gráfico deste ACF segue. O gráfico que acabamos de mostrar é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra costuma oferecer um padrão tão claro. Usando R, simulamos n valores de 100 amostras usando o modelo xt 10 w t .7 w t-1 onde wt iid N (0,1). Para esta simulação, segue-se um gráfico de série temporal dos dados da amostra. Nós não podemos dizer muito desta trama. A amostra ACF para os dados simulados é a seguinte. Vemos um pico no atraso 1 seguido por valores geralmente não significativos para atrasos 1. Observe que o ACF da amostra não corresponde ao padrão teórico do MA subjacente (1), que é que todas as autocorrelações para atrasos anteriores 1 serão 0 Uma amostra diferente teria uma amostra ACF ligeiramente diferente mostrada abaixo, mas provavelmente teria as mesmas características gerais. Propriedades Teóricas de uma Série Temporal com um Modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Observe que os únicos valores não nulos no ACF teórico são para os lags 1 e 2. As autocorrelações para lags maiores são 0 Assim, uma amostra ACF com autocorrelações significativas nos lags 1 e 2, mas autocorrelações não significativas para lags maiores indica um possível modelo MA (2). iid N (0,1). Os coeficientes são 1 0,5 e 2 0,3. Como este é um MA (2), o ACF teórico terá valores diferentes de zero apenas nos lags 1 e 2. Os valores das duas autocorrelações diferentes de zero são Uma plotagem do ACF teórico a seguir. Como quase sempre é o caso, dados de amostra não se comportarão tão perfeitamente quanto a teoria. Simulamos n valores de 150 amostras para o modelo x t 10 w t 0,5 w t-1 .3 w t-2. Onde está N (0,1). O gráfico da série temporal dos dados segue. Como no gráfico de séries temporais para os dados de amostra MA (1), você não pode dizer muito sobre isso. A amostra ACF para os dados simulados é a seguinte. O padrão é típico para situações em que um modelo MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos lags 1 e 2, seguidos por valores não significativos para outros lags. Note que, devido ao erro de amostragem, a amostra ACF não corresponde exatamente ao padrão teórico. ACF para Modelos Gerais MA (q) Uma propriedade dos modelos MA (q) em geral é que existem autocorrelações diferentes de zero para as primeiras defasagens e autocorrelações 0 para todos os atrasos gt q. Não unicidade de conexão entre valores de 1 e (rho1) no modelo MA (1). No modelo MA (1), para qualquer valor de 1. o recíproco 1/1 fornece o mesmo valor para Como exemplo, use 0,5 para 1. e depois use 1 / (0.5) 2 para 1. Você receberá (rho1) 0,4 em ambos os casos. Para satisfazer uma restrição teórica chamada invertibilidade. restringimos os modelos MA (1) a ter valores com valor absoluto menor que 1. No exemplo dado, 1 0.5 será um valor de parâmetro permitido, enquanto 1 1 / 0.5 2 não. Invertibilidade dos modelos MA Um modelo MA é dito ser invertível se for algebricamente equivalente a um modelo AR de ordem infinita convergente. Convergindo, queremos dizer que os coeficientes de AR diminuem para 0 quando voltamos no tempo. A invertibilidade é uma restrição programada no software de séries temporais usado para estimar os coeficientes de modelos com termos de MA. Não é algo que nós verificamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para os modelos MA (1) são fornecidas no apêndice. Nota Teoria Avançada. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo invertível. A condição necessária para a invertibilidade é que os coeficientes tenham valores tais que a equação 1- 1 y-. - q y q 0 tem soluções para y que estão fora do círculo unitário. Código R para os Exemplos No Exemplo 1, plotamos o ACF teórico do modelo x t 10 w t. 7w t-1. e então simulou n 150 valores deste modelo e plotou a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 defasagens de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável denominada lags que varia de 0 a 10. plotagem (defasagens, acfma1, xlimc (1,10), ylabr, tipoh, ACF principal para MA (1) com teta1 0,7) abline (h0) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto chamado acfma1 (nossa escolha de nome). O comando de plotagem (o terceiro comando) traça atrasos em relação aos valores de ACF para os lags de 1 a 10. O parâmetro ylab marca o eixo yeo parâmetro principal coloca um título na plotagem. Para ver os valores numéricos do ACF, simplesmente use o comando acfma1. A simulação e os gráficos foram feitos com os seguintes comandos. xcarima. sim (n150, list (mac (0.7))) Simula n 150 valores de MA (1) xxc10 adiciona 10 para fazer a média 10. A simulação assume como padrão 0. plotagem (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), ACF principal para dados de amostras simuladas) No Exemplo 2, plotamos o ACF teórico do modelo xt 10 wt.5 wt-1 .3 w t-2. e então simulou n 150 valores deste modelo e plotou a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados foram: acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (defasagens, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) com teta1 0,5, teta20.3) abline (h0) xcarima. sim (n150, lista (mac (0.5, 0.3))) xxc10 plot (x, typeb, principal Sim Simulado (2) Séries) acf (x, xlimc (1,10), mainACF para Dados MA (2) simulados Apêndice: Prova de Propriedades do MA (1) Para estudantes interessados, aqui estão as provas de propriedades teóricas do modelo MA (1). Variação: (texto (xt) texto (mu wt theta1 w) 0 texto (wt) texto (teta1w) sigma2w teta21sigma2w (1theta21) sigma2w) Quando h1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 A razão é que, por definição de independência do peso. E (wk w j) 0 para qualquer k j. Além disso, porque o w tem média 0, E (w j w j) E (w j 2) w 2. Para uma série temporal, aplique esse resultado para obter o ACF fornecido acima. Um modelo MA invertível é aquele que pode ser escrito como um modelo AR de ordem infinita que converge para que os coeficientes AR converjam para 0 à medida que nos movemos infinitamente de volta no tempo. Bem demonstre invertibilidade para o modelo MA (1). Substituímos então a relação (2) para wt-1 na equação (1) (3) (zt wt theta1 (z-teta1w) wt teta1z-teta2w) No tempo t-2. a equação (2) se torna Nós então substituímos a relação (4) para w t-2 na equação (3) (zt wt theta1 z-teta1w wt teta1z-teta21 (z-teta1w) wt teta1z-teta12z teta31w) Se continuarmos ( infinitamente), obteríamos o modelo AR de ordem infinita (zt wt theta1z - theta21z theta31z - theta41z dots) Note, no entanto, que se 1 1, os coeficientes multiplicando os lags de z aumentarão (infinitamente) em tamanho à medida que voltarmos Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo MA invertível (1). Na semana 3, veremos que um modelo AR (1) pode ser convertido em um modelo MA de ordem infinita: (xt - mu wt phi1w phi21w pontos phik1 w pontos soma phij1w) Este somatório dos termos de ruído branco passado é conhecido como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos voltando no tempo. Isso é chamado de ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Lembre-se na semana 1, notamos que um requisito para um AR estacionário (1) é aquele 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Esta última etapa usa um fato básico sobre séries geométricas que requer (phi1lt1), caso contrário a série diverge. NavigationPurpose: Verifique os gráficos de Autocorrelação de Aleatoriedade (Box e Jenkins, pp. 28-32) são uma ferramenta comumente usada para verificar a aleatoriedade em um conjunto de dados. Essa aleatoriedade é verificada pelo cálculo das autocorrelações para valores de dados em intervalos de tempo variáveis. Se aleatório, essas autocorrelações devem ser próximas de zero para todas e quaisquer separações de defasagem de tempo. Se não aleatório, então uma ou mais das autocorrelações serão significativamente diferentes de zero. Além disso, os gráficos de autocorrelação são usados no estágio de identificação do modelo para modelos de séries temporais móveis autorregressivos Box-Jenkins. Autocorrelação é apenas uma medida de aleatoriedade. Nota que não correlacionada não significa necessariamente aleatório. Dados com autocorrelação significativa não são aleatórios. No entanto, os dados que não mostram autocorrelação significativa ainda podem exibir não-aleatoriedade de outras maneiras. Autocorrelação é apenas uma medida de aleatoriedade. No contexto da validação do modelo (que é o principal tipo de aleatoriedade que discutimos no Manual), a verificação da autocorrelação é tipicamente um teste suficiente de aleatoriedade, pois os resíduos de modelos de ajuste inadequados tendem a exibir aleatoriedade não sutil. No entanto, alguns aplicativos exigem uma determinação mais rigorosa de aleatoriedade. Nesses casos, uma bateria de testes, que pode incluir a verificação de autocorrelação, é aplicada, pois os dados podem ser não aleatórios de muitas maneiras diferentes e muitas vezes sutis. Um exemplo de onde é necessária uma verificação mais rigorosa da aleatoriedade seria testar geradores de números aleatórios. Amostra de plotagem: as autocorrelações devem ser quase zero para aleatoriedade. Tal não é o caso neste exemplo e, portanto, a suposição de aleatoriedade falha. Este gráfico de autocorrelação de amostra mostra que a série temporal não é aleatória, mas tem um alto grau de autocorrelação entre observações adjacentes e quase adjacentes. Definição: r (h) versus h Os gráficos de autocorrelação são formados por eixo vertical: coeficiente de autocorrelação onde C h é a função de autocovariância e C 0 é a função de variância. Note que R h está entre -1 e 1. Note que algumas fontes podem usar o A seguinte fórmula para a função de autocovariância Embora essa definição tenha menos viés, a formulação (1 / N) tem algumas propriedades estatísticas desejáveis e é a forma mais comumente usada na literatura de estatística. Veja as páginas 20 e 49-50 em Chatfield para detalhes. Eixo horizontal: atraso de tempo h (h 1, 2, 3.) A linha acima também contém várias linhas de referência horizontais. A linha do meio está no zero. As outras quatro linhas são 95 e 99 bandas de confiança. Observe que existem duas fórmulas distintas para gerar as faixas de confiança. Se o gráfico de autocorrelação estiver sendo usado para testar a aleatoriedade (ou seja, não há dependência de tempo nos dados), a seguinte fórmula é recomendada: onde N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e ) é o nível de significância. Neste caso, as bandas de confiança têm largura fixa que depende do tamanho da amostra. Esta é a fórmula que foi usada para gerar as bandas de confiança na plotagem acima. Os gráficos de autocorrelação também são usados no estágio de identificação do modelo para a montagem de modelos ARIMA. Neste caso, um modelo de média móvel é assumido para os dados e as seguintes faixas de confiança devem ser geradas: onde k é o atraso, N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa) é o nível de significância. Nesse caso, as faixas de confiança aumentam à medida que a defasagem aumenta. O gráfico de autocorrelação pode fornecer respostas para as seguintes questões: Os dados são aleatórios É uma observação relacionada a uma observação adjacente É uma observação relacionada a uma observação duas vezes removida (etc.) É a série temporal observada ruído branco É a série temporal observada sinusoidal É a série temporal observada autoregressivo Qual é o modelo apropriado para a série temporal observada O modelo é válido e suficiente É a fórmula ss / sqrt válida Importância: Garantir validade das conclusões de engenharia Aleatoriedade (junto com modelo fixo, variação fixa e distribuição fixa) é uma das quatro premissas que normalmente fundamentam todos os processos de medição. A suposição de aleatoriedade é extremamente importante pelas três razões a seguir: A maioria dos testes estatísticos padrão depende da aleatoriedade. A validade das conclusões do teste está diretamente ligada à validade da suposição de aleatoriedade. Muitas fórmulas estatísticas comumente usadas dependem da suposição de aleatoriedade, sendo a fórmula mais comum a fórmula para determinar o desvio padrão da média da amostra: onde s é o desvio padrão dos dados. Embora muito usados, os resultados do uso dessa fórmula não têm valor, a menos que a suposição de aleatoriedade seja válida. Para dados univariados, o modelo padrão é Se os dados não forem aleatórios, esse modelo é incorreto e inválido, e as estimativas para os parâmetros (como a constante) tornam-se sem sentido e inválidas. Em resumo, se o analista não verificar a aleatoriedade, a validade de muitas das conclusões estatísticas torna-se suspeita. O gráfico de autocorrelação é uma excelente maneira de verificar essa aleatoriedade.
No comments:
Post a Comment