Thursday 20 July 2017

D3 Média Móvel


Eu sou novo no D3 e estou tentando fazer uma média móvel dos valores anteriores e futuros nos meus dados, de modo a suavizar. Atualmente, eu tenho trabalhando usando os 2 valores anteriores do valor atual. Funciona, mas 1) como eu também usaria os próximos valores e 2) e se eu quisesse usar os 15 valores anteriores e 15 próximos (seria louco ter 30 vars individuais para armazená-los todos) Eu costumava fazer Javascript tradicional, mas perdeu a forma de percorrer os dados dessa maneira no D3. Espero que alguém possa me iluminar, obrigado. Ou apenas o código de análise de dados aqui: Um componente Bollinger Bands para gráficos D3 No meu último artigo (componentes de anotação on-line para gráficos D3), criei um componente que calculou e exibiu uma média móvel. Como prometido, estou agora voltando minha atenção para Bollinger Bands. O componente que vou criar vai se parecer com isto: como antes, vou trapacear, levando o gráfico Toms desenvolvido em seu artigo sobre os componentes OHLC e candlestick. E estou criando o componente seguindo a convenção de Mike Bostocks. O que são as Bandas de Bollinger? Você já quis saber. Em poucas palavras, Bandas Bollinger são usadas em gráficos financeiros para indicar a volatilidade dos preços. Como você pode ver no gráfico acima, eles consistem em três componentes: as bandas superior e inferior são alguns desvios padrão longe da média móvel - e note que aqui estavam falando sobre um desvio padrão móvel. A partir desta definição, podemos ver que precisamos de dois parâmetros para nossos cálculos - o período médio móvel. Para o qual um valor de 20 é normalmente usado, e o número de desvios padrão. Que é normalmente 2. Bollinger Bands Component Heres o código completo para o componente Bollinger Bands - vou passar por isso abaixo e explicar o que está acontecendo. Essa é uma quantidade razoável de código, então vamos começar no topo olhando as propriedades que eu defini neste componente - você verá que eu as quebrei em seções, então não temos um bloco monolítico de declarações na parte superior do arquivo. Primeiro, temos as escalas X e Y, que o componente precisa quando está trabalhando para desenhar coisas. Em seguida, temos os campos que precisamos para realizar nossos cálculos - o campo a ser usado no modelo de dados, o período médio móvel e o número de desvios padrão a serem usados. Observe que estavam inadimplentes o período médio móvel para 20 e o número de desvios padrão para 2, os valores típicos para esses campos. Finalmente, temos uma série de propriedades que definem classes CSS para as várias partes do componente. Isso proporciona ao usuário uma grande quantidade de customisability quando se trata de styling, mas nós ajustamos valores padrão para que o usuário não precise especificar essas propriedades. Na função componente, criamos uma área de d3.svg para representar a área entre as bandas superior e inferior e três objetos de d3.svg. line para representar a linha superior, banda baixa e linha média móvel, definindo seus valores X adequadamente. Estou usando o elemento da área porque essa é uma maneira muito agradável e integrada de mostrar a área entre duas linhas. A melhor parte é, é realmente simples de usar - onde um elemento de linha exige que você estabeleça seu valor Y, um elemento de área tem dois valores de Y - e estou muito a favor de tornar a vida fácil para mim. Na próxima seção, definimos duas funções para calcular a média móvel e o desvio padrão móvel. Observe que as Bandas Bollinger usam a versão populacional da fórmula de desvio padrão. Dentro da seleção, cada bloco é onde fazemos o nosso levantamento pesado - configurando os valores de Y de nossos vários elementos SVG. Declaramos uma variável vazia, bollingerData. Então nós o preenchemos com dados - é um mapa de data para média (média móvel) e sd (desvio padrão) para cada item de dados. Nós fazemos isso uma vez, o que é maciçamente mais eficiente do que seria se fizéssemos todos esses cálculos por via aérea. Por outro lado, isso significa que estavam fazendo esses cálculos sempre que o componente fosse redesenhado se quisermos ser maximamente eficiente. Informações, mas isso também exigiria que verificássemos que os dados não tivessem mudado todas as vezes que precisássemos redesenhar, o que traz seus próprios problemas. O restante da seleção. Todo o bloco é longo, mas bastante simples - foram apenas a configuração dos valores de Y para a nossa área e os elementos de linha com base nos dados no mapa de BollingerData. Finalmente, adicionamos a áreaBands. LineUpper. LineLower e lineAverage SVG elementos para o caminho. Note-se que não definimos a totalidade da matriz de dados nesses elementos - Bollinger Bands geralmente não é exibido quando não há dados suficientes para calcular a média móvel completa, então começamos no índice movingAverage. Que tem o efeito desejado. Não mostrei os vários acessadores de recursos, porque eles não são especialmente interessantes, pois eles são praticamente todos iguais: adicionando o componente ao gráfico OK, esse é um pouco complicado, então, agora, use este novo componente Bollinger Bands. Primeiro, criamos e configuramos o nosso componente: Aqui estava apenas informando o componente sobre as escalas X e Y e dizendo para usar a propriedade fechada no modelo de dados. As propriedades movingAverage e standardDeviations são opcionais (especialmente porque foram apenas configurá-las para seus valores padrão aqui, mas você precisa incluí-las se você quiser algo não padrão). Poderíamos também definir qualquer uma das quatro propriedades CSS que o componente expõe, mas eu escolhi para omiti-las aqui e simplesmente deixá-las com seus valores padrão. Com isso feito, adicionamos o componente ao gráfico: Dica Pro: Im colocando este código apenas na frente do código para exibir os dados do gráfico em si, de modo que as Bandas Bollinger serão em segundo plano e os dados do gráfico estarão no primeiro plano. Obviamente, o último passo é o estilo das várias seções do componente. Eu escolhi exibir as Bandas Bollinger em cinza, então estou usando um cinza claro para a área entre as faixas superior e inferior e um cinza mais escuro para as próprias bandas (você poderia usar a transparência para tornar a área mais clara). Como um lado, observe que eu configurei a largura do traçado: 0 na área para que não mostre nenhuma borda. Eu fiz isso por dois motivos. Em primeiro lugar, estavam desenhando as bordas superior e inferior de qualquer maneira e, em segundo lugar, não queremos que uma margem esquerda ou direita seja mostrada - tente remover esta linha e você verá o que quero dizer. Juntando tudo, esse é o resultado: aprimoramentos Estou muito feliz com este componente - funciona muito bem e é razoavelmente eficiente, programaticamente. Ainda há algumas melhorias que podemos fazer. Se você ler a entrada da Wikipedia nas Bandas de Bollinger, verá que estava usando um cálculo de média móvel simples, mas que outros tipos de cálculo são às vezes usados, podemos ampliar nosso componente para permitir que o usuário escolha fornecendo uma propriedade adicional, como. movingAverageType ( Exponencial). Conclusão Neste artigo, levei o componente de média móvel que desenvolvi no meu artigo anterior e usei-o como base para um componente Bollinger Bands. O novo componente é muito fácil de configurar e modelar. Na prática, a média móvel proporcionará uma boa estimativa da média das séries temporais se a média for constante ou se mudar lentamente. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo significará os efeitos da variabilidade. O objetivo de fornecer um m mais pequeno é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra as séries temporais usadas para ilustração juntamente com a demanda média da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ela aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Depois, ela se torna constante novamente. Os dados são simulados adicionando à média, um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o inteiro mais próximo. A tabela mostra as observações simuladas utilizadas para o exemplo. Quando usamos a tabela, devemos lembrar que, em qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas em conjunto com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas médias móveis para a direita por períodos. Uma conclusão é imediatamente aparente da figura. Para as três estimativas, a média móvel está atrasada por trás da tendência linear, com o atraso crescente com m. O atraso é a distância entre o modelo ea estimativa na dimensão temporal. Devido ao atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um momento específico no valor médio do modelo e o valor médio previsto pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série cada vez maior com tendência a. Os valores de lag e de polarização do estimador da média são dados nas equações abaixo. As curvas de exemplo não combinam essas equações porque o modelo de exemplo não está aumentando continuamente, antes ele começa como uma constante, muda para uma tendência e depois se torna constante novamente. Além disso, as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada pela mudança das curvas para a direita. O atraso e o desvio aumentam proporcionalmente. As equações abaixo indicam o atraso e a polarização de um período de previsão para o futuro em relação aos parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel baseia-se no pressuposto de uma média constante, e o exemplo tem uma tendência linear na média durante uma parcela do período de estudo. Como as séries em tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para esses resultados. Também podemos concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menores. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média. O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero e a variância do erro é composta por um termo que é uma função e um segundo termo que é a variância do ruído. O primeiro termo é a variância da média estimada com uma amostra de m observações, assumindo que os dados provêm de uma população com uma média constante. Este termo é minimizado fazendo o m o mais grande possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar as previsões sensíveis às mudanças, queremos m o mais pequeno possível (1), mas isso aumenta a variação do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de previsão implementa as fórmulas da média móvel. O exemplo abaixo mostra a análise fornecida pelo suplemento para os dados da amostra na coluna B. As primeiras 10 observações são indexadas -9 a 0. Comparadas com a tabela acima, os índices do período são deslocados em -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usadas para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro médio móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto feito a partir da média móvel no tempo 0 é 11,1. O erro então é -5.1. O desvio padrão e o Desvio Médico Médio (MAD) são calculados nas células E6 e E7, respectivamente. Análise prévia com o Microsoft Excel: trabalhando com séries temporais sazonais neste capítulo Médias móveis sazonais Médias móveis e médias movidas centralizadas Regressão linear com vetores codificados Exponente sazonal simples Smoothing Holt-Winters Models Matters torna-se cada vez mais complicado quando você tem uma série de tempo que caracterizou em parte pela sazonalidade: a tendência de seu nível subir e cair de acordo com a passagem das estações. Usamos o termo estação em um sentido mais geral do que o seu significado cotidiano do ano8217s quatro estações. No contexto da análise preditiva, uma temporada pode ser um dia se os padrões repetirem semanalmente, ou um ano em termos de eleições presidenciais, ou praticamente qualquer coisa intermediária. Um turno de oito horas num hospital pode representar uma estação. Este capítulo dá uma olhada em como decompor uma série de tempo para que você possa ver como sua sazonalidade opera além da sua tendência (se houver). Como você pode esperar do material nos Capítulos 3 e 4, várias abordagens estão disponíveis para você. Médias Sazonais Simples O uso de médias sazonais simples para modelar uma série temporal pode às vezes fornecer um modelo bastante bruto para os dados. Mas a abordagem presta atenção às estações no conjunto de dados e pode ser facilmente mais precisa como técnica de previsão do que o alisamento exponencial simples quando a sazonalidade é pronunciada. Certamente serve como uma introdução útil a alguns dos procedimentos usados ​​com séries temporais que são sazonais e tendenciais, então veja o exemplo na Figura 5.1. Figura 5.1 Com um modelo horizontal, as médias simples resultam em previsões que não são mais do que sazonais. Os dados e o gráfico apresentados na Figura 5.1 representam o número médio de visitas diárias a um site que atende a fãs da Liga Nacional de Futebol. Cada observação na coluna D representa o número médio de visitas por dia em cada um dos quatro trimestres em um período de cinco anos. Identificando um padrão sazonal Você pode dizer das médias do intervalo G2: G5 que ocorre um efeito trimestral distinto. O maior número médio de visitas ocorre durante o outono eo inverno, quando os principais 16 jogos e os playoffs estão agendados. O interesse, medido pelos sucessos diários médios, diminui durante os meses de primavera e verão. As médias são fáceis de calcular se você se sente à vontade com fórmulas de matrizes. Para obter a média de todas as cinco instâncias do quarto 1, por exemplo, você pode usar essa fórmula de matriz na célula G2 da Figura 5.1: Array: insira-a com CtrlShiftEnter. Ou você pode usar a função AVERAGEIF (), que você pode inserir da maneira normal, pressionando a tecla Enter. Em geral, eu prefiro a abordagem da fórmula da matriz porque me dá margem para maior controle sobre as funções e os critérios envolvidos. A série de dados gráficos inclui rótulos de dados mostrando a qual trimestre cada ponto de dados pertence. O gráfico ecoa a mensagem das médias em G2: G5: Quarters 1 e 4 repetidamente obtêm mais hits. A estacionalidade clara nesse intervalo de dados. Cálculo de índices sazonais Após you8217ve decidiu que uma série temporal tem um componente sazonal, você gosta de quantificar o tamanho do efeito. As médias apresentadas na Figura 5.2 representam como o método das médias simples é sobre essa tarefa. Figura 5.2 Combina a média grande com as médias sazonais para obter os índices sazonais. Na Figura 5.2. Você obtém índices sazonais aditivos na faixa G10: G13, subtraindo a média principal na célula G7 de cada média sazonal em G2: G5. O resultado é o 8220effect8221 de estar no quarto 1, o de estar no quarto 2, e assim por diante. Se um determinado mês estiver no quarto 1, você espera que ele tenha 99,65 hits diários médios mais do que a grande média de 140,35 hits por dia. Esta informação dá uma sensação de quão importante é ser numa determinada estação. Suponha que você possua o site em questão e que deseja vender espaço publicitário nisso. Você pode certamente pedir um preço mais alto dos anunciantes durante o primeiro e quarto trimestres do que no segundo e terceiro. Mais ao ponto, você provavelmente pode cobrar duas vezes mais durante o primeiro trimestre que durante o segundo ou o terceiro. Com os índices sazonais em mãos, você também está em posição de calcular os ajustes sazonais. Por exemplo, ainda na Figura 5.2. Os valores sazonalmente ajustados para cada trimestre em 2005 aparecem em G16: G19. Eles foram calculados, subtraindo o índice da medida trimestral associada. Tradicionalmente, o termo índice sazonal refere-se ao aumento ou diminuição do nível de uma série que 8217s associada a cada estação. O efeito temporário do termo sinônimo apareceu na literatura nos últimos anos. Como você pode ver ambos os termos, I8217ve os usou ambos neste livro. É um assunto pequeno, tenha em mente que os dois termos têm o mesmo significado. Observe que, no curso normal dos eventos de 2001 a 2005, você espera que os resultados do segundo trimestre de 8217 sejam atrasados ​​nos resultados do primeiro trimestre de 8217 em 133,6 (ou seja, 99,65 menos 821133,95). Mas, tanto em 2004 como em 2005, os resultados desestacionalizados para o segundo trimestre são superiores aos do primeiro trimestre. Esse resultado pode levá-lo a perguntar o que mudou nos últimos dois anos que inverte a relação entre os resultados sazonalmente ajustados para os dois primeiros trimestres. (Eu não aceito essa questão aqui. Eu sugiro isso para sugerir que você muitas vezes quer dar uma olhada nos números observados e os ajustados sazonalmente.) Previsão de médias sazonais simples: sem tendência Embora o método das médias simples seja8212, como eu disse Before8212crude, pode ser muito mais preciso do que a alternativa mais sofisticada de suavização exponencial, particularmente quando os efeitos sazonais são pronunciados e confiáveis. Quando as séries temporais não estão dispostas, como é o caso com o exemplo que esta seção discutiu, as previsões sazonais simples são nada mais do que as médias sazonais. Quando a série não está tendendo para cima ou para baixo, sua melhor estimativa do valor para a próxima temporada é a média histórica da estação8217s. Veja a Figura 5.3. Figura 5.3 Combina a média grande com as médias sazonais para obter os índices sazonais. No gráfico da Figura 5.3. A linha tracejada representa as previsões a partir de suavização simples. As duas linhas sólidas representam as observações sazonais reais e as médias sazonais. Observe que as médias sazonais rastreiam as observações sazonais reais bastante mais do que as previsões suavizadas. Você pode ver quanto mais perto dos dois RMSEs nas células F23 e H23. O RMSE para as médias sazonais é apenas um pouco mais de um terço do RMSE para as previsões suavizadas. Você pode calcular o tamanho dos efeitos sazonais, bem como a sua consistência: Suponha, por exemplo, que a diferença entre o primeiro e o segundo trimestre médio foi de 35,0 em vez de 133,6 (que é a diferença entre as células G2 e G3 na Figura 5.2). Então, em um contexto de suavização, o valor real para o Quarto 1 seria um preditor muito melhor do valor para o Quarto 2 do que é o caso desta série de tempo. E o alisamento exponencial pode depender fortemente do valor da observação atual para a previsão do próximo período. Se a constante de suavização for definida em 1.0, o alisamento exponencial resolve a previsão na239ve e a previsão sempre é igual à real anterior. O fato de que o tamanho de cada balanço sazonal é tão consistente de um quarto para o outro significa que as médias sazonais simples são previsões confiáveis: nenhuma observação trimestral real se afasta muito da média sazonal geral. Médias estacionais simples com tendência O uso de médias sazonais simples com uma série de tendências tem algumas desvantagens reais, e I8217m tentado a sugerir que a ignoremos e seguimos em tópicos mais legais. Mas é possível que you8217ll encontre situações em que alguém usou esse método e, em seguida, ganhou pena de conhecer o que funciona e por que há melhores escolhas. Qualquer método de lidar com a sazonalidade em uma série tendencial deve lidar com o problema fundamental de desenredar o efeito da tendência da sazonalidade. A sazonalidade tende a obscurecer a tendência, e vice-versa. Veja a Figura 5.4. Figura 5.4 A presença de tendência complica o cálculo dos efeitos sazonais. O fato de que a tendência da série é ascendente ao longo do tempo significa que simplesmente a média das observações de cada temporada8217s, como foi feito no caso sem tendência, confunde a tendência geral com a variação sazonal. A idéia usual é explicar a tendência separadamente dos efeitos sazonais. Você poderia quantificar a tendência e subtrair seu efeito aos dados observados. O resultado é uma série sem transição que retém a variação sazonal. Pode ser manuseado da mesma forma que eu mostrei anteriormente neste capítulo. Cálculo da média para cada ano Uma maneira de detrender os dados (e outras maneiras serão sem dúvida para você) é calcular a tendência com base em médias anuais em vez de dados trimestrais. A idéia é que a média anual é insensível aos efeitos sazonais. Ou seja, se você subtrair um ano8217s significa do valor para cada um dos seus trimestres, a soma (e, portanto, a média) dos quatro efeitos trimestrais é precisamente zero. Portanto, uma tendência calculada usando as médias anuais não é afetada pelas variações sazonais. Este cálculo aparece na Figura 5.5. Figura 5.5 Este método agora impõe uma regressão linear nas médias simples. O primeiro passo para diminuir os dados é obter os resultados diários médios para cada ano. That8217s feito na faixa H3: H7 na Figura 5.5. A fórmula na célula H3, por exemplo, é MÉDIA (D3: D6). Calculando a tendência com base em médias anuais Com as médias anuais na mão, você está em posição de calcular sua tendência. That8217s gerenciado usando LINEST () no intervalo I3: J7, usando esta fórmula de matriz: Se você don8217t fornecer x-values ​​como o segundo argumento para PROJ. LIN (). O Excel fornece valores x padrão para você. Os padrões são simplesmente os inteiros consecutivos começando com 1 e terminando com o número de valores y que você invoca no primeiro argumento. Neste exemplo, os valores x padrão são idênticos aos especificados na planilha no G3: G7, para que você possa usar o LINEST (H3: H7. TRUE). Esta fórmula usa dois padrões, para os valores x e a constante, representados pelas três vírgulas consecutivas. O objetivo deste exercício é quantificar a tendência ano-a-ano, e LINEST () faz isso para você na célula I3. Essa célula contém o coeficiente de regressão para os valores de x. Multiplique 106.08 por 1, então por 2, em seguida por 3, 4 e 5 e adicione a cada resultado a interceptação de 84.63. Embora isso tenha previsões anuais, o ponto importante para este procedimento é o valor do coeficiente 106.08, que quantifica a tendência anual. O passo que acabei de discutir é a fonte de minhas dúvidas sobre toda a abordagem que esta seção descreve. Você normalmente tem um pequeno número de períodos abrangentes8212 neste exemplo, que 8217s anos8212 para percorrer a regressão. Regression8217s resultados tendem a ser terrivelmente instável quando, como aqui, eles são baseados em um pequeno número de observações. E, no entanto, este procedimento depende fortemente desses resultados, de modo a desvirar a série temporal. Prorrateando a Tendência Através das Estações O método de médias simples de lidar com uma série sazonal e tendencial, como esta, continua dividindo a tendência pelo número de períodos no período abrangente para obter uma tendência por período. Aqui, o número de períodos por ano é de quatro 8212we8217, trabalhando com dados trimestrais8212, dividimos 106,08 por 4 para estimar a tendência por trimestre a 26,5. O procedimento usa essa tendência periódica, subtraindo-a do resultado periódico médio. O objetivo é remover o efeito da tendência anual dos efeitos sazonais. Primeiro, porém, precisamos calcular o resultado médio em todos os cinco anos para o Período 1, para o Período 2 e assim por diante. Para fazer isso, ajuda a reorganizar a lista de sucessos trimestrais reais, mostrados no intervalo D3: D22 da Figura 5.5. Em uma matriz de cinco anos por quatro trimestres, mostrada na faixa G11: J15. Observe que os valores nessa matriz correspondem à lista na coluna D. Com os dados organizados dessa maneira, é fácil calcular o valor trimestral médio ao longo dos cinco anos no conjunto de dados. That8217s feito na faixa G18: J18. O efeito da tendência retornada pelo LINEST () aparece no intervalo G19: J19. O valor inicial para cada ano é o resultado médio médio observado para o primeiro trimestre, portanto, não fazemos ajustes no primeiro trimestre. Um quarto de 8217 de tendência, ou 26,5, é subtraído dos sucessos médios do segundo trimestre de 8217, resultando em um valor ajustado no segundo trimestre de 329,9 (ver célula H21, Figura 5.5). Dois quartos 8217 de tendência, 2 215 26,5 ou 53 na célula I19, é subtraído do terceiro quarto8217s significa obter um valor ajustado no terceiro trimestre de 282,6 na célula I21. E, da mesma forma, no quarto trimestre, subtraindo três quartos da tendência de 454,4 para obter 374,8 na célula J21. Tenha em mente que se a tendência fosse baixa em vez de alta, como neste exemplo, você adicionaria o valor da tendência periódica aos meios periódicos observados em vez de subtraí-lo. Conversão de Meios Temporários Ajustados em Efeitos Sazonais Por lógica deste método, os valores mostrados nas linhas 20821121 da Figura 5.5 são os resultados trimestrais médios para cada um dos quatro trimestres, com o efeito da tendência geral ascendente no conjunto de dados removido. (As linhas 20 e 21 são mescladas nas colunas G a J.) Com a sua tendência ao longo do caminho, podemos converter essas figuras em estimativas de efeitos sazonais. O resultado de estar no primeiro trimestre, no segundo trimestre, e assim por diante. Para obter esses efeitos, comece por calcular a grande média dos meios trimestrais ajustados. Essa grande média ajustada aparece na célula I23. A análise continua na Figura 5.6. Figura 5.6 Os efeitos trimestrais, ou índices, são usados ​​para dessazonalizar os trimestres observados. A Figura 5.6 repete os ajustes trimestrais e a média grande ajustada da parte inferior da Figura 5.5. Eles são combinados para determinar os índices trimestrais (que você também pode pensar como efeitos sazonais). Por exemplo, a fórmula na célula D8 é a seguinte: retorna 821133.2. O efeito de estar no segundo trimestre, vis-224-vis o grande significado: com respeito à grande média, podemos esperar um resultado que pertence ao segundo trimestre para cair abaixo do grande meio por 33,2 unidades. Aplicando os efeitos sazonais aos trimestres observados Para recapitular: até agora, quantificamos a tendência anual nos dados através da regressão e dividimos essa tendência em 4 para proratizá-la para um valor trimestral. Pegando na Figura 5.6. Ajustamos a média para cada trimestre (em C3: F3) subtraindo as tendências prorrateadas em C4: F4. O resultado é uma estimativa desvalorizada da média para cada trimestre, independentemente do ano em que o trimestre ocorre, em C5: F5. Subtraímos a média geral ajustada, na célula G5, dos meios trimestrais ajustados em C5: F5. Isso converte cada quarto8217s em média para uma medida do efeito de cada trimestre em relação ao grande médio ajustado. Esses são os índices ou efeitos sazonais em C8: F8. Em seguida, removemos os efeitos sazonais dos trimestres observados. Conforme mostrado na Figura 5.6. Você faz isso subtraindo os índices trimestrais em C8: F8 dos valores correspondentes em C12: F16. E a maneira mais fácil de fazer isso é inserir essa fórmula na célula C20: Observe o sinal de dólar único antes dos 8 na referência ao C8. Essa é uma referência mista: parcialmente relativa e parcialmente absoluta. O sinal de dólar ancora a referência à oitava linha, mas a parte da coluna da referência é livre para variar. Portanto, após a última fórmula ser inserida na célula C20, você pode clicar no identificador de seleção do cell8217s (o pequeno quadrado no canto inferior direito de uma célula selecionada) e arraste para a direita na célula F20. Os endereços se ajustam à medida que você arrasta para a direita e termina com os valores, com os efeitos sazonais removidos, para o ano de 2001 em C20: F20. Selecione esse intervalo de quatro células e use o identificador de múltipla seleção8217s, agora em F20, para arrastar para baixo na linha 24. Assim, preenche o restante da matriz. It8217s importante ter em mente aqui que ajustamos os valores trimestrais originais para os efeitos sazonais. Qualquer que seja a tendência existente nos valores originais ainda existe, e, em teorias, pelo menos8212remains lá depois de ter feito ajustes para efeitos sazonais. Removemos uma tendência, sim, mas apenas dos efeitos sazonais. Assim, quando subtravemos os efeitos sazonais (detrados) das observações trimestrais originais, o resultado é as observações originais com a tendência, mas sem os efeitos sazonais. Eu tracei os valores dessazonalizados na Figura 5.6. Compare esse gráfico com o gráfico da Figura 5.4. Observe na Figura 5.6 que, embora os valores dessazonalizados não estejam precisamente em linha reta, grande parte do efeito sazonal foi removida. Regressando os trimestres desesperados aos períodos de tempo O próximo passo é criar previsões a partir dos dados estatisticamente ajustados e tendenciosos na Figura 5.6. Células C20: F24, e neste momento você tem várias alternativas disponíveis. Você poderia usar a abordagem de diferenciação combinada com o alisamento exponencial simples que foi discutido no Capítulo 3, 8220Trabalhando com o Trending Time Series.8221. Você também pode usar a abordagem Holt8217s para suavizar as séries de tendências, discutidas em Capítulo 3 e Capítulo 4, 8220Initializing Forecasts.8221 Ambos Os métodos colocam você em uma posição para criar uma previsão de um passo a frente, ao qual você adicionaria o índice sazonal correspondente. Outra abordagem, que hoje utilizo, coloca os dados atualizados através de outra instância de regressão linear e, em seguida, adiciona o índice sazonal. Veja a Figura 5.7. Figura 5.7 A primeira previsão verdadeira está na linha 25. A Figura 5.7 retorna os meios trimestralmente dessazonalizados da disposição tabular em C20: F24 da Figura 5.6 para o arranjo da lista na faixa C5: C24 da Figura 5.7. Poderíamos usar LINEST () em conjunto com os dados em B5: C24 na Figura 5.7 para calcular a intercepção e o coeficiente de regressão8217s então, poderíamos multiplicar o coeficiente por cada valor na coluna B e adicionar a intercepção a cada produto, para criar As previsões na coluna D. Mas, embora o LINEST () retorne informações úteis além do coeficiente e intercepto, TREND () é uma maneira mais rápida de obter as previsões, e eu uso isso na Figura 5.7. O intervalo D5: D24 contém as previsões resultantes da regressão das figuras trimestralmente dessazonalizadas em C5: C24 nos números do período em B5: B24. A fórmula de matriz usada em D5: D24 é esta: Esse conjunto de resultados reflete o efeito da tendência geral ascendente nas séries temporais. Como os valores de que TREND () está a prever foram desestabilizados, continua a adicionar os efeitos sazonais, também conhecidos como índices sazonais, de volta à previsão de tendências. Adicionando os índices sazonais de volta aos índices sazonais, calculados na Figura 5.6. São fornecidos na Figura 5.7. Primeiro no intervalo C2: F2 e, em seguida, repetidamente no intervalo E5: E8, E9: E12, e assim por diante. As previsões reestruturadas são colocadas em F5: F24, adicionando os efeitos sazonais na coluna E às previsões de tendência na coluna D. Para obter a previsão one-step-ahead na célula F25 da Figura 5.7. O valor de t para o próximo período entra na célula B25. A seguinte fórmula é inserida na célula D25: Instrui o Excel a calcular a equação de regressão que prevê valores no intervalo C5: C24 daqueles em B5: B24 e aplique essa equação ao novo valor x na célula B25. O índice sazonal apropriado é colocado na célula E25 e a soma de D25 e E25 é colocada em F25 como a primeira previsão verdadeira das séries temporais de tendências e sazonais. You8217ll encontrar o conjunto completo de quarterlies dessazonalizados e as previsões traçadas na Figura 5.8. Figura 5.8 Os efeitos sazonais são devolvidos às previsões. Avaliando médias simples A abordagem para lidar com uma série de tempo sazonal, discutida em várias seções anteriores, tem algum recurso intuitivo. A idéia básica parece direta: Calcule uma tendência anual regredindo os meios anuais contra uma medida de períodos de tempo. Divida a tendência anual entre os períodos dentro do ano. Subtrair a tendência repartida dos efeitos periódicos para obter efeitos ajustados. Subtrair os efeitos ajustados das medidas reais para dessazonalizar as séries temporais. Crie previsões da série dessazonalizada e adicione os efeitos sazonais ajustados. Minha visão é que vários problemas enfraquecem a abordagem, e eu não teria incluí-la neste livro, exceto que é provável que você a encontre e, portanto, deve ser familiar com isso. E fornece um trampolim útil para discutir alguns conceitos e procedimentos encontrados em outras abordagens mais fortes. Em primeiro lugar, o problema (sobre o qual eu reclamava anteriormente neste capítulo) quanto ao tamanho de amostra muito pequeno para a regressão de médias anuais em números inteiros consecutivos que se identificam a cada ano. Mesmo com apenas um preditor, apenas dez observações estão realmente raspando o fundo do barril. No mínimo, você deve observar o R ​​2 resultante ajustado para o encolhimento e, provavelmente, recalcular o erro padrão da estimativa em conformidade. É verdade que quanto mais forte for a correlação na população, menor será a amostra com a qual você pode fugir. Mas, trabalhando com trimestres dentro de anos, você tem a sorte de encontrar até 10 anos8217, observações trimestrais consecutivas, cada uma medida do mesmo modo durante esse período de tempo. I8217m não convencido de que a resposta ao padrão problemático de cima e de baixo que você encontra dentro de um ano (veja o gráfico na Figura 5.4) é a média dos picos e vales e obter uma estimativa de tendência dos meios anuais. Certamente, uma resposta para esse problema, mas, como você vê, existe um método muito mais forte de segregar os efeitos sazonais de uma tendência subjacente, respondendo para ambos e previsão em conformidade. I8217ll cobre esse método mais adiante neste capítulo, na seção 8220Linear Regression with Coded Vectors8221. Além disso, nenhum fundamento em teoria para distribuir a tendência anual uniformemente entre os períodos que compõem o ano. It8217s é verdade que a regressão linear faz algo semelhante quando coloca suas previsões em linha reta. Mas um grande abismo entre fazer uma suposição fundamental porque o modelo analítico pode manipular os dados e aceitar um resultado falho cujos defeitos podem ser medidos e avaliados. Dito isto, let8217s avançam para o uso de médias móveis em vez de médias simples como forma de lidar com a sazonalidade.

No comments:

Post a Comment