Monday, November 21, 2016

Forecasting Moving Average Seasonality

Moving Average Forecasting Introdução. Como você pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsão. Mas espero que estas sejam pelo menos uma introdução interessante a algumas das questões de computação relacionadas à implementação de previsões em planilhas. Neste sentido, vamos continuar a partir do início e começar a trabalhar com previsões de média móvel. Previsões médias móveis. Todo mundo está familiarizado com as previsões de média móvel, independentemente de eles acreditam que são. Todos os estudantes universitários fazê-los o tempo todo. Pense nas suas pontuações dos testes num curso em que vai ter quatro testes durante o semestre. Vamos supor que você tem um 85 em seu primeiro teste. O que você poderia prever para sua pontuação do segundo teste O que você acha que seu professor iria prever para a sua próxima pontuação de teste O que você acha que seus amigos podem prever para a sua próxima pontuação de teste O que você acha que seus pais podem prever para sua pontuação próxima teste Independentemente de Todo o blabbing você pôde fazer a seus amigos e pais, eles e seu professor são muito prováveis ​​esperar que você comece algo na área do 85 que você começou apenas. Bem, agora vamos supor que, apesar de sua auto-promoção para seus amigos, você superestimar-se e figura que você pode estudar menos para o segundo teste e assim você começa um 73. Agora o que são todos os interessados ​​e despreocupado vai Antecipar você vai chegar em seu terceiro teste Existem duas abordagens muito provável para que eles desenvolvam uma estimativa, independentemente de se eles vão compartilhar com você. Eles podem dizer a si mesmos: "Esse cara está sempre soprando fumaça sobre suas espertinas. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidários e dizer: "Bem, até agora você tem obtido um 85 e um 73, então talvez você deve figura em obter cerca de um (85 73) / 2 79. Eu não sei, talvez se você fez menos Festejando e werent abanando a doninhas em todo o lugar e se você começou a fazer muito mais estudando você poderia obter uma pontuação mais alta. quot Ambas estas estimativas são realmente as previsões médias móveis. O primeiro é usar apenas sua pontuação mais recente para prever o seu desempenho futuro. Isso é chamado de média móvel usando um período de dados. A segunda também é uma média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente têm tipo de puto você fora e você decidir fazer bem no terceiro teste para suas próprias razões e colocar uma pontuação mais alta na frente de seus quotalliesquot. Você toma o teste e sua pontuação é realmente um 89 Todos, incluindo você, está impressionado. Então agora você tem o teste final do semestre chegando e, como de costume, você sente a necessidade de incitar todo mundo a fazer suas predições sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. Qual você acha que é o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irmã distante chamado Whistle While We Work. Você tem alguns dados de vendas anteriores representados na seção a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que nós realmente não precisamos fazer as previsões para os períodos passados, a fim de desenvolver a nossa previsão mais recente. Isto é definitivamente diferente do modelo de suavização exponencial. Ive incluído o quotpast previsõesquot porque vamos usá-los na próxima página da web para medir a validade de previsão. Agora eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C6 a C11. Observe como agora apenas as duas mais recentes peças de dados históricos são utilizados para cada previsão. Mais uma vez incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são de importância notar. Para uma previsão média móvel de m-período, apenas os m valores de dados mais recentes são usados ​​para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel do período m, ao fazer previsões quotpast, note que a primeira predição ocorre no período m 1. Ambas as questões serão muito significativas quando desenvolvemos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usado de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão ea matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho que você deseja. Função MovingAverage (Histórico, NumberOfPeriods) Como Único Declarar e inicializar variáveis ​​Dim Item Como Variante Dim Counter Como Inteiro Dim Acumulação como Único Dim HistoricalSize As Inteiro Inicializando variáveis ​​Counter 1 Acumulação 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulação / NumberOfPeriods O código será explicado na classe. Você quer posicionar a função na planilha para que o resultado da computação apareça onde ele deve gostar da seguinte. Uma série de tempo é uma seqüência de observações de uma variável aleatória periódica. Exemplos disso são a demanda mensal por um produto, a matrícula anual de calouros em um departamento da universidade e os fluxos diários em um rio. As séries cronológicas são importantes para a pesquisa operacional, porque muitas vezes são os impulsionadores dos modelos de decisão. Um modelo de inventário requer estimativas de demandas futuras, um planejamento de curso e modelo de pessoal para um departamento universitário requer estimativas de entrada de estudantes futuros e um modelo para fornecer avisos para a população em uma bacia hidrográfica requer estimativas de fluxos de rios para o futuro imediato. A análise de séries temporais fornece ferramentas para selecionar um modelo que descreve as séries temporais e usar o modelo para prever eventos futuros. Modelar a série temporal é um problema estatístico porque os dados observados são usados ​​em procedimentos computacionais para estimar os coeficientes de um suposto modelo. Os modelos assumem que as observações variam aleatoriamente sobre um valor médio subjacente que é uma função do tempo. Nessas páginas, restringimos a atenção ao uso de dados históricos de séries temporais para estimar um modelo dependente do tempo. Os métodos são apropriados para a previsão automática e de curto prazo de informações freqüentemente usadas onde as causas subjacentes da variação do tempo não estão mudando marcadamente no tempo. Na prática, as previsões derivadas por esses métodos são posteriormente modificadas por analistas humanos que incorporam informações não disponíveis a partir dos dados históricos. Nosso propósito principal nesta seção é apresentar as equações para os quatro métodos de previsão usados ​​no suplemento Forecasting: média móvel, suavização exponencial, regressão e suavização exponencial dupla. Estes são chamados de métodos de suavização. Métodos não considerados incluem a previsão qualitativa, regressão múltipla, e métodos autorregressivos (ARIMA). Aqueles interessados ​​em uma cobertura mais ampla devem visitar o site Previsões Princípios ou ler um dos vários excelentes livros sobre o tema. Usamos o livro Previsão. Por Makridakis, Wheelwright e McGee, John Wiley amp Sons, 1983. Para usar o pasta de trabalho Exemplos do Excel, você deve ter o suplemento de Previsão instalado. Escolha o comando Relink para estabelecer os links para o suplemento. Esta página descreve os modelos utilizados para previsão simples e a notação utilizada para a análise. Este método de previsão mais simples é a previsão média móvel. O método simplesmente médias das últimas m observações. É útil para séries temporais com uma média em mudança lenta. Este método considera todo o passado na sua previsão, mas pesa a experiência recente mais fortemente do que menos recente. Os cálculos são simples porque apenas a estimativa do período anterior e os dados atuais determinam a nova estimativa. O método é útil para séries temporais com uma média em mudança lenta. O método da média móvel não responde bem a uma série temporal que aumenta ou diminui com o tempo. Aqui nós incluímos um termo de tendência linear no modelo. O método de regressão aproxima o modelo construindo uma equação linear que fornece o ajuste de mínimos quadrados às últimas m observações. Na prática, a média móvel fornecerá uma boa estimativa da média das séries temporais se a média for constante ou mudar lentamente. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo medirá os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra a série de tempo usada para ilustração juntamente com a demanda média a partir da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ele aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então ele se torna constante novamente. Os dados são simulados adicionando à média um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o número inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que a qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas juntamente com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas da média móvel para a direita por períodos. Uma conclusão é imediatamente aparente a partir da figura. Para as três estimativas, a média móvel está aquém da tendência linear, com o atraso aumentando com m. O atraso é a distância entre o modelo ea estimativa na dimensão temporal. Devido ao atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um tempo específico no valor médio do modelo eo valor médio predito pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e viés do estimador da média são dados nas equações abaixo. As curvas de exemplo não correspondem a essas equações porque o modelo de exemplo não está aumentando continuamente, em vez disso, ele começa como uma constante, muda para uma tendência e, em seguida, torna-se constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada deslocando as curvas para a direita. O atraso e o viés aumentam proporcionalmente. As equações abaixo indicam o atraso e o viés de um período de previsão para o futuro quando comparado aos parâmetros do modelo. Novamente, estas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel baseia-se no pressuposto de uma média constante, eo exemplo tem uma tendência linear na média durante uma parte do período do estudo. Como as séries de tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para tais resultados. Podemos também concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menor. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero ea variância do erro é composta por um termo que é uma função de e um segundo termo que é a variância do ruído. O primeiro termo é a variância da média estimada com uma amostra de m observações, assumindo que os dados provêm de uma população com média constante. Este termo é minimizado fazendo-se o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar a previsão responsiva às mudanças, queremos que m seja o menor possível (1), mas isso aumenta a variância do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de Previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo add-in para os dados da amostra na coluna B. As primeiras 10 observações são indexadas -9 a 0. Em comparação com a tabela acima, os índices de período são deslocados por -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usados ​​para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro de média móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto a partir da média móvel no tempo 0 é 11.1. O erro é então -5.1. O desvio padrão eo desvio médio médio (MAD) são calculados nas células E6 e E7 respectivamente. Definição da sazonalidade - Software de otimização de inventário Definição de sazonalidade Home raquo Knowledgebase raquo Aqui Por Joanns Vermorel, última revisão setembro 2011 Em estatísticas, a demanda - ou as vendas - de um determinado produto é dito exibir sazonalidade quando a série temporal subjacente sofre uma variação cíclica previsível dependendo do tempo dentro do ano. A sazonalidade é um dos padrões estatísticos mais utilizados para melhorar a precisão das previsões de demanda. Exemplo: a maioria dos varejistas ocidentais tem pico de vendas na época do Natal. Ilustração da série temporal O gráfico abaixo ilustra 4 séries temporais sazonais (clique para ampliar). As séries temporais são agregadas ao nível semanal ao longo de um período de 159 semanas (cerca de 3 anos). Os dados representam remessas semanais para 4 produtos distintos do armazém de um grande retalhista europeu. O primeiro dia do ano (1º de janeiro) é marcado com um marcador vertical cinza. Os dados históricos aparecem em vermelho enquanto a previsão de Lokad é exibida em roxo. A sazonalidade pode ser observada visualmente como uma similaridade dos padrões de um ano para o próximo usar os marcadores cinza como referências. Modelo básico para a decomposição sazonal Seja Y (t) a demanda no tempo t. Descomposemos a demanda Y (t) em duas componentes: S (t) uma função estritamente cíclica e Z (t) o complemento não sazonal. Isto dá: Y (t) S (t) Z (t) onde S (t 1 ano) S (t) Se tal função S (t) pode ser estimada, então o processo de previsão tipicamente vai em três fases: Série de tempo dessazonalizada como Z (t) Y (t) / S (t). Produzir a previsão sobre a série temporal Z (t). Possivelmente através da média móvel. Re-aplicar os índices de sazonalidade para a previsão mais tarde. Voltando ao problema inicial de estimar os índices sazonais S (t). Supondo que não há tendência (entre outros), S (t) pode ser estimado com: S (t) MÉDIA (Y-t-1) / MA (t-1) Y (t-2) ) Y (t-1) é o atalho para Y (t - 1 ano) e MA (t) a média móvel de 1 ano de Y (t) . A abordagem proposta nesta seção é ingênua. Mas pode ser facilmente implementado no Excel. Muitos modelos estatísticos podem ser encontrados na literatura para abordar a sazonalidade com métodos mais complicados. Ex: Box-Jenkins, ARMA, ARIMA, Holt-Winters. Desafios na estimativa de índices de sazonalidade O modelo de sazonalidade ilustrado acima é uma abordagem bastante ingênua que trabalha para longas séries temporais sazonais. No entanto, há várias dificuldades práticas na estimativa da sazonalidade: as séries temporais são curtas. A vida útil da maioria dos bens de consumo não excede 3 ou 4 anos. Como resultado, para um determinado produto, o histórico de vendas oferece em média muito poucos pontos no passado para estimar cada índice sazonal (ou seja, os valores de S (t) durante o ano, veja a seção anterior) . As séries temporais são barulhentas. As flutuações aleatórias do mercado afetam as vendas e tornam a sazonalidade mais difícil de isolar. Estão envolvidas várias sazonalidades. Ao olhar para as vendas no nível da loja, a sazonalidade do produto em si é tipicamente emaranhada com a sazonalidade da loja. Outros padrões, como o ciclo de vida da tendência ou do produto, também afetam séries temporais. Introduzindo vários tipos de viés na estimativa. Um método simples - embora intensivo de mão-de-obra - para resolver esses problemas consiste em criar manualmente perfis de sazonalidade de agregados de produtos conhecidos por ter o mesmo comportamento sazonal. A expectativa de vida do agregado do produto é tipicamente muito maior do que a vida útil dos produtos individuais, o que mitiga esses problemas de estimação. Quasi-sazonalidade Há muitos padrões que acontecem uma vez por ano, mas nem sempre na mesma data. Em Lokad, nós chamamos esses padrões quasi-sazonais. Por exemplo, o Dia das Mães (que varia em diferentes datas dependendo do ano e também varia entre os países) e outros feriados como o Ramadã, Páscoa e Hanukkah (que se enquadram em diferentes datas dependendo do ano), são quase sazonais. Esses eventos quasi-sazonais caem além do escopo de modelos clássicos de previsão cíclica que assumem que o período do ciclo é estritamente constante. Para lidar com esses eventos quase sazonais, uma lógica quasi-cíclica mais complexa é necessária. Lokads gotcha Em nossa experiência, a sazonalidade afeta a grande maioria das atividades humanas. Em particular, em séries cronológicas que representam vendas de bens de consumo (alimentos e não-alimentos), um fator sazonal está quase sempre presente. No entanto, acontece frequentemente que, devido à quantidade de ruído do mercado, a qualidade da estimativa dos índices sazonais acabe por ser demasiado baixa para ser utilizada na prática para refinar as previsões. A tecnologia de previsão de Lokad nativamente lida com sazonalidade e quase-sazonalidade, então você não tem que contar Lokad sobre eles, o seu já tomado cuidado. Para superar as questões levantadas pela limitada profundidade histórica disponível para a maioria das séries temporais no varejo ou na manufatura, a Lokad usa análises de séries temporais múltiplas e a sazonalidade não é avaliada em um único produto, mas sim em muitos produtos. Ao fazer isso, reduzimos o ruído em nossa estimativa da sazonalidade, mas também introduzir sazonalidade nas previsões, mesmo quando os produtos foram vendidos por menos de um ano. Obtenha previsões de vendas otimizadas com nossa tecnologia de previsão de estoque. A Lokad é especializada na otimização de estoque por meio da previsão da demanda. O gerenciamento da sazonalidade - e muito mais - são características nativas de nosso mecanismo de previsão. Tópicos da cadeia de suprimentos Tópicos de previsãoAplicação da planilha de ajuste sazonal e suavização exponencial É fácil executar o ajuste sazonal e ajustar modelos exponenciais de suavização usando o Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização exponencial linear nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente através de suavização exponencial linear e (iii) finalmente as previsões sazonalmente ajustadas são quasi mensuradas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação ao invés de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo isso Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida.) O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsert / Name / Createquot). O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Também poderíamos usar Holt8217s ao invés do modelo LES de Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são usados ​​na previsão.) Os erros são computados na coluna seguinte (aqui, coluna J) subtraindo as previsões dos valores reais. O erro médio quadrático é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa a prever até O terceiro período (linha 15 na planilha). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas retardadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no retardo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 para determinar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2 / SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 2/6, ou 0,33. Se você variar o valor de alfa à mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e de autocorrelação dos erros, bem como sobre o erro raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que para fins de previsão estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, que é ideal para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando alfa é variado, porque o valor que é melhor para previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quoturno nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como alternativa ao aumento do valor de alfa para introduzir mais conservadorismo nas previsões de longo prazo, às vezes é adicionado ao modelo um fator de amortecimento de quottrend para fazer com que a tendência projetada se aplique após alguns períodos. A etapa final na construção do modelo de previsão é a de igualar as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Dessa forma, as previsões reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo à frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de pontos mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. O intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular limites de confiança para a previsão de LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão mais de um período à frente, tomando todas as fontes de A sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão em duas etapas e use isso como base para um intervalo de confiança de 2 passos à frente.


No comments:

Post a Comment