Tuesday 13 November 2018

Movendo média previsão intervalo


A distinção entre intervalos de confiança, intervalos de predição e intervalos de tolerância. Quando você ajusta um parâmetro a um modelo, a exatidão ou precisão pode ser expressa como um intervalo de confiança, um intervalo de predição ou um intervalo de tolerância. Os três são bem distintos. A discussão abaixo explica os três intervalos diferentes para o caso simples de ajustar uma média a uma amostra de dados (assumindo a amostragem de uma distribuição gaussiana). As mesmas idéias podem ser aplicadas a intervalos para qualquer parâmetro de melhor ajuste determinado por regressão. Intervalos de confiança informam sobre o quão bem você determinou a média. Suponha que os dados são realmente aleatoriamente amostrados a partir de uma distribuição gaussiana. Se você fizer isso muitas vezes, e calcular um intervalo de confiança da média de cada amostra, você deve esperar cerca de 95 desses intervalos para incluir o verdadeiro valor da média da população. O ponto chave é que o intervalo de confiança informa sobre a localização provável do parâmetro de população real. Os intervalos de previsão indicam onde você pode esperar para ver o próximo ponto de dados amostrado. Suponha que os dados são realmente aleatoriamente amostrados a partir de uma distribuição gaussiana. Coletar uma amostra de dados e calcular um intervalo de previsão. Em seguida, amostra mais um valor da população. Se você fizer isso muitas vezes, você deve esperar que o próximo valor esteja dentro desse intervalo de previsão em 95 das amostras. O ponto-chave é que o intervalo de previsão informa sobre a distribuição de valores e não a incerteza na determinação da média da população. Os intervalos de predição devem levar em conta tanto a incerteza em conhecer o valor da média populacional quanto a dispersão de dados. Assim, um intervalo de previsão é sempre maior do que um intervalo de confiança. Antes de passar para intervalos de tolerância, vamos definir a palavra 39expect39 usada na definição de um intervalo de predição. Isso significa que há uma chance de 50 ver o valor dentro do intervalo em mais de 95 das amostras e uma chance de 50 ver o valor dentro do intervalo em menos de 95 das amostras. Imagine fazer muitas simulações, então você sabe o verdadeiro valor e, portanto, saber se ele está no intervalo de previsão ou não. Você pode então tabular qual fração do tempo o valor é delimitado pelo intervalo. Repita com muitos conjuntos de simulações. Em média, o valor será 95, mas pode ser 93 ou 98. Metade do tempo será menos de 95 e metade do tempo será mais do que 95. E se você quiser ter certeza de que o intervalo contém 95 de Os valores Ou 90 certeza de que o intervalo contém 99 dos valores Essas últimas perguntas são respondidas por um intervalo de tolerância. Para computar, ou compreender, um intervalo de tolerância você tem que especificar duas porcentagens diferentes. Um expressa como certo você quer ser, eo outro expressa que fração dos valores o intervalo conterá. Se você definir o primeiro valor (como certeza) para 50, então um intervalo de tolerância é o mesmo que um intervalo de previsão. Se você definir um valor maior (digamos 90 ou 99), o intervalo de tolerância será maior. Necessidade de aprender Prisma 72.7 Intervalos de previsão Como discutido na Seção 17. um intervalo de predição fornece um intervalo dentro do qual esperamos que y fique com uma probabilidade especificada. Por exemplo, supondo que os erros de previsão não estão correlacionados e normalmente distribuídos, então um intervalo de previsão simples para a próxima observação em uma série de tempo é 91 hat pm 1,96 hatsigma, 93 onde hatsigma é uma estimativa do desvio padrão da distribuição de previsão. Na previsão, é comum calcular 80 intervalos e 95 intervalos, embora qualquer porcentagem possa ser usada. Ao prever um passo à frente, o desvio padrão da distribuição prevista é quase o mesmo que o desvio padrão dos resíduos. (De fato, os dois desvios padrão são idênticos se não houver parâmetros a serem estimados, como no caso do método nave). Para os métodos de previsão envolvendo parâmetros a serem estimados, o desvio padrão da distribuição prevista é ligeiramente maior que o desvio padrão residual, Embora essa diferença seja muitas vezes ignorada.) Por exemplo, considere a previsão de uma nave para o Índice Dow-Jones. O último valor da série observada é 3830, portanto a previsão do próximo valor do DJI é 3830. O desvio padrão dos resíduos do método da nave é 21,99. Assim, um intervalo de previsão de 95 para o próximo valor do DJI é 3830 pm 1,96 (21,99) 3787, 3873. Similarmente, um intervalo de predição de 80 é dado por 3830 pm 1,28 (21,99) 3802,3858. O valor do multiplicador (1,96 ou 1,28) determina a porcentagem do intervalo de previsão. A tabela a seguir apresenta os valores a serem utilizados para diferentes porcentagens. Tabela 2.1: Multiplicadores a serem usados ​​para intervalos de previsão. A utilização desta tabela ea fórmula hat pm k hatsigma (onde k é o multiplicador) pressupõe que os resíduos são normalmente distribuídos e não correlacionados. Se qualquer uma destas condições não se mantiver, então este método de produzir um intervalo de predição não pode ser usado. O valor dos intervalos de previsão é que expressam a incerteza nas previsões. Se nós produzimos apenas previsões pontuais, não há maneira de dizer quão precisas são as previsões. Mas se também produzimos intervalos de predição, então fica claro quanta incerteza está associada a cada previsão. Por esta razão, as previsões pontuais podem ser quase sem valor sem acompanhar os intervalos de previsão. Para produzir um intervalo de previsão, é necessário ter uma estimativa do desvio padrão da distribuição de previsão. Para as previsões de uma etapa para as séries temporais, o desvio padrão residual fornece uma boa estimativa do desvio padrão previsto. Mas para todas as outras situações, incluindo previsões de várias etapas para séries temporais, é necessário um método de cálculo mais complicado. Esses cálculos geralmente são feitos com software de previsão padrão e não precisam incomodar o previsor (a menos que ele ou ela esteja escrevendo o software). Uma característica comum dos intervalos de predição é que eles aumentam em comprimento à medida que o horizonte de previsão aumenta. Quanto mais adiante prevemos, mais incerteza está associada à previsão, e assim os intervalos de previsão crescem mais. No entanto, existem alguns métodos de previsão (não-lineares) que não têm esse atributo. Se uma transformação tiver sido usada, então o intervalo de predição deve ser calculado na escala transformada e os pontos finais retrotraduzidos para dar um intervalo de predição na escala original. Esta abordagem preserva a cobertura de probabilidade do intervalo de previsão, embora já não seja simétrica em torno da previsão de pontos. Esta funcionalidade é experimental e pode ser alterada ou removida completamente em uma versão futura. Elastic terá uma abordagem de melhor esforço para corrigir quaisquer problemas, mas os recursos experimentais não estão sujeitos ao SLA de suporte de recursos GA oficiais. Dada uma série ordenada de dados, a agregação Moving Average irá deslizar uma janela através dos dados e emitir o valor médio dessa janela. Por exemplo, dados os dados 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Podemos calcular uma média móvel simples com o tamanho das janelas de 5 da seguinte forma: As médias móveis são um método simples para suavizar sequencial dados. As médias móveis são normalmente aplicadas a dados baseados no tempo, como preços de ações ou métricas de servidor. A suavização pode ser usada para eliminar flutuações de alta freqüência ou ruído aleatório, o que permite que as tendências de freqüência mais baixas sejam mais facilmente visualizadas, como a sazonalidade. Syntaxedit Linearedit O modelo linear atribui uma ponderação linear aos pontos da série, de tal forma que datapoints mais antigos (por exemplo, aqueles no início da janela) contribuem com uma quantidade linearmente menor para a média total. A ponderação linear ajuda a reduzir o atraso por trás da média dos dados, uma vez que os pontos mais velhos têm menos influência. Um modelo linear não tem configurações especiais para configurar Como o modelo simples, o tamanho da janela pode mudar o comportamento da média móvel. Por exemplo, uma pequena janela (janela: 10) acompanhará de perto os dados e suavizará apenas as pequenas flutuações da escala. Em contraste, uma média móvel linear com janela maior (janela: 100) Vai suavizar todas as flutuações de alta freqüência, deixando apenas de baixa freqüência, tendências de longo prazo. Ele também tende a ficar atrás dos dados reais por uma quantidade substancial, embora tipicamente menor do que o modelo simples: Multiplicativo Holt-Wintersedit Multiplicativo é especificado por tipo de ajuste: mult. Esta variedade é preferida quando o efeito sazonal é multiplicado em relação aos seus dados. Por exemplo. Se o efeito sazonal é x5 os dados, em vez de simplesmente adicioná-lo. Os valores padrão de alfa e gama são 0,3, enquanto beta é 0,1. As configurações aceitam qualquer float de 0-1 inclusive. O valor padrão do período é 1. O modelo multiplicativo Holt-Winters pode ser minimizado Multiplicativo Holt-Winters funciona dividindo cada ponto de dados pelo valor sazonal. Isso é problemático se qualquer um de seus dados é zero, ou se houver lacunas nos dados (uma vez que isso resulta em um divid-by-zero). Para combater isso, o mult Holt-Winters pads todos os valores por uma quantidade muito pequena (110 -10) para que todos os valores são diferentes de zero. Isso afeta o resultado, mas apenas minimamente. Se os seus dados não forem zero, ou você preferir ver NaN quando os zeros forem encontrados, você pode desabilitar esse comportamento com pad: false Predictionedit Todo o modelo de média móvel suporta um modo de previsão, que tentará extrapolar para o futuro, dada a corrente Suavizada, média móvel. Dependendo do modelo e parâmetro, essas previsões podem ou não ser precisas. As previsões são ativadas adicionando um parâmetro de previsão a qualquer agregação de média móvel, especificando o número de previsões que você gostaria de acrescentar ao final da série. Estas previsões serão espaçadas para fora no mesmo intervalo que seus baldes: O simples. Lineares e modelos de ewma produzem previsões planas: convergem essencialmente na média do último valor da série, produzindo um plano: o modelo holt pode extrapolar com base Em tendências constantes locais ou globais. Se definimos um valor beta alto, podemos extrapolar com base nas tendências constantes locais (neste caso, as previsões são para baixo, porque os dados no final da série estavam em direção descendente): Figura 12. Holt - Com janela de tamanho 100, prever 20, alfa 0,5, beta 0,8 Em contraste, se escolhermos uma pequena beta. As previsões são baseadas na tendência global constante. Nesta série, a tendência global é ligeiramente positiva, de modo que a predição faz um viragem nítido e começa uma inclinação positiva: Figura 13. Média móvel exponencial dupla com janela de tamanho 100, previsão 20, alfa 0,5, beta 0,1 O modelo holtwinters Tem o potencial de fornecer as melhores previsões, já que também incorpora flutuações sazonais no modelo: Figura 14. Média móvel Holt-Winters com janela de tamanho 120, previsão 25, alfa 0.8, beta 0.2, gama 0.7, período 30Moving Average Este exemplo Ensina como calcular a média móvel de uma série de tempo no Excel. Uma média móvel é usada para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série de tempo. 2. No separador Dados, clique em Análise de dados. Nota: não é possível encontrar o botão Análise de dados Clique aqui para carregar o suplemento do Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Intervalo de entrada e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e escreva 6. 6. Clique na caixa Output Range e seleccione a célula B3. 8. Faça um gráfico destes valores. Explicação: porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores eo ponto de dados atual. Como resultado, os picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não consegue calcular a média móvel para os primeiros 5 pontos de dados porque não existem pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis são para os pontos de dados reais.

No comments:

Post a Comment