Matriz de covariância média móvel ponderada exponencialmente


Multivariada Exponencialmente Ponderada Movendo Covariância Matriz Hawkins, Douglas M. Maboudou-Tchao, Edgard M. (Associação Americana de Estatística ASQ) Universidade de Minnesota Universidade de Central Florida Technometrics Vol. 50 No. 2 QICID: 24353 Maio 2008 pp. 155-166 Lista 10,00 Membro 5,00 POR UM TEMPO LIMITADO, O ACESSO A ESTE CONTEÚDO É GRATUITO Você precisará fazer login. Novidade na ASQ Cadastre-se aqui. Este resumo é baseado no resumo dos autores. O gráfico de média móvel ponderada exponencialmente multivariada (MEWMA) enfoca as mudanças no vetor médio, mas mudanças podem ocorrer no local ou na variabilidade da característica de qualidade multivariada correlacionada que requerem metodologias paralelas para detectar mudanças na matriz de covariância. Uma matriz de covariância móvel exponencialmente ponderada é considerada para monitorar a estabilidade da matriz de covariância de um processo. Quando usado em conjunto com a localização MEWMA, este gráfico monitora tanto a média como a variabilidade conforme exigido pelo controle de processo adequado. O gráfico geralmente supera gráficos competitivos para a matriz de covariância. Calculando a Correlação de EWMA Usando Excel Recentemente aprendemos sobre como estimar a volatilidade usando EWMA Exponentially Weighted Moving Average (EWMA). Como sabemos, EWMA evita as armadilhas de médias igualmente ponderadas, pois dá mais peso para as observações mais recentes em comparação com as observações mais antigas. Assim, se temos retornos extremos em nossos dados, com o passar do tempo, esses dados se tornam mais velhos e obtém menor peso em nosso cálculo. Neste artigo, veremos como podemos calcular a correlação usando EWMA no Excel. Sabemos que a correlação é calculada usando a seguinte fórmula: O primeiro passo é calcular a covariância entre as duas séries de retorno. Utilizamos o factor de alisamento Lambda 0.94, tal como utilizado no RiskMetrics. Considere a seguinte equação: Usamos os retornos quadrados r 2 como a série x nesta equação para previsões de variância e produtos cruzados de dois retornos como a série x na equação para as previsões de covariância. Observe que o mesmo lambda é usado para todas as variâncias e covariâncias. A segunda etapa é calcular as desvios e desvios padrão de cada série de retorno, conforme descrito neste artigo Calcular volatilidade histórica usando EWMA. A terceira etapa é calcular a correlação, inserindo os valores de covariância, e desvios padrão na fórmula dada acima para correlação. A seguinte planilha do Excel fornece um exemplo do cálculo de correlação e volatilidade no Excel. Faz exame do log retorna de dois estoques e calcula a correlação entre eles. É a correlação da amostra entre X e Y no tempo t. É a covariância ponderada exponencial da amostra entre X e Y no tempo t. É a amostra de volatilidade exponencial ponderada para a série temporal X no tempo t. É a amostra de volatilidade exponencial ponderada para a série temporal Y no tempo t. É o fator de suavização usado nos cálculos de volatilidade ponderada exponencial e covariância. Se os conjuntos de dados de entrada não tiverem uma média zero, a função Excel do EWXCF remove a média de cada amostra de dados em seu nome. O EWXCF utiliza a volatilidade EWMA e representações EWCOV que não assumem uma volatilidade média de longo prazo (ou covariância) e, portanto, para qualquer horizonte de previsão além de um passo, o EWXCF retorna um valor constante. Referências Hull, John C. Opções, Futuros e Outros Derivativos Financial Times Prentice Hall (2003), pp 385-387, ISBN 1-405-886145 Hamilton, J. D. Análise de séries temporais. Princeton University Press (1994), ISBN 0-691-04289-6 Tsay, Ruey S. Análise da Série de Tempo Financeiro John Wiley amp SONS. (2005), ISBN 0-471-690740 Related LinksComputational ferramentas Analogamente, DataFrame tem um método cov para calcular covariâncias pairwise entre as séries no DataFrame, também excluindo NAnull valores. Assumindo que os dados ausentes estão faltando aleatoriamente, isso resulta em uma estimativa para a matriz de covariância que é imparcial. No entanto, para muitas aplicações esta estimativa pode não ser aceitável porque a matriz de covariância estimada não é garantida para ser semi-definitiva positiva. Isto poderia levar a correlações estimadas com valores absolutos que são maiores do que um, ou uma matriz de covariância não-invertible. Consulte Estimativa de matrizes de covariância para obter mais detalhes. DataFrame. cov também suporta uma palavra-chave opcional minperiods que especifica o número mínimo necessário de observações para cada par de colunas, a fim de ter um resultado válido. Os pesos usados ​​na janela são especificados pela palavra-chave wintype. A lista de tipos reconhecidos são: boxcar triang blackman hamming bartlett parzen bohman blackmanharris nuttall barthann kaiser (necessidades beta) gaussian (necessidades std) generalgaussian (precisa de poder, largura) slepian (precisa de largura). Observe que a janela do boxcar é equivalente a mean (). Para algumas funções de janela, parâmetros adicionais devem ser especificados: Para. sum () com um wintype. Não há normalização feita para os pesos para a janela. Passando pesos personalizados de 1, 1, 1 irá produzir um resultado diferente do que passando pesos de 2, 2, 2. Por exemplo. Ao passar um wintype em vez de especificar explicitamente os pesos, os pesos já estão normalizados para que o maior peso seja 1. Em contraste, a natureza do cálculo. mean () é tal que os pesos são normalizados em relação uns aos outros. Os pesos de 1, 1, 1 e 2, 2, 2 produzem o mesmo resultado. Rolling de reconhecimento de tempo na versão 0.19.0. Novo na versão 0.19.0 são a capacidade de passar um offset (ou conversível) para um método. rolling () e tê-lo produzir janelas de tamanho variável com base na janela de tempo passada. Para cada ponto de tempo, isso inclui todos os valores precedentes que ocorrem dentro do delta de tempo indicado. Isto pode ser particularmente útil para um índice de frequência de tempo não-regular. Este é um índice de freqüência regular. Usando um parâmetro de janela inteira funciona para rolar ao longo da freqüência da janela. Especificar um deslocamento permite uma especificação mais intuitiva da freqüência de rolamento. Usando um índice não regular, mas ainda monotônico, rolar com uma janela de número inteiro não dá nenhum cálculo especial. A utilização da especificação de tempo gera janelas variáveis ​​para estes dados esparsos. Além disso, agora permitimos que um opcional parâmetro para especificar uma coluna (em vez do padrão do índice) em um DataFrame. Rolling vs Resampling Time-aware Usando. rolling () com um índice baseado em tempo é bastante semelhante a resampling. Ambos operam e executam operações redutoras em objetos de pandas indexados no tempo. Ao usar. rolling () com um deslocamento. O deslocamento é um tempo-delta. Tome uma janela olhando para trás-em-tempo, e agregar todos os valores nessa janela (incluindo o ponto final, mas não o ponto de início). Este é o novo valor nesse ponto no resultado. Estas são janelas de tamanho variável no espaço de tempo para cada ponto da entrada. Você obterá um resultado do mesmo tamanho que a entrada. Ao usar. resample () com um deslocamento. Construa um novo índice que é a freqüência do deslocamento. Para cada compartimento de freqüência, o agregado aponta da entrada dentro de uma janela que olha para trás-no tempo que caem nesse compartimento. O resultado dessa agregação é a saída para esse ponto de freqüência. As janelas são tamanho de tamanho fixo no espaço de freqüência. Seu resultado terá a forma de uma freqüência regular entre o min eo máximo do objeto de entrada original. Para resumir. Rolling () é uma operação de janela baseada em tempo, enquanto. resample () é uma operação de janela baseada em freqüência. Centralização do Windows Por padrão, as etiquetas são definidas para a borda direita da janela, mas uma palavra-chave central está disponível para que as etiquetas possam ser definidas no centro. Funções de janelas binárias cov () e corr () podem calcular as estatísticas da janela em movimento sobre duas séries ou qualquer combinação de DataFrameSeries ou DataFrameDataFrame. Aqui está o comportamento em cada caso: duas séries. Calcular a estatística para o emparelhamento. DataFrameSeries. Calcular as estatísticas para cada coluna do DataFrame com a série passada, retornando um DataFrame. DataFrameDataFrame. Por padrão, calcular a estatística de correspondência de nomes de colunas, retornando um DataFrame. Se o argumento de palavra-chave pairwiseTrue é passado, em seguida, calcula a estatística para cada par de colunas, retornando um painel cujos itens são as datas em questão (consulte a próxima seção). Calculando as covariâncias e as correlações em pares na análise de dados financeiros e outros campos comuns para calcular matrizes de covariância e correlação para uma coleção de séries temporais. Muitas vezes também está interessado em matrizes de covariância de janela móvel e de correlação. Isso pode ser feito passando o argumento de palavra-chave pairwise, que no caso de entradas DataFrame irá produzir um painel cujos itens são as datas em questão. No caso de um único argumento de DataFrame, o argumento pairwise pode até ser omitido: Os valores ausentes são ignorados e cada entrada é calculada usando as observações completas pairwise. Consulte a seção de covariância para ressalvas associadas a este método de cálculo de matrizes de covariância e correlação. Além de não ter um parâmetro de janela, essas funções têm as mesmas interfaces que suas contrapartes de rolagem. Como acima, os parâmetros que todos aceitam são: minperiods. Limite de pontos de dados não nulos a exigir. O padrão é o mínimo necessário para calcular estatística. Nenhum NaNs será emitido uma vez que os pontos de dados não-nulos de minperiods foram vistos. centro. Boolean, se as etiquetas devem ser definidas no centro (o padrão é False) A saída dos métodos. rolling e. expanding não retorna um NaN se houver pelo menos valores não nulos de minperiods na janela atual. Isso difere do cumsum. Cumprod. Cummax. E cummin. Que retornam NaN na saída onde quer que um NaN seja encontrado na entrada. Uma estatística de janela de expansão será mais estável (e menos responsiva) do que sua contrapartida de janela de rolamento à medida que o tamanho de janela crescente diminui o impacto relativo de um ponto de dados individual. Como exemplo, aqui está a saída mean () para o conjunto de dados da série de tempo anterior: Exponentially Weighted Windows Um conjunto relacionado de funções são exponencialmente ponderadas versões de várias das estatísticas acima. Uma interface semelhante ao. rolling e. expanding é acessada através do método. ewm para receber um objeto EWM. São fornecidos vários métodos EW em expansão (exponencialmente ponderados):

Comments