Transformacao Do Log De Variaveis No Stata Forex




Transformação Do Log De Variáveis No Stata ForexStata: analise de dados e software estatistico Allen McDowell, StataCorp Nicholas J. Cox, Universidade de Durham, Reino Unido Uma solucao tradicional para este problema e realizar uma transformacao de logit nos dados. Suponha que sua variavel dependente seja chamada y e suas variaveis ??independentes sejam chamadas de X. Entao, assume-se que o modelo que descreve y e. Se um entao executa a transformacao do logit, o resultado e que agora mapeamos a variavel original, que foi delimitada por 0 e 1, para a linha real. Pode-se agora ajustar este modelo usando OLS ou WLS, por exemplo, usando regressao. Claro, nao e possivel realizar a transformacao em observacoes onde a variavel dependente e zero ou uma, o resultado sera um valor faltante, e essa observacao seria subsequentemente retirada da amostra de estimacao. Uma alternativa melhor e estimar o uso de glm com a familia (binomio). Link (logit). E robusto, este e o metodo proposto por Papke e Wooldridge (1996). No momento em que este artigo foi publicado, o comando Statarsquos Glm nao poderia caber em tais modelos, e esse fato e notado no artigo. O glm foi desde entao aprimorado especificamente para lidar com dados de resposta fracionada. Em ambos os casos, pode haver uma questao substantiva de interpretacao. Concentremo-nos em interpretar zeros: o mesmo tipo de problema pode surgir para aqueles. Suponha que a variavel y seja proporcao de dias em que os trabalhadores passam doentes. Existem duas possibilidades extremas. O primeiro extremo e que todos os zeros observados estao efetivamente a zeros de amostragem: cada trabalhador tem alguma probabilidade diferente de ficar doente e e apenas que alguns trabalhadores nao estavam, de fato, doentes no periodo da amostra. Aqui, muitas vezes queremos incluir os zeros observados em nossa analise e a rota glm e atraente. O segundo extremo e que alguns ou possivelmente todos os zeros observados devem ser considerados como zeros estruturais: esses trabalhadores nunca se reportarao doentes, devido a saude robusta e a dedicacao exemplar. Estes sao extremos, e os casos intermediarios tambem sao comuns. Na pratica, muitas vezes e util analisar a distribuicao de frequencia: um pico marcado em zero ou um pode muito bem aumentar a duvida sobre um unico modelo instalado em todos os dados. Um segundo exemplo pode ser dados sobre as relacoes comerciais entre paises. Suponha que a variavel y seja proporcao das importacoes de um determinado pais. Aqui, um zero pode ser estrutural se dois paises nunca trocam, digam por motivos politicos ou culturais. Um modelo que se encaixa tanto nos zeros quanto nos nao-comercios pode nao ser aconselhavel, de modo que um tipo diferente de modelo deve ser considerado. Para uma excelente discussao mais ampla, veja Baum (2008). Referencias Baum, C. F. 2008. Proporcoes de modelagem. Stata Journal 8: 299ndash303. Papke, L. E. e J. Wooldridge. 1996. Metodos econometricos para variaveis ??de resposta fracionada com uma aplicacao para 401 (k) taxas de participacao do plano. Journal of Applied Econometrics 11: 619ndash632.Para perguntas rapidas, envie um email para dataprinceton. edu. Nao ha appts. Necessario durante as horas de caminhada. Nota: o laboratorio DSS esta aberto enquanto o Firestone estiver aberto, sem compromissos necessarios para usar os computadores do laboratorio para sua propria analise. Transformacoes de logs Se a distribuicao de uma variavel tiver uma inclinacao positiva, assumir um logaritmo natural da variavel as vezes ajuda a ajustar a variavel em um modelo. As transformacoes de log tornam a distribuicao do ponto de vista mais equilibrada mais normal. Alem disso, quando uma alteracao na variavel dependente esta relacionada com a variacao percentual em uma variavel independente, ou vice-versa, a relacao e melhor modelada tomando o log natural de uma ou ambas as variaveis. Por exemplo, estimar as pessoas com salario baseadas em educacao, experiencia e regiao de residencia usando dados da amostra de Statas nlsw88, um extrato do Estudo Logualinal Nacional de Mulheres Jovens de 1988. Parece ok, mas quando olho para a distribuicao de posse, parece um pouco distorcido. Entao eu computo um registro natural de posse. Parece ter superado um pouco, mas parece um tanto normal. Eu tento uma regressao com o mandato registrado. O R-squared ficou um pouco mais alto, entao, tomar o log natural parece ter ajudado a ajusta-lo melhor ao modelo. Quando a variavel independente, mas nao a variavel dependente, e registrada, uma alteracao de porcentagem na variavel independente e associada a 1100 vezes a alteracao do coeficiente na variavel dependente. Salario previsto. -1.6390.681GRADE0.774LNTENURE-1.134SOUTH Portanto, um aumento percentual na posse esta associado a um aumento no salario de 0,01x0,774 ou cerca de 0,0077. Agora eu examino o salario, e acho que e muito distorcido. Entao pego um log natural de salarios e analise a distribuicao do salario registrado. A distribuicao parece muito mais normal. Agora eu lanco a mesma regressao com o salario registrado como variavel dependente. Quando a variavel dependente, mas nao uma variavel independente, e registrada, uma variacao de uma unidade na variavel independente esta associada a uma mudanca de porcentagem de coeficiente de 100 vezes na variavel dependente. Nesses dados, a posse e medida em anos: entao, um aumento de um ano na posse aumenta o salario em 100x0.026 ou cerca de 2.6. Se registramos as variaveis ??dependentes e independentes, entao estamos olhando a elasticidade: a variacao percentual em X resulta em variacao percentual em Y. lanca prevista 0,659 0,084GRADE0.136LNTENURA-0.151SOUTH Um aumento de um por cento na posse e estimado em aproximadamente Aumento de 0.136 no salario. Copie 2007 The Truestees of Princeton University. Todos os direitos reservados. Dataprinceton. edu Esta pagina foi atualizada pela ultima vez em 28 de agosto de 2008