Estou executando uma regressão que inclui consumo e renda disponível.
Foi sugerido que eu pegasse a média do logaritmo dos meus dados em vez do logaritmo da média.Qual é a diferença?
Estou executando uma regressão que inclui consumo e renda disponível.
Foi sugerido que eu pegasse a média do logaritmo dos meus dados em vez do logaritmo da média.Qual é a diferença?
Existe uma confusão potencial na terminologia aqui, já que esta questão, por exemplo, parece considerar "log-mean" como a média dos logs.
Colocandoà parte essa confusão, aqui está um exemplo simples.Digamos que você tenha 3 medidas com valores de 1, 10 e 100.
O valor médio deles é $ \ frac {111} {3} $ = 37.O logaritmo de base 10 de 37 é 1,57, que é o logaritmo de seu valor médio na escala original.
Os logaritmos de base 10 dos dados originais são 0, 1 e 2;a média dos logaritmos é 1, correspondendo a um valor de 10 na escala original.
Se uma transformação de log dos dados for apropriada, você normalmente deve fazer a transformação nos dados originais primeiro, o que quer quechame esse processo.
O consumo e a renda disponível são frequentemente considerados processos de crescimento exponencial, algo como $ x_t = x_0e ^ {rt} $, onde $ r $ - taxa de crescimento. Se você pegar um log, obterá $ \ ln x_t = \ ln x_0 + rt $, e a função se torna linear. Então, linearizamos o modelo obtendo um log. Essa é a motivação.
Na realidade, sempre há um ruído estocástico nos dados. Para ver como isso é tratado, vamos primeiro escrever a equação acima em uma forma de diferença: $ \ Delta \ ln x_t = \ ln x_t - \ ln x_ {t-1} = r $. Uma maneira de tornar este processo estocástico é adicionar ruído à taxa de mudança da seguinte forma: $$ \ Delta \ ln x_t = r + \ varepsilon_t \\\ varejpsilon_t \ sim \ mathcal N (0, \ sigma ^ 2) $$
Suponha que concordemos com este processo. Queremos estimar os parâmetros do processo. Temos o seguinte para a taxa de crescimento: $$ E [\ Delta \ ln x_t] = r $$ o que leva a um estimador óbvio $$ \ hat r = \ frac 1 n \ sum_ {t = 1} ^ n \ Delta \ ln x_t $$
Então, para o passeio aleatório com um processo de deriva como acima, a média do logaritmo faz sentido no estimador da taxa de crescimento.