Questão:
O que significa uma interceptação significativa na ANOVA?
Sarah
2013-07-04 22:37:02 UTC
view on stackexchange narkive permalink

Considere um modelo com uma variável de resposta contínua e uma variável explicativa categórica. Agradeço que em R, uma saída de summary.lm de uma anova nesses dados fornece linhas que representam o valor médio de cada nível de fator. As estrelas de significância representam a significância da diferença entre a média de cada nível e a "interceptação", que representa a média do primeiro nível do fator.

O que estou me perguntando é o que as estrelas de significância em este termo de interceptação representa? Simplesmente que a média deste nível de fator específico é diferente de zero?

Trzy respostas:
Peter Flom
2013-07-04 22:41:06 UTC
view on stackexchange narkive permalink

A interceptação é a estimativa da variável dependente quando todas as variáveis ​​independentes são 0. Então, suponha que você tenha um modelo como

Renda ~ Sexo

Então, se sexo é codificado como 0 para homens e 1 para mulheres, a interceptação é o valor previsto da renda para os homens; se for significativo, significa que a renda dos homens é significativamente diferente de 0.

Na maioria dos casos, o significado da interceptação não é particularmente interessante. Na verdade, você pode facilmente alterar a interceptação recodificando a variável independente, mas isso não tem efeito sobre o significado do modelo.

Henrik
2013-07-04 23:23:58 UTC
view on stackexchange narkive permalink

Em contraste com o comportamento padrão de R (que na verdade é codificar o primeiro nível como 0), ANOVA geralmente usa codificação de contraste ou soma a zero em que os níveis de um fator a codificado como desvio de 0 e a interceptação representa a grande média (ou média das médias da célula, que depende).

Então, uma interceptação significativa significa que a grande média é diferente de 0.

Acho que "normalmente" pode ser um pouco extremo, mas certamente é um bom ponto que software diferente faz coisas diferentes; e às vezes o mesmo software faz coisas diferentes em programas diferentes (mas equivalentes).
Nicholas Carlona
2016-07-15 01:02:26 UTC
view on stackexchange narkive permalink

A resposta de Peter Flom está incorreta. Não tenho a reputação de comentar a pergunta de Peter Flom, então colocarei minha resposta aqui.

Vamos usar o exemplo de um fator de cor que pode ser Vermelho, Verde, Azul. Vamos fingir que essas cores corresponderão a uma variável de resposta média (y) de 40, 60 e 30, respectivamente.

Agora, isso não é comumente considerado, mas ANOVA e regressão linear são exatamente as mesmas coisa. A matriz de design (o X) do modelo Linear y = Xb + e seria algo assim ...

RGB

1 1 0 0

1 0 1 0

1 0 0 1

... entretanto, ao tentar estimar os coeficientes pela derivada da soma dos erros quadrados em relação a b (ou seja, b = (X ^ T * X) ^ -1 * X ^ T * y, você notará que X ^ T * X é uma matriz singular. Se você pensar bem, isso faz sentido intuitivamente. A solução para isso é simples. Você transforme um tratamento na interceptação e expresse todas as respostas médias em relação a essa interceptação. Veja a nova matriz de design abaixo ...

(R) GB

1 0 0

1 1 0

1 0 1

... agora temos uma matriz de design onde a interceptação é na verdade o tratamento Vermelho. Todas as respostas médias agora são em relação a RED ou seja, vermelho = 40, verde = 20 e azul = -10.

R = R = 40G = G + R = 20 + 40 = 60B = B + R = -10 + 40 = 30

Em outras palavras, em uma ANOVA (que é realmente o mesmo que uma regressão linear) a interceptação é na verdade, um tratamento e uma interceptação significativa significam que o tratamento é significativo. Agora, se você entrar em níveis de ANOVA de duas vias ou até mesmo mais altos, a interpretação da interceptação se torna mais complexa, mas para a anova de uma via, a própria interceptação é apenas outro tratamento.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...