Sobre o coeficiente de contingência , gostaria de aproveitar a oportunidade para deixar um comentário.
Considere a "estatística qui-quadrado teórica" $$ v = \ sum_ {i, j} \ frac {(p_ {i, j} -p_ip_j) ^ 2} {p_ip_j} $$ e o coeficiente de contingência teórico $$ C_0 = \ sqrt {\ frac {v} {v + n}}. $$ É chamado de tamanho do efeito nos cálculos de poder. Pelo que eu sei, não há uma definição geral e precisa do tamanho do efeito. No entanto, considerando $ C_0 $ como o tamanho do efeito produz algo semelhante ao poder de $ F $ -testes em modelos lineares, que são testes exatos (não assintóticos) de razão de verossimilhança até uma transformação elementar.
De fato, denotando por $ E $ o tamanho do efeito para tal teste (por exemplo $ E = \ mu / \ sigma $ no caso de um gaussiano simples $ {\ cal N} (\ mu, \ sigma ^ 2) $ sample e $ H_0 \ colon \ {\ mu = 0 \} $), a estatística de teste em $ H_1 $ é uma distribuição $ F $ não central com parâmetro de não centralidade $ \ boxed {\ lambda = nE ^ 2} $. Nesta situação, não realizamos um teste assintótico porque é possível obter a lei exata da estatística de teste $ F $. Assintoticamente, $ F \ approx df_1 \ times \ chi ^ 2 $ onde $ \ chi ^ 2 $ é a estatística de teste do teste de razão de verossimilhança assintótica. Se usássemos a razão de verossimilhança assintótica em vez do teste $ F $ exato, obteríamos um qui-quadrado não central em $ H_1 $ em vez de uma distribuição $ F $ não central: $ F_ {df_1, df_2} ( \ lambda) \ approx \ frac {1} {df_1} \ chi ^ 2_ {df_1} (\ lambda) $ quando $ df_2 $ é grande.
Da mesma forma, no contexto das tabelas de contingência, quando $ n $ é grande, a estatística de teste $ \ chi ^ 2 $ em $ H_1 $ é aproximada por uma distribuição não central $ \ chi ^ 2 $ com parâmetro de não centralidade $ \ boxed {\ lambda = n C_0 ^ 2} $, como podemos verificar por este exemplo de cálculo de potência:
C0 <- 0.3 # teórico efeito sizen <- 100 # total countalpha <- 0.05 # erro tipo I # --- Cálculo de poder com o pacote pwr --- # library (pwr); pwr.chisq.test (C0, N = n, df = 1, sig.level = alfa) ##
## Qui ao quadrado cálculo da potência ## ## w = 0,3 ## N = 100 ## df = 1 ## sig.level = 0,05 ## power = 0,8508388 # --- Cálculo da potência direta --- # threshold <- qchisq (1-alfa, df = 1) # o valor crítico do teste statisticlambda <- n * C0 ^ 2 # parâmetro de não centralidade1 - pchisq (limiar, df = 1, ncp = lambda) # obtemos o mesmo resultado ## [1] 0,8508388
Assim, cada um desses exemplos ($ F $ -testes em modelos lineares gaussianos e $ \ chi ^ 2 $ testes para tabelas de contingência) fornece assintoticamente um teste de razão de verossimilhança (ver a resposta de @whuber sobre a Pearson $ \ chi ^ 2 $), e sua estatística de teste em $ H_1 $ é aproximada, para $ n $ grande, por uma distribuição $ \ chi ^ 2 $ não central com parâmetro de não centralidade $ \ encaixotado {\ lambda = n \ times \ text {tamanho do efeito} ^ 2} $.