Situação | Conclusão do teste | |
---|---|---|
Real | Rejeitar \(H_0\) | Não rejeitar \(H_0\) |
———————– | ——————- | —————————- |
\(H_0\) Verdadeira | erro tipo I | decisão correta |
\(H_0\) Falsa | decisão correta | erro tipo II |
———————– | ——————- | —————————- |
É a capacidade de um teste identificar diferenças que realmente existem, ou seja, de rejeitar \(Ho\) quando é realmente falsa, definida como 1-\(\beta\)
\[\mathbb{P}(\text{Erro do tipo II}) = \mathbb{P}(\text{não rejeitar} \ H_0| H_0 \text{é falsa}) = \beta\]
O poder de um teste de hipóteses é afetado por três fatores:
Suponha que a hipótese nula é falsa e que o verdadeiro valor da média é \(\mu =\mu_0+\delta\) \(Z_0=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}=\frac{\overline{X}-(\mu_0+\delta)}{\sigma/\sqrt{n}}+\frac{\delta}{\sigma/\sqrt{n}}\)
\[Z_0\sim N\left(\frac{\delta}{\sigma/\sqrt{n}},1\right)\]
Teste bilateral: \[\beta=\Phi\left(LS-\frac{\mu_0+\delta}{\sigma/\sqrt{n}}\right)-\Phi\left(LI-\frac{\mu_0+\delta}{\sigma/\sqrt{n}}\right)\]
Testes unilaterais:
\(\Phi\left(LS-\frac{\mu_0+\delta}{\sigma/\sqrt{n}}\right)\) \(\quad 1-\Phi\left(LI-\frac{\mu_0+\delta}{\sigma/\sqrt{n}}\right)\)
Considere \(\delta=1\), \(n = 30\), \(\alpha = 0,05\), \(\mu = 8\) e \(\sigma = 2,1\)
Ou seja vamos testar:
\[H_0: \mu=8\] \[H_1: \mu \neq 8\]
\[\beta=\Phi\left(LS-\frac{\mu_0+\delta}{\sigma/\sqrt{n}}\right)-\Phi\left(LI-\frac{\mu_0+\delta}{\sigma/\sqrt{n}}\right)=\Phi(-0,9633)-\Phi(-4,2531)=0,1677\]
\(\text{Poder} \ =1-\beta=1-0,1677=0,8323\)
\(\Phi \sim\) Normal padrão acumulada.
Primeiro calculamos o intervalo de confiança para a média:
###### Calculando Intervalo de confiança(95\%)
media <- 8
sd <- 2.1
n <- 30
zep <- qnorm(0.95)*sd/sqrt(n)
li_z <- media-zep
ls_z <- media+zep
cbind(limite_inferior=round(li_z,2),limite_superior=round(ls_z,2))
## limite_inferior limite_superior
## [1,] 7.37 8.63
Agora substituímos os valores na definição:
delta <- 1
zli <- (li_z-(media+delta))/(sd/sqrt(n))
zls <- (ls_z-(media+delta))/(sd/sqrt(n))
betaz <- pnorm(zls)-pnorm(zli)
betaz
## [1] 0.1676757
poderz <- 1-betaz
poderz
## [1] 0.8323243
A probabilidade de rejeitar \(H_0\) é de aproximadamente \(83\%\)
Supondo que não conhecemos o valor da variância populacional, utilizamos a distribuição t-student
Repetimos os passos anteriores.
###### Calculando Intervalo de confiança(95\%)
media <- 8
sd <- 2.1
n <- 30
ept <- qt(0.95,df=n-1)*sd/sqrt(n)
li_t <- media-ept
ls_t <- media+ept
cbind(limite_inferior=round(li_t,2),limite_superior=round(ls_t,2))
## limite_inferior limite_superior
## [1,] 7.35 8.65
Agora substituímos os valores na definição:
delta <- 1
tli <- (li_t-(media+delta))/(sd/sqrt(n))
tls <- (ls_t-(media+delta))/(sd/sqrt(n))
betat <- pt(tls,df=n-1)-pt(tli,df=n-1)
betat
## [1] 0.1853156
podert <- 1-betat
podert
## [1] 0.8146844
A probabilidade de rejeitar \(H_0\) é de aproximadamente \(81\%\)
É a magnitude da diferença entre os grupos
P-valor não revela o tamanho do efeito - relata apenas, se o efeito existe
P-valor significativo nos diz que a diferença observada entre dois grupos não é devido ao acaso;
Quando a amostra é muito grande, o teste quase sempre demonstra diferença significativa;
Diferenças pequenas, mesmo que significativa, geralmente não fazem sentido;
Primeiro calculamos o desvio padrão agrupado
\(d = (\bar{x_1}-\bar{x_2})/s_{pool}\)
Depois o índice de Cohen’s d
\(s_{poll} = (s_1+s_2)/2\)
No R
treatment <- rnorm(100,mean=10)
control <- rnorm(100,mean=12)
#install.packages('effsize',repos='http://cran-r.c3sl.ufpr.br')
library(effsize)
## calculando Cohen's d
cohen.d(treatment,control,pooled=TRUE)
##
## Cohen's d
##
## d estimate: -2.232352 (large)
## 95 percent confidence interval:
## inf sup
## -2.590117 -1.874587
library(effsize)
d <- (c(treatment,control))
f <- rep(c("Treatment","Control"),each=100)
## Calculando Cliff's Delta
cliff.delta(d,f,pooled=TRUE)
##
## Cliff's Delta
##
## delta estimate: 0.8852 (large)
## 95 percent confidence interval:
## inf sup
## 0.8130061 0.9305886
Vargha and Delaney
Exemplo no R - Hedges’ g
## compute Hedges' g
cohen.d(d,f,hedges.correction=TRUE, pooled=TRUE)
##
## Hedges's g
##
## g estimate: 2.223885 (large)
## 95 percent confidence interval:
## inf sup
## 1.866644 2.581127