Um teste foi feito da seguinte maneira: 116 pessoas selecionadas aleatoriamente forneceram data, hora e local de nascimento.
Um astrólogo preparou um mapa astral para essas 116 pessoas, usando apenas os dados fornecidos acima.
Cada voluntário também preencheu um questionário: "California Personality Index".
Para um outro astrólogo, foram dados:
Seja \(p\) a probabilidade de que o astrólogo identifique o questionário correto.
Se de fato a informação do Mapa Astral não caracteriza a personalidade de uma pessoa e na verdade o astrólogo está apenas escolhendo um dos 3 questionários ao acaso, a probabilidade de acerto é \(p=1/3\).
Astrólogos confiam em seus estudos e dizem que a probabilidade de acerto é maior do que \(1/3\).
Como testar se eles estão certos?
Escolher ao acaso um astrólogo e fazer o teste com ele uma vez, é suficiente?
Como definir a variável aleatória?
\(X_i\): astrólogo associa corretamente um questionário ao mapa astral \(i\), ou seja, \[X_i\sim \mbox{Bernoulli}(p)\]
Podemos pensar em \(p\) como a proporção de acerto na população de astrólogos.
Se astrólogos não têm a capacidade de predição, \(p = 1/3\).
Astrólogos alegam que são capazes: \(p>1/3\).
Como usar dados para testar estes dois cenários?
Hipótese: Usando o mapa astral de uma pessoa, a probabilidade \(p\) de um astrólogo predizer corretamente qual dos 3 questionários está associado àquele mapa astral é igual a \(1/3\). Ou seja, os astrólogos apenas selecionam ao acaso um dos questionários.
Nesse caso, para saber se os astrólogos têm a capacidade de predizer a personalidade usando o mapa astral, usaríamos as seguintes hipóteses:
\[ \begin{cases} H_0: p = 1/3 & \mbox{(hipótese nula)} \\ H_A: p > 1/3 & \mbox{(hipótese alternativa)} \end{cases} \]
No experimento com os 28 astrólogos, observar uma proporção alta de acertos pode ser uma evidência contra a hipótese de que \(p=1/3\).
O teste é válido sob algumas suposições. A mais importante assume que os dados do experimento foram produzidos através de um processo de aleatorização.
O teste de hipótese tem sempre duas hipóteses sobre o parâmetro populacional de interesse. As hipóteses devem ser definidas antes de se realizar o experimento e coletar dados.
Hipótese Nula (\(H_0\)): afirma que o parâmetro populacional assume um dado valor.
Hipótese Alternativa (\(H_A\)): afirma que o parâmetro populacional assume outros valores, diferente do valor descrito na \(H_0\).
No experimento dos astrólogos, \(H_0\): \(p=1/3\) representa a hipótese de que não há efeito, no sentido de que os astrólogos não têm uma capacidade maior de predizer a personalidade usando o mapa astral.
A hipótese alternativa, \(H_A\): \(p>1/3\), representa a hipótese de que há efeito, ou seja, os astrólogos têm uma capacidade de predizer a personalidade usando o mapa astral.
Em teste de hipóteses, mantém-se a favor de \(H_0\) a menos que os dados tragam grande evidência contra.
A hipótese nula é conservadora: "o réu é inocente até que se prove o contrário".
Vimos que podemos usar uma estatística para estimar um parâmetro populacional. A estatística do teste descreve quão longe do parâmetro populacional usado na \(H_0\) a estimativa está.
Por exemplo, se \(H_0:\) \(p=1/3\), e se \(\widehat p=40/116=0.345\), queremos uma estatística que quantifique quão longe está \(\widehat p=0.345\) de \(p=1/3\).
Para interpretar uma estatística do teste, vamos usar uma probabilidade para resumir a evidência contra \(H_0\). Esta probabilidade é chamada de valor-de-p.
Baseado no valor-de-p, decidir se rejeita ou não a hipótese nula. Note que a conclusão é sempre em termos da hipótese nula: rejeitar ou não \(H_0\).
Mas quão pequeno deve ser o valor-de-p para ser considerado forte evidência contra \(H_0\)?
Geralmente, fixamos o nível de significância do teste (\(\alpha\)), e usamos a seguinte regra. É comum usarmos \(\alpha=0.05\).
Assumimos primeiro que \(H_0\) é verdadeira.
Consideramos então todos os valores possíveis para a estatística do teste, de acordo com sua distribuição amostral.
Calculamos a estatística do teste observada para o experimento realizado e verificamos onde, na distribuição amostral, ela se posiciona.
Calculamos a probabilidade de um valor igual ou mais extremo ao da estatística do teste observada (valor-de-p). Mais extremo: mais evidência contra \(H_0\).
Se o valor-de-p obtido é bem pequeno, por exemplo, \(0.01\), isto quer dizer que se \(H_0\) é verdadeira, então seria incomum obter uma amostra com os resultados como o observado. Um valor-de-p muito baixo traz fortes evidências contra \(H_0\).
Distribuição amostral da proporção amostral \(\widehat p\) sob \(H_0\).
valor-de-p (área em azul): probabilidade da proporção amostral assumir um valor igual ao observado, \(\widehat p_{obs}\), ou mais extremo, sob \(H_0\).
Passo 1: Suposições
Passo 2: Hipóteses
Em outras palavras:
Passo 3: Estatística do teste
Passo 3: Estatística do teste
\[Z=\frac{\widehat p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \overset{H_0}{\sim}\mbox{N}(0,1)\]
Passo 3: Estatística do teste
Passo 4: Valor-de-p
Distribuição amostral da estatística do teste \(Z\) sob \(H_0\).
valor-de-p (área em azul): representa a probabilidade de valores mais extremos que \(z_{obs}\) ocorrerem.
Passo 5: Conclusão
Detalhes da pesquisa podem ser encontrados no artigo da revista Nature:
A double-blind test of Astrology.
Suponho que temos uma população e uma hipótese sobre a proporção \(p\) de indíviduos com certa característica.
Hipóteses:
\[ \begin{aligned} H_0: p = p_0 \quad \mbox{vs} \quad
H_A: & p \neq p_0 \mbox{ (bilateral)} \\
& p < p_0 \mbox{ (unilateral à esquerda)} \\
& p > p_0 \mbox{ (unilateral à direita)}
\end{aligned}
\]
Estatística do teste: Baseada na distribuição amostral de \(\widehat p\) \[Z=\frac{\widehat p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \overset{H_0}{\sim} N(0,1)\]
Condição: \(np_0 ≥ 10\) e \(n(1−p_0) ≥ 10\) para aproximação normal
valor-de-p
Conclusão
Para um nível de significância \(\alpha\):
Uma indústria farmacêutica diz que menos de 20% dos pacientes que estão usando um certo medicamento terão efeitos colaterais.
Realizou-se então um ensaio clínico com 400 pacientes e verificou-se que 68 pacientes apresentaram efeitos colaterais
Hipóteses: \(H_0: p = 0.20 \quad \mbox{vs} \quad H_A: p < 0.20\)
Estatística do teste: Da amostra temos que \(\widehat p = 68/400 = 0.17\) \[z_{obs} = \frac{\widehat p - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} = \frac{0.17 - 0.20}{\sqrt{\frac{0.20(1-0.20)}{400}}} = -1.5\]
\[\mbox{valor-de-p} =P(Z \leq- 1.5) = 0.067\]
Conclusão: Para \(\alpha=0.05\), como o valor-de-p é maior que 0.05, não temos evidências nos dados para rejeitar a hipótese de que \(p=0.20\).
Na verdade, a evidência está na direção que a indústria farmacêutica queria, mas não é o suficiente para rejeitar \(H_0\).
E se estivéssemos testando: \(H_0: p = 0.20 \quad \mbox{vs} \quad H_A: p \neq 0.20\)
\(\begin{aligned} \mbox{valor-de-p} &=P(|Z| \geq 1.5) = P(Z \leq -1.5) + P(Z \geq 1.5) \\ &= 2P(Z \leq -1.5) = 2 \times 0.067=0.134 \end{aligned}\)
Conclusão: Para \(\alpha=0.05\), como o valor-de-p é maior que 0.05, não temos evidências nos dados para rejeitar a hipótese de que \(p=0.20\).
Algumas pessoas afirmam que conseguem distinguir o sabor da coca-cola normal da coca zero.
Faremos então um teste para comprovar se a afirmação é verdadeira.
Experimento:
Suposições:
Hipóteses:
Estatística do teste: \(T=\sum_{i=1}^{20}X_i\sim\mbox{Bin}(20, p)\).
Valor-de-p: evidência contra \(H_0\). Calculamos a probabilidade, sob \(H_0\), de ocorrer um valor igual ou mais extremo ao valor observado no experimento.
Resultado do experimento:
Seja \(t_{obs}=19\) o número de acertos.
Valor-de-p: \(P(T\geq 19)=0\), onde \(T\overset{H_0}{\sim}\mbox{Bin}(20, 1/2)\).
Conclusão: Decidimos rejeitar \(H_0\).
Seja \(T\) é o número de acertos. Utilizando a aproximação pela Normal, temos que \(T \sim Bin(20, p)\).
A proporção amostral de acertos \(\widehat p = \frac{T}{20}= 19/20=0.95\).
Vamos testar o seguinte: \(H_0: p = 0.50 \quad \mbox{vs} \quad H_A: p > 0.50\).
Estatística do teste:
\[z_{obs} = \frac{\widehat p - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} = \frac{0.95 - 0.5}{\sqrt{\frac{(0.50)(0.50)}{20}}} = 4.02\]
valor-de-p = \(P(Z \geq 4.02) = 0\)
Conclusão: Fixando \(\alpha=0.05\), rejeitamos a hipótese de que probabilidade de acertos é 50%.
Slides produzidos pelos professores:
Samara Kiihl
Tatiana Benaglia
Benilton Carvalho