departamento de informática em saúde universidade federal de são paulo – unifesp unifesp teste...
TRANSCRIPT
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
Apresentação: Alex E. J. Falcão
Métodos quantitativos aplicados em Informática em Saúde II
Teste de Mann-Whitney
17 de setembro de 2007
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
Agenda
Testes não paramétricos (U-test)
Perguntas
O teste de Mann-Whitney: Exemplo
O teste de Mann-Whitney
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
Testes não paramétricos (U-test)
O termo não-paramétrico foi utilizado pela primeira vez por Wolfowitz em 1942;
Os testes estatísticos não-paramétricos foram desenvolvidos para serem utilizados em casos onde o pesquisador não possui informações sobre a variável de interesse;
Requerem pouca ou nenhuma informação sobre a população
Não confiam na estimação dos parâmetros (média ou desvio padrão);
•Podem ser chamados de testes parameter-free ou distribution-free.
Exemplos de testes não paramétricos:
• Chi-quadrado (2)
• Fisher
• Mann-Whitney
• Wilcoxon
• Kruskal-Wallis
• Friedman
Nonparametric Statistics. StatSoft, Inc. http://www.statsoft.com/textbook/stathome.html
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
O teste Mann-Whitney
O teste de Mann-Withney é um teste não-paramétrico para duas amostras alternativo quando uma das três condições para o teste-t não for atendida.
Este teste tem como requisitos:
as duas amostras são independentes e randomicamente desenhadas;
a variável dependente seja contínua;
a medida das duas amostras tenha a propriedade de uma escala ordinal
(maior que, menor que ou igual) .
O teste de Mann-Whitney tem 2 métodos, sendo o primeiro é o mais utilizado e o segundo utilizado quando uma das amostras é muito pequena.
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
O teste Mann-Whitney: exemplo
4.6 5.25.1 5.65.8 6.86.5 8.14.7 5.35.2 6.26.1 7.77.2 5.44.9 6.35.5 8.06.55.6 6.5
Grupo A Grupo B
Média
21 pessoas foram selecionadas para tratamento contra claustrofobia;
foram aleatoriamente separadas em 2 grupos, Na = 11 e Nb = 10;
o grupo A recebeu o tratamento A e o grupo B o tratamento B por 15 semanas;
a hipótese é que o tratamento A é mais eficiente;
no fim do experimento foram submetidos a um teste onde os avaliadores não sabiam a qual tratamento havia sido submetido e foram avaliados com notas de 1 (baixo) à 10 (alto).
O QUE VERIFICAR PARA APLICAR O TESTE?
as duas amostras são independentes e randomicamente retiradas da fonte?
ambas as amostras tem propriedades iguais a da fonte?
a população da fonte tem uma distribuição normal?
NÃO NORMAL5.5 6.5 7.5 8.5
0
1
2
3
4
5
6
7
Grupo A Grupo B
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
O teste Mann-Whitney: exemplo
• Criar um ranking composto pelas 2 amostras
1. Separar as amostras e calcular a média e a soma;
• O máximo valor é dado por:
• Neste teste é calculado o valor U, dado pela diferença entre o T
max e o T
obs:
U observadoU
A = 176 – 96.5 = 79.5
UB = 165 – 134.5 = 30.5
U esperado:U
A = 176 – 121 = 55
UB = 165 – 110 = 55
Medida Rank Amostra4.6 1.0 A4.7 2.0 A4.9 3.0 A5.1 4.0 A5.2 5.5 A5.2 5.5 B5.3 7.0 B5.4 8.0 B5.5 9.0 A5.6 10.0 B5.8 11.0 A6.1 12.0 A6.2 13.0 B6.3 14.0 B6.5 15.5 A6.5 15.5 A6.8 17.0 B7.2 18.0 A7.7 19.0 B
4.6 5.2 1.0 5.54.7 5.3 2.0 7.04.9 5.4 3.0 8.05.1 5.6 4.0 10.05.2 6.2 5.5 13.05.5 6.3 9.0 14.05.8 6.8 11.0 17.06.1 7.7 12.0 19.06.5 8.0 15.5 20.06.5 8.1 15.5 21.07.2 18.0
Soma dos rankings 96.5 134.5 231.08.8 13.5 11.0
Grupo A Grupo B Grupo A Grupo B
Co
mb
inad
o A
& B
Média dos rankings
Ta = 96,5, Tb = 134,5 (Tobs)
Tab = N ( N + 1) = 231
2
Mab = N + 1 = 11
2
T Amax=nanb[ nana1]
2=176
T Bmax=nanb[nbnb1]
2=165
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
O teste Mann-Whitney: exemplo
• A soma dos Us será sempre o produto da quantidade de elementos da amostra. U
A + U
B = n
A.n
B.
• Sendo a hipótese nula de U é dada por: UA = U
B = (n
A.n
B)/2 = 55, então se os valores de U
A
e UB são próximos de 55, não existe diferença entre os tratamentos
• Caso contrário, seria necessário calcular a possibilidades ranking.
1. Ou, verificar os valores críticos de U em uma tabela, ou utilizar um software e obter os valores de U.
N !N A! N B !
=21 !
11 ! .10 !=352716
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
http://faculty.vassar.edu/lowry/utest.html
O teste Mann-Whitney: exemplo
• Os valores críticos de U obtidos em http://faculty.vassar.edu/lowry/utest.html, para este teste:
lower limit: 31 26 21
upper limit: 79 84 89
.90 .95 .98
.10 .05 .02
.05 .025 .01
1. Considerando a tendência de que o Tratamento A é inferior ao Tratamento B, observamos que Ua = 79.5 e Ub = 30.5, estão fora do intervalo, dizendo que os resultados estão 0.05 a favor da hipótese
2. Se considerarmos 95%, percebemos que estão dentro do intervalo, indicando que estão 0.05 contra a hipótese.
Intervalo de confiança
Contra o teste
A favor do teste
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
Perguntas
Métodos quantitativos aplicados em Informática em Saúde II
Teste de Mann-Whitney
Alex E. J. Falcão
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
O teste-t para amostras independentes
Por ser simples, direto, fácil de utilizar e se adaptar a diversas situações, o teste-t é o um dos mais utilizados e conhecidos testes estatísticos.
Porém, o teste-t para amostras independentes assume que:
as duas amostras são independentes e randomicamente retiradas da fonte;
ambas as amostras tem propriedades iguais a da fonte;
a população da fonte tem uma distribuição normal.
LOWRY, Richard. VassarStats. http://faculty.vassar.edu/lowry/VassarStats.html
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
O teste-t para amostras independentes
Exemplo do teste-t:
30 estudantes de um colégio com características supostamente homogêneas separados aleatoriamente em 2 grupos;
40 tarefas mentais foram realizadas com cada grupo ouvindo músicas de tipos diferentes;
as propriedades das amostras são iguais a da fonte;
a hipótese nula é que as amostras tem valores sigficativamente diferentes
Grupo A Grupo B26 1826 2026 2021 2618 1721 2319 20
25 1623 2129 1822 2122 29
VERIFICAR
as duas amostras são independentes e randomicamente retiradas da fonte?
ambas as amostras tem propriedades iguais a da fonte?
a população da fonte tem uma distribuição normal?
Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP
UNIFESP
Te
ste
de
Test
e de
Man
n-W
hit
ney
Man
n-W
hit
ney
Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II
t-Test: Two-Sample Assuming Equal Variances
Grupo A Grupo BMean 23.13 20.87Variance 8.55 12.55Observations 15 15Pooled Variance 10.55Hypothesized Mean Difference 0
df 28t Stat 1.91P(T<=t) one-tail 0.03
Variância considerando as duas amostras
Indica a hipótese (0 - iguais, 1 diferentes)
df é o quantidade de elementos aleatórios que podem ser apresentados em uma situaçãoPara uma amostra df = N - 1 para duas df = (Na - 1)+(Nb - 1).Em geral quanto maior o df, mais próximo a distrinuição da amostra será da distribuição normal.
é Menor que 0,05, indicando ser significante a Hipótese. Interessante se a hipótese é
de B ser melhor que A
Indica o quanto o t Stat deve ser para ser siginificante.
Interessante se a hipótese é de B ser melhro que A
O teste-t para amostras independentes
Variancia da população estimada
NORMAL