departamento de informática em saúde universidade federal de são paulo – unifesp unifesp teste...

12
Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Teste de Mann-Whitney Mann-Whitney Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II Apresentação: Alex E. J. F Métodos quantitativos aplicados em Informática em Saúde II Teste de Mann-Whitney 17 de setembro de 2007

Upload: internet

Post on 16-Apr-2015

106 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

Apresentação: Alex E. J. Falcão

Métodos quantitativos aplicados em Informática em Saúde II

Teste de Mann-Whitney

17 de setembro de 2007

Page 2: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

Agenda

Testes não paramétricos (U-test)

Perguntas

O teste de Mann-Whitney: Exemplo

O teste de Mann-Whitney

Page 3: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

Testes não paramétricos (U-test)

O termo não-paramétrico foi utilizado pela primeira vez por Wolfowitz em 1942;

Os testes estatísticos não-paramétricos foram desenvolvidos para serem utilizados em casos onde o pesquisador não possui informações sobre a variável de interesse;

Requerem pouca ou nenhuma informação sobre a população

Não confiam na estimação dos parâmetros (média ou desvio padrão);

•Podem ser chamados de testes parameter-free ou distribution-free.

Exemplos de testes não paramétricos:

• Chi-quadrado (2)

• Fisher

• Mann-Whitney

• Wilcoxon

• Kruskal-Wallis

• Friedman

Nonparametric Statistics. StatSoft, Inc. http://www.statsoft.com/textbook/stathome.html

Page 4: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

O teste Mann-Whitney

O teste de Mann-Withney é um teste não-paramétrico para duas amostras alternativo quando uma das três condições para o teste-t não for atendida.

Este teste tem como requisitos:

as duas amostras são independentes e randomicamente desenhadas;

a variável dependente seja contínua;

a medida das duas amostras tenha a propriedade de uma escala ordinal

(maior que, menor que ou igual) .

O teste de Mann-Whitney tem 2 métodos, sendo o primeiro é o mais utilizado e o segundo utilizado quando uma das amostras é muito pequena.

Page 5: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

O teste Mann-Whitney: exemplo

4.6 5.25.1 5.65.8 6.86.5 8.14.7 5.35.2 6.26.1 7.77.2 5.44.9 6.35.5 8.06.55.6 6.5

Grupo A Grupo B

Média

21 pessoas foram selecionadas para tratamento contra claustrofobia;

foram aleatoriamente separadas em 2 grupos, Na = 11 e Nb = 10;

o grupo A recebeu o tratamento A e o grupo B o tratamento B por 15 semanas;

a hipótese é que o tratamento A é mais eficiente;

no fim do experimento foram submetidos a um teste onde os avaliadores não sabiam a qual tratamento havia sido submetido e foram avaliados com notas de 1 (baixo) à 10 (alto).

O QUE VERIFICAR PARA APLICAR O TESTE?

as duas amostras são independentes e randomicamente retiradas da fonte?

ambas as amostras tem propriedades iguais a da fonte?

a população da fonte tem uma distribuição normal?

NÃO NORMAL5.5 6.5 7.5 8.5

0

1

2

3

4

5

6

7

Grupo A Grupo B

Page 6: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

O teste Mann-Whitney: exemplo

• Criar um ranking composto pelas 2 amostras

1. Separar as amostras e calcular a média e a soma;

• O máximo valor é dado por:

• Neste teste é calculado o valor U, dado pela diferença entre o T

max e o T

obs:

U observadoU

A = 176 – 96.5 = 79.5

UB = 165 – 134.5 = 30.5

U esperado:U

A = 176 – 121 = 55

UB = 165 – 110 = 55

Medida Rank Amostra4.6 1.0 A4.7 2.0 A4.9 3.0 A5.1 4.0 A5.2 5.5 A5.2 5.5 B5.3 7.0 B5.4 8.0 B5.5 9.0 A5.6 10.0 B5.8 11.0 A6.1 12.0 A6.2 13.0 B6.3 14.0 B6.5 15.5 A6.5 15.5 A6.8 17.0 B7.2 18.0 A7.7 19.0 B

4.6 5.2 1.0 5.54.7 5.3 2.0 7.04.9 5.4 3.0 8.05.1 5.6 4.0 10.05.2 6.2 5.5 13.05.5 6.3 9.0 14.05.8 6.8 11.0 17.06.1 7.7 12.0 19.06.5 8.0 15.5 20.06.5 8.1 15.5 21.07.2 18.0

Soma dos rankings 96.5 134.5 231.08.8 13.5 11.0

Grupo A Grupo B Grupo A Grupo B

Co

mb

inad

o A

& B

Média dos rankings

Ta = 96,5, Tb = 134,5 (Tobs)

Tab = N ( N + 1) = 231

2

Mab = N + 1 = 11

2

T Amax=nanb[ nana1]

2=176

T Bmax=nanb[nbnb1]

2=165

Page 7: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

O teste Mann-Whitney: exemplo

• A soma dos Us será sempre o produto da quantidade de elementos da amostra. U

A + U

B = n

A.n

B.

• Sendo a hipótese nula de U é dada por: UA = U

B = (n

A.n

B)/2 = 55, então se os valores de U

A

e UB são próximos de 55, não existe diferença entre os tratamentos

• Caso contrário, seria necessário calcular a possibilidades ranking.

1. Ou, verificar os valores críticos de U em uma tabela, ou utilizar um software e obter os valores de U.

N !N A! N B !

=21 !

11 ! .10 !=352716

Page 8: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

http://faculty.vassar.edu/lowry/utest.html

O teste Mann-Whitney: exemplo

• Os valores críticos de U obtidos em http://faculty.vassar.edu/lowry/utest.html, para este teste:

lower limit: 31 26 21

upper limit: 79 84 89

.90 .95 .98

.10 .05 .02

.05 .025 .01

1. Considerando a tendência de que o Tratamento A é inferior ao Tratamento B, observamos que Ua = 79.5 e Ub = 30.5, estão fora do intervalo, dizendo que os resultados estão 0.05 a favor da hipótese

2. Se considerarmos 95%, percebemos que estão dentro do intervalo, indicando que estão 0.05 contra a hipótese.

Intervalo de confiança

Contra o teste

A favor do teste

Page 9: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

Perguntas

Métodos quantitativos aplicados em Informática em Saúde II

Teste de Mann-Whitney

Alex E. J. Falcão

Page 10: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

O teste-t para amostras independentes

Por ser simples, direto, fácil de utilizar e se adaptar a diversas situações, o teste-t é o um dos mais utilizados e conhecidos testes estatísticos.

Porém, o teste-t para amostras independentes assume que:

as duas amostras são independentes e randomicamente retiradas da fonte;

ambas as amostras tem propriedades iguais a da fonte;

a população da fonte tem uma distribuição normal.

LOWRY, Richard. VassarStats. http://faculty.vassar.edu/lowry/VassarStats.html

Page 11: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

O teste-t para amostras independentes

Exemplo do teste-t:

30 estudantes de um colégio com características supostamente homogêneas separados aleatoriamente em 2 grupos;

40 tarefas mentais foram realizadas com cada grupo ouvindo músicas de tipos diferentes;

as propriedades das amostras são iguais a da fonte;

a hipótese nula é que as amostras tem valores sigficativamente diferentes

Grupo A Grupo B26 1826 2026 2021 2618 1721 2319 20

25 1623 2129 1822 2122 29

VERIFICAR

as duas amostras são independentes e randomicamente retiradas da fonte?

ambas as amostras tem propriedades iguais a da fonte?

a população da fonte tem uma distribuição normal?

Page 12: Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão ( falcao-pg@dis.epm.br

Departamento de Informática em SaúdeUniversidade Federal de São Paulo – UNIFESP

UNIFESP

Te

ste

de

Test

e de

Man

n-W

hit

ney

Man

n-W

hit

ney

Alex E. J. Falcão ( [email protected] ) - Métodos Quantitativos Aplicados em Informática em Saúde II

t-Test: Two-Sample Assuming Equal Variances

Grupo A Grupo BMean 23.13 20.87Variance 8.55 12.55Observations 15 15Pooled Variance 10.55Hypothesized Mean Difference 0

df 28t Stat 1.91P(T<=t) one-tail 0.03

Variância considerando as duas amostras

Indica a hipótese (0 - iguais, 1 diferentes)

df é o quantidade de elementos aleatórios que podem ser apresentados em uma situaçãoPara uma amostra df = N - 1 para duas df = (Na - 1)+(Nb - 1).Em geral quanto maior o df, mais próximo a distrinuição da amostra será da distribuição normal.

é Menor que 0,05, indicando ser significante a Hipótese. Interessante se a hipótese é

de B ser melhor que A

Indica o quanto o t Stat deve ser para ser siginificante.

Interessante se a hipótese é de B ser melhro que A

O teste-t para amostras independentes

Variancia da população estimada

NORMAL