tratamento estatístico de dados experimentais - conceitos...

1

Tratamento estatístico de dados experimentais - conceitos básicos

1 Incerteza associada a uma medição 2 Propagação de erros 3 Representação gráfica 4 Pequeno guia para criar gráficos 5 Regressão linear

2

Incerteza → é o parâmetro associado ao resultado de uma medição de uma grandeza física que caracteriza a dispersão de valores que podem ser atribuídos a essa grandeza

Erro → é a diferença entre o valor medido e o “valor verdadeiro” da grandeza em análise

1 Incerteza associada a uma medição

Todas as medidas estão afetadas de uma incerteza porque qualquer instrumento, por melhor que seja, tem uma escala e a expressão da medida real nessa escala implica sempre uma aproximação a medida exata

3

Uma régua comum, graduada em milímetros

1.1 Um exemplo com uma régua milimétrica

→ a extremidade do objeto está entre os valores 5 mm e 6 mm

l é o comprimento do objeto

5 < l < 6 (mm)

l = 6.0± 0.5 (mm)

Significa que podemos estar a cometer um erro máximo de 0.5 mm na nossa leitura

A este valor de 0.5 mm chamamos INCERTEZA INSTRUMENTAL

(0.5 mm é a metade da menor divisão da escala)

4

Agora vamos imaginar que a régua é bem grande e portanto temos uma escala mais ampliada e que por isso podemos perceber com mais clareza

Os valores medidos estão desviados de um quarto da menor divisão relativamente aos valores da escala.

•  A marca mais próxima é 6

•  Que o comprimento real não ultrapassa 6

As informações anteriores levam-nos a concluir que 5.5 < l < 6.0 (mm)

Portanto, a leitura deverá agora ser expressa como

l = 5.75 ± 0.25 (mm)

Note-se que neste caso o valor medido não coincide com os valores da escala (1,2,3,4,5,6,. . . )

5

1.2 A generalização do exemplo para a regra a seguir nas aulas

Regra 1: A incerteza associada a uma escala analógica corresponde a metade da sua menor divisão

Regra 1 (estendida): A incerteza associada a uma escala analógica pode ir até um quarto da sua menor divisão

O exemplo que foi referido na secção anterior poderia ser generalizado a qualquer escala analógica (uma escala contínua)

6

1.3 Escalas digitais

E quanto as escalas digitais, como nos cronómetros ou balanças digitais?

A diferença, é que não temos acesso ao meio da escala → escala descontínua

Pensemos, por exemplo, num cronómetro digital de segundos

Imaginemos que fazemos uma cronometragem que deu 5 s

5 < t < 6 s

Portanto poderíamos escrever como anteriormente: t = 5.5±0.5 s

→ mas há um problema adicional nas escalas digitais!

7

A calibração do ponto zero também e afetada pela incerteza da escala digital!

incerteza total = incerteza associada a medida + a incerteza associada a calibração do zero

(metade da menor divisão da escala) + (também metade da menor divisão da escala)

Voltando ao exemplo anterior, a leitura do tempo deverá ser então dada por

t = 5 ±1 s

Regra 2: A incerteza associada a uma escala digital corresponde a sua menor divisão

Regra 2 (estendida): A incerteza associada a uma escala digital pode considerar-se como sendo metade da sua menor divisão se pudermos desprezar as incertezas associadas a calibração do zero

8

1.4 O número de casas decimais de uma medida

Regra 3: O número de casas decimais (nCD) de uma medida deve ser igual ao número de casas decimais da incerteza instrumental

l = 3.0060 ± 0.0005 m Exemplos:

9

1.5 Algarismos significativos

O número de algarismos significativos (nAS) associado a uma dada medida é igual ao número de algarismos que têm realmente significado

→ esta definição quer dizer implicitamente que nem todos os algarismos têm significado

Casos em que um algarismo não conta (não é significativo)

Ø  Zeros a esquerda não contam:

→ o primeiro zero é redundante e não serve para nada - não é significativo

09 = 9

Ø  Zeros a direita não contam se apenas indicarem ordem de grandeza

Quando se diz que há 10 milhões de portugueses

→ este valor é apenas uma ordem de grandeza

Não quer dizer que 10000000 é o valor exato de portugueses

10

Mas suponhamos que o ultimo censo dava exatamente 10000000 - nem um a mais, nem um a menos. Como indicar que agora todos os zeros são significativos, porque derivados de uma contagem real?

(a) Zeros não significativos: 10000000 (sem ponto)

(b) Zeros significativos: 10000000. (com ponto)

Uma outra forma de justificar o ponto anterior (a) e notar que o número de portugueses se pode escrever aproximadamente

O único AS é o 1

7101×

Todos os outros zeros estão condensados na potência, a que não associamos nenhum AS

A resposta é: COLOCANDO UM PONTO DECIMAL NO FIM

→ potência de 10

11

Regra 4: Zeros a esquerda e zeros representativos de ordem de grandeza não são significativos. O primeiro AS conta por 2 se for ≥5.

12

1.6 Há relação entre o nCD e o nAS?

Se forem números em abstrato o nCD e o nAS são independentes entre si, mas para as medições, podemos dizer que há realmente uma relação entre eles

Exemplo: Um objeto com 3.25682(. . . ) m e medido em duas réguas: uma com escala milimétrica e outra com escala centimétrica.

Ø  A leitura na escala milimétrica será l = 3257.0 ± 0.5 mm. nCD=1 nAS=5

Escrevendo a leitura em cm, l = 325.70 ± 0.05 cm.

Ø  A leitura na escala centimétrica será l = 326.0 ± 0.5 cm. nCD=1 nAS=4

Para o mesmo objeto e medida, mudar de escala implica mudar de nAS

A escala determina o nCD →

nCD=2 nAS=5

o nCD determina o nAS

13

Exemplos:

14

1.7 Series de medidas

Para certas grandezas, normalmente fazemos uma série de medidas

Exemplo: Medição do tempo que uma esfera leva a deslizar sobre um plano inclinado

Resultados

Os tempos não são todos iguais porque há muitos fatores não controláveis a influenciar o resultado da medida: a sincronia da largada do corpo com o início da contagem, o tempo de reação do operador e a própria forma como o corpo e largado.

Tudo o que discutimos ate agora se referiu apenas a uma medida

15

Como representaremos este conjunto de dados?

Vamos supor que fizemos mil medições do tempo, para a mesma experiência.

Fazemos um histograma destas contagens considerando:

Ø  a classe 4.5 contém todas as repetições em que se observou t < 4.5 s

Ø  a classe 6.5 contem todos as repetições em que se observou 6.4 ≤ t s

Ø  a classe 4.6 contém todos as repetições em que se observou 4.5 ≤ t < 4.6 s

Ø  a classe 4.7 contem todos as repetições em que se observou 4.6 ≤ t < 4:7 s

Ø  . . .

Ø  a classe 6.4 contem todos as repetições em que se observou 6.3 ≤ t < 6.4 s

16

4.5 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6 6.1 6.2 6.3 6.4 6.5

Freq

uênc

ia ab

solu

ta

Classe de contagem do tempo em s

250

200

150

100

50

A classe mais observada é a classe 5.5, que corresponde a 5.4 ≤ t < 5.5 s → com cerca de 200 eventos observados

HISTOGRAMA

Depois seguem-se as classes 5.4 e 5.6 → com aproximadamente 170 eventos cada

17

As classes poderiam tornar-se tão estreitas quanto quiséssemos e acabaríamos por obter uma distribuição contínua.

18

DISTRIBUIÇÃO GAUSSIANA OU NORMAL

No nosso caso a distribuição contínua, está representada a vermelho

19

A distribuição Normal (ou Gaussiana ) é simétrica em torno do ponto µ, e que representa a média da distribuição

A forma do “sino” é definida pelo desvio padrão → σ

⎥⎦

⎤⎢⎣

⎡ −−

π= 2

20

0 2)(exp

2),,|(

σµx

σAσAxxN

A forma matemática da distribuição Normal é dada por:

→ representa o valor da função no ponto x

→ é a amplitude da função 0A

σ

µ

),,|( 0 σAxxN

20

Dos valores observados na medição

68% no intervalo ],[ σµσµ +− 95% no intervalo ]2,2[ σµσµ +−

99.7% no intervalo ]3,3[ σµσµ +−Por isso a forma ideal de caracterizar a medição é escrever:

x=µ ± σ

21

Ø  estimamos o valor de µ através do cálculo do valor médio

Para um número finito de medições (10 ou mais valores)

)(x

N

xx

N

ii∑

== 1 → N é o número de medições e é o conjunto das medidas }{ ix

( )

11

2

−

−=∑N

xxs

N

i

Ø  consideramos o desvio padrão (σ ) da amostra com sendo e que corresponde a

sxx ±=Escrevemos a medição na forma:

s

22

Regra 5: A representação de uma serie de medidas faz-se na forma em que é o valor médio da amostra * e s é o desvio padrão da amostra **, e Δx é a incerteza da escala.

Ø  Para uma medida individual apresentamos o resultado na forma

Podemos ter duas incertezas associadas às medidas

xxx Δ±= 0 ⎩⎨⎧

Δ escala a associada incerteza a é escala da valor o é 0

xx

Ø  Para uma série de medidas apresentamos o resultado na forma

sxx ±=⎩⎨⎧

aestatístic incerteza a é medidas das médio valor o é

sx

{ }sxxx ,max Δ±=

N

xx

N

ii∑

== 1 *( )

1 ** 1

2

−

−=∑N

xxs

N

i

x

23

Regra 6: Os valores da média e desvio padrão devem ser escritos com o mesmo nCD da incerteza instrumental. Em geral, quando se escreve uma medida na forma valor ± incerteza, o nCD do valor e da incerteza devem ser iguais.

Voltando às medições do tempo de deslizamento duma esfera sobre um plano inclinado

A medição deve apresentar-se na forma:

Note-se que para escrever o resultado final o valor de s foi comutado para o número de casas decimais da incerteza instrumental. Isto constitui a regra seguinte:

s 5422.5=x s 2513.0=s s 01.0=Δx

s 25.054.5 ±=t

24

2 Propagação de erros (ou propagação de incertezas)

Exemplo: Quero saber a área de um retângulo, de lados a e b. Se consideramos que cada lado do retângulo foi medido com uma régua diferente:

Esta incerteza pode ser calculada através da fórmula de propagação de incertezas (erros) que estudaremos a seguir

Δa é a incerteza de a

a

b

Δb é a incerteza de b

Qual será a incerteza ΔA da área A=ab ?

Muitas vezes precisamos calcular uma grandeza a partir de um conjunto de medidas de grandezas experimentais afetadas de incertezas. E depois será necessário quantificar a incerteza da grandeza calculada

A

25

MÉTODO PARA UTILIZAR NAS AULAS PRÁTICAS

2.3 Cálculo da incerteza associada a uma operação sobre medidas - caso xx«Δ

A GRANDEZA DEPENDE DE UMA VARIÁVEL

Queremos determinar a incerteza de uma grandeza G que é função de uma outra grandeza x:

De acordo com a expansão de Taylor podemos calcular o valor de f(x + Δx ) a partir do valor de f(x), se Δx « x ( que é o nosso caso).

f(x + Δx )= f(x)+ Δx f’(x) → Δx f’(x) =f(x + Δx )- f(x)

G=f(x)

A incerteza de x é Δx. Denominaremos de ΔG a incerteza de G

Aproximação de 1º ordem da série de Taylor:

→

→ Δx f’(x)= ΔGou xdxdGG Δ=Δ Δx = ΔG

dxdG

→

26

Exemplo 1. Cálculo da área do quadrado

Resultado da medição do lado do quadrado

m 5.00.5 ±=L⎩⎨⎧

=Δ

=

m 5.0m 0.5

LL

nAS=2

L

L222 m 255 === LA

xdxdGG Δ=Δ Cálculo de ΔV utilizando a expressão: → L

dLdAA Δ=Δ

22

m 55.00.522)( =××=Δ=Δ=Δ LLLdLdLA

2m 525±=A

27

Resultado da medição do diâmetro da esfera

Exemplo 2. Cálculo do volume de uma esfera a partir do valor do diâmetro.

mm 025.0015.3 ±=D

33

6234 DDV π

=⎟⎠

⎞⎜⎝

⎛π=

xdxdGG

GG

Δ=Δ=

Cálculo de ΔV utilizando a expressão:

⎩⎨⎧

=Δ

=

mm 025.0mm 015.3

DD

→ DdDdVV

DD

Δ=Δ=

3mm 36.035.14 ±=V nAS=4

nAS=4

28

2.4 Cálculo da incerteza associada a uma operação sobre medidas - caso de mais do que uma variável

A GRANDEZA DEPENDE DE MAIS DE UMA VARIÁVEL

Neste caso, para obter a incerteza ΔG, usamos uma generalização de

∂Para esse fim temos que utilizar a derivada parcial

xdxdGG Δ=Δ

( ) ( ) ( )22

22

2

2

21

2

1

nn

xxG.....x

xGx

xGG Δ⎟⎟

⎠

⎞⎜⎜⎝

⎛

∂

∂+Δ⎟⎟

⎠

⎞⎜⎜⎝

⎛

∂

∂+Δ⎟⎟

⎠

⎞⎜⎜⎝

⎛

∂

∂=Δ

),...,,( 21 nxxxfG =

mmm (ab)ba =→ que sabendo

As derivadas parciais são calculadas em nn xxxxxx === e , 2211

22

22

2

11

⎟⎟⎠

⎞⎜⎜⎝

⎛Δ

∂

∂+⎟⎟

⎠

⎞⎜⎜⎝

⎛Δ

∂

∂+⎟⎟

⎠

⎞⎜⎜⎝

⎛Δ

∂

∂=Δ n

n

xxG.....x

xGx

xGG ⇒

29

Exemplo 3 : Cálculo da incerteza da velocidade.

A velocidade depende de duas variáveis : o espaço x que tem uma incerteza Δx e o tempo t que tem uma incerteza Δt

txv =

Para calcular a incerteza da velocidade, Δv, utilizamos: 22

⎟⎠

⎞⎜⎝

⎛ Δ∂

∂+⎟

⎠

⎞⎜⎝

⎛ Δ∂

∂=Δ t

tvx

xvv

;0167.00.305.01)( 1

1

==Δ=Δ=Δ∂

∂=Δ

∂

∂ −−

xt

xtxxxtx

xv

1−= xtvou

2222.00.32)(22

21

−=−=−=−=∂

∂=

∂

∂ −−

txxt

txt

tv

cm 5.00.2 ±=x⎩⎨⎧

=Δ

=

cm 05.0cm 00.2

xx

s 1.00.3 ±=t⎩⎨⎧

=Δ

=

s 1.0s 0.3

tt

( ) ( ) 2228.02222.00167.0 22 =−+=Δ⇒ v

cm/s 7.0cm/s 6667.00.300.2

≈===txv

cm/s 2.07.0 ±=v

nAS=2

nAS=2

30

Exemplo 4 : Cálculo do volume de um cilindro a partir do valor do diâmetro e da altura do cilindro e da incerteza do volume.

h

hDπhDπV 22

42=⎟

⎠

⎞⎜⎝

⎛=

D

2

4DπA =

22

⎟⎠

⎞⎜⎝

⎛ Δ∂

∂+⎟

⎠

⎞⎜⎝

⎛ Δ∂

∂=Δ h

hVD

DVV

55778408.28203060153

2242

,,

=×

====∂

∂

======

π..hDππDhπDhDV

h,hDDhhDDhhDD

mm 025.0015.3 ±=D⎩⎨⎧

=Δ

=

mm 025.0mm 015.3

DD

mm 010.0030.6 ±=h⎩⎨⎧

=Δ

=

mm 011.0mm 030.6

hh

e

13944602.740153

44

22

,

2

,

====∂

∂

====

π.DππDhV

hhDDhhDD

nAS=4

nAS=4

31

h

D

2

4DπA =

Substituindo os valores na expressão acima

obtemos

3mm 718.0718250978.0 ≈=ΔV

22

⎟⎠

⎞⎜⎝

⎛ Δ∂

∂+⎟

⎠

⎞⎜⎝

⎛ Δ∂

∂=Δ h

hVD

DVV

( ) ( )22 011.013944602.7025.055778408.28 ×+×=ΔV

260061675744.0509716894.0 +=ΔV

3mm 72.005.43 ±=V3mm VVV Δ±=

05.430508595.434030.6015.3

4

22 ≈=

π×== hDπV nAS=4

nAS=4

32

3 Representação gráfica

3.1 Regras básicas para construir gráficos

33

Exemplo do que não se deve fazer num gráfico

34

3.2 Barras de erro

A barra de erro tem por amplitude o valor do desvio padrão amostra. Quando olhamos para um gráfico com barras de erro conseguimos visualizar a dispersão dos valores.

Por exemplo, para a primeira altura, h = 0.5m, os valores cronometrados variaram aproximadamente entre 0.28 e 0.36 s, com um valor medio a 0.32 s.

35

3.3 Linearização de gráficos

tratamento estatístico de dados experimentais - conceitos...

Documents