tratamento estatístico de dados experimentais - conceitos...
TRANSCRIPT
1
Tratamento estatístico de dados experimentais - conceitos básicos
1 Incerteza associada a uma medição 2 Propagação de erros 3 Representação gráfica 4 Pequeno guia para criar gráficos 5 Regressão linear
2
Incerteza → é o parâmetro associado ao resultado de uma medição de uma grandeza física que caracteriza a dispersão de valores que podem ser atribuídos a essa grandeza
Erro → é a diferença entre o valor medido e o “valor verdadeiro” da grandeza em análise
1 Incerteza associada a uma medição
Todas as medidas estão afetadas de uma incerteza porque qualquer instrumento, por melhor que seja, tem uma escala e a expressão da medida real nessa escala implica sempre uma aproximação a medida exata
3
Uma régua comum, graduada em milímetros
1.1 Um exemplo com uma régua milimétrica
→ a extremidade do objeto está entre os valores 5 mm e 6 mm
l é o comprimento do objeto
5 < l < 6 (mm)
l = 6.0± 0.5 (mm)
Significa que podemos estar a cometer um erro máximo de 0.5 mm na nossa leitura
A este valor de 0.5 mm chamamos INCERTEZA INSTRUMENTAL
(0.5 mm é a metade da menor divisão da escala)
4
Agora vamos imaginar que a régua é bem grande e portanto temos uma escala mais ampliada e que por isso podemos perceber com mais clareza
Os valores medidos estão desviados de um quarto da menor divisão relativamente aos valores da escala.
• A marca mais próxima é 6
• Que o comprimento real não ultrapassa 6
As informações anteriores levam-nos a concluir que 5.5 < l < 6.0 (mm)
Portanto, a leitura deverá agora ser expressa como
l = 5.75 ± 0.25 (mm)
Note-se que neste caso o valor medido não coincide com os valores da escala (1,2,3,4,5,6,. . . )
5
1.2 A generalização do exemplo para a regra a seguir nas aulas
Regra 1: A incerteza associada a uma escala analógica corresponde a metade da sua menor divisão
Regra 1 (estendida): A incerteza associada a uma escala analógica pode ir até um quarto da sua menor divisão
O exemplo que foi referido na secção anterior poderia ser generalizado a qualquer escala analógica (uma escala contínua)
6
1.3 Escalas digitais
E quanto as escalas digitais, como nos cronómetros ou balanças digitais?
A diferença, é que não temos acesso ao meio da escala → escala descontínua
Pensemos, por exemplo, num cronómetro digital de segundos
Imaginemos que fazemos uma cronometragem que deu 5 s
5 < t < 6 s
Portanto poderíamos escrever como anteriormente: t = 5.5±0.5 s
→ mas há um problema adicional nas escalas digitais!
7
A calibração do ponto zero também e afetada pela incerteza da escala digital!
incerteza total = incerteza associada a medida + a incerteza associada a calibração do zero
(metade da menor divisão da escala) + (também metade da menor divisão da escala)
Voltando ao exemplo anterior, a leitura do tempo deverá ser então dada por
t = 5 ±1 s
Regra 2: A incerteza associada a uma escala digital corresponde a sua menor divisão
Regra 2 (estendida): A incerteza associada a uma escala digital pode considerar-se como sendo metade da sua menor divisão se pudermos desprezar as incertezas associadas a calibração do zero
8
1.4 O número de casas decimais de uma medida
Regra 3: O número de casas decimais (nCD) de uma medida deve ser igual ao número de casas decimais da incerteza instrumental
l = 3.0060 ± 0.0005 m Exemplos:
9
1.5 Algarismos significativos
O número de algarismos significativos (nAS) associado a uma dada medida é igual ao número de algarismos que têm realmente significado
→ esta definição quer dizer implicitamente que nem todos os algarismos têm significado
Casos em que um algarismo não conta (não é significativo)
Ø Zeros a esquerda não contam:
→ o primeiro zero é redundante e não serve para nada - não é significativo
09 = 9
Ø Zeros a direita não contam se apenas indicarem ordem de grandeza
Quando se diz que há 10 milhões de portugueses
→ este valor é apenas uma ordem de grandeza
Não quer dizer que 10000000 é o valor exato de portugueses
10
Mas suponhamos que o ultimo censo dava exatamente 10000000 - nem um a mais, nem um a menos. Como indicar que agora todos os zeros são significativos, porque derivados de uma contagem real?
(a) Zeros não significativos: 10000000 (sem ponto)
(b) Zeros significativos: 10000000. (com ponto)
Uma outra forma de justificar o ponto anterior (a) e notar que o número de portugueses se pode escrever aproximadamente
O único AS é o 1
7101×
Todos os outros zeros estão condensados na potência, a que não associamos nenhum AS
A resposta é: COLOCANDO UM PONTO DECIMAL NO FIM
→ potência de 10
11
Regra 4: Zeros a esquerda e zeros representativos de ordem de grandeza não são significativos. O primeiro AS conta por 2 se for ≥5.
12
1.6 Há relação entre o nCD e o nAS?
Se forem números em abstrato o nCD e o nAS são independentes entre si, mas para as medições, podemos dizer que há realmente uma relação entre eles
Exemplo: Um objeto com 3.25682(. . . ) m e medido em duas réguas: uma com escala milimétrica e outra com escala centimétrica.
Ø A leitura na escala milimétrica será l = 3257.0 ± 0.5 mm. nCD=1 nAS=5
Escrevendo a leitura em cm, l = 325.70 ± 0.05 cm.
Ø A leitura na escala centimétrica será l = 326.0 ± 0.5 cm. nCD=1 nAS=4
Para o mesmo objeto e medida, mudar de escala implica mudar de nAS
A escala determina o nCD →
nCD=2 nAS=5
o nCD determina o nAS
13
Exemplos:
14
1.7 Series de medidas
Para certas grandezas, normalmente fazemos uma série de medidas
Exemplo: Medição do tempo que uma esfera leva a deslizar sobre um plano inclinado
Resultados
Os tempos não são todos iguais porque há muitos fatores não controláveis a influenciar o resultado da medida: a sincronia da largada do corpo com o início da contagem, o tempo de reação do operador e a própria forma como o corpo e largado.
Tudo o que discutimos ate agora se referiu apenas a uma medida
15
Como representaremos este conjunto de dados?
Vamos supor que fizemos mil medições do tempo, para a mesma experiência.
Fazemos um histograma destas contagens considerando:
Ø a classe 4.5 contém todas as repetições em que se observou t < 4.5 s
Ø a classe 6.5 contem todos as repetições em que se observou 6.4 ≤ t s
Ø a classe 4.6 contém todos as repetições em que se observou 4.5 ≤ t < 4.6 s
Ø a classe 4.7 contem todos as repetições em que se observou 4.6 ≤ t < 4:7 s
Ø . . .
Ø a classe 6.4 contem todos as repetições em que se observou 6.3 ≤ t < 6.4 s
16
4.5 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6 6.1 6.2 6.3 6.4 6.5
Freq
uênc
ia ab
solu
ta
Classe de contagem do tempo em s
250
200
150
100
50
A classe mais observada é a classe 5.5, que corresponde a 5.4 ≤ t < 5.5 s → com cerca de 200 eventos observados
HISTOGRAMA
Depois seguem-se as classes 5.4 e 5.6 → com aproximadamente 170 eventos cada
17
As classes poderiam tornar-se tão estreitas quanto quiséssemos e acabaríamos por obter uma distribuição contínua.
18
DISTRIBUIÇÃO GAUSSIANA OU NORMAL
No nosso caso a distribuição contínua, está representada a vermelho
19
A distribuição Normal (ou Gaussiana ) é simétrica em torno do ponto µ, e que representa a média da distribuição
A forma do “sino” é definida pelo desvio padrão → σ
⎥⎦
⎤⎢⎣
⎡ −−
π= 2
20
0 2)(exp
2),,|(
σµx
σAσAxxN
A forma matemática da distribuição Normal é dada por:
→ representa o valor da função no ponto x
→ é a amplitude da função 0A
σ
µ
),,|( 0 σAxxN
20
Dos valores observados na medição
68% no intervalo ],[ σµσµ +− 95% no intervalo ]2,2[ σµσµ +−
99.7% no intervalo ]3,3[ σµσµ +−Por isso a forma ideal de caracterizar a medição é escrever:
x=µ ± σ
21
Ø estimamos o valor de µ através do cálculo do valor médio
Para um número finito de medições (10 ou mais valores)
)(x
N
xx
N
ii∑
== 1 → N é o número de medições e é o conjunto das medidas }{ ix
( )
11
2
−
−=∑N
xxs
N
i
Ø consideramos o desvio padrão (σ ) da amostra com sendo e que corresponde a
sxx ±=Escrevemos a medição na forma:
s
22
Regra 5: A representação de uma serie de medidas faz-se na forma em que é o valor médio da amostra * e s é o desvio padrão da amostra **, e Δx é a incerteza da escala.
Ø Para uma medida individual apresentamos o resultado na forma
Podemos ter duas incertezas associadas às medidas
xxx Δ±= 0 ⎩⎨⎧
Δ escala a associada incerteza a é escala da valor o é 0
xx
Ø Para uma série de medidas apresentamos o resultado na forma
sxx ±=⎩⎨⎧
aestatístic incerteza a é medidas das médio valor o é
sx
{ }sxxx ,max Δ±=
N
xx
N
ii∑
== 1 *( )
1 ** 1
2
−
−=∑N
xxs
N
i
x
23
Regra 6: Os valores da média e desvio padrão devem ser escritos com o mesmo nCD da incerteza instrumental. Em geral, quando se escreve uma medida na forma valor ± incerteza, o nCD do valor e da incerteza devem ser iguais.
Voltando às medições do tempo de deslizamento duma esfera sobre um plano inclinado
A medição deve apresentar-se na forma:
Note-se que para escrever o resultado final o valor de s foi comutado para o número de casas decimais da incerteza instrumental. Isto constitui a regra seguinte:
s 5422.5=x s 2513.0=s s 01.0=Δx
s 25.054.5 ±=t
24
2 Propagação de erros (ou propagação de incertezas)
Exemplo: Quero saber a área de um retângulo, de lados a e b. Se consideramos que cada lado do retângulo foi medido com uma régua diferente:
Esta incerteza pode ser calculada através da fórmula de propagação de incertezas (erros) que estudaremos a seguir
Δa é a incerteza de a
a
b
Δb é a incerteza de b
Qual será a incerteza ΔA da área A=ab ?
Muitas vezes precisamos calcular uma grandeza a partir de um conjunto de medidas de grandezas experimentais afetadas de incertezas. E depois será necessário quantificar a incerteza da grandeza calculada
A
25
MÉTODO PARA UTILIZAR NAS AULAS PRÁTICAS
2.3 Cálculo da incerteza associada a uma operação sobre medidas - caso xx«Δ
A GRANDEZA DEPENDE DE UMA VARIÁVEL
Queremos determinar a incerteza de uma grandeza G que é função de uma outra grandeza x:
De acordo com a expansão de Taylor podemos calcular o valor de f(x + Δx ) a partir do valor de f(x), se Δx « x ( que é o nosso caso).
f(x + Δx )= f(x)+ Δx f’(x) → Δx f’(x) =f(x + Δx )- f(x)
G=f(x)
A incerteza de x é Δx. Denominaremos de ΔG a incerteza de G
Aproximação de 1º ordem da série de Taylor:
→
→ Δx f’(x)= ΔGou xdxdGG Δ=Δ Δx = ΔG
dxdG
→
26
Exemplo 1. Cálculo da área do quadrado
Resultado da medição do lado do quadrado
m 5.00.5 ±=L⎩⎨⎧
=Δ
=
m 5.0m 0.5
LL
nAS=2
L
L222 m 255 === LA
xdxdGG Δ=Δ Cálculo de ΔV utilizando a expressão: → L
dLdAA Δ=Δ
22
m 55.00.522)( =××=Δ=Δ=Δ LLLdLdLA
2m 525±=A
27
Resultado da medição do diâmetro da esfera
Exemplo 2. Cálculo do volume de uma esfera a partir do valor do diâmetro.
mm 025.0015.3 ±=D
33
6234 DDV π
=⎟⎠
⎞⎜⎝
⎛π=
xdxdGG
GG
Δ=Δ=
Cálculo de ΔV utilizando a expressão:
⎩⎨⎧
=Δ
=
mm 025.0mm 015.3
DD
→ DdDdVV
DD
Δ=Δ=
3mm 36.035.14 ±=V nAS=4
nAS=4
28
2.4 Cálculo da incerteza associada a uma operação sobre medidas - caso de mais do que uma variável
A GRANDEZA DEPENDE DE MAIS DE UMA VARIÁVEL
Neste caso, para obter a incerteza ΔG, usamos uma generalização de
∂Para esse fim temos que utilizar a derivada parcial
xdxdGG Δ=Δ
( ) ( ) ( )22
22
2
2
21
2
1
nn
xxG.....x
xGx
xGG Δ⎟⎟
⎠
⎞⎜⎜⎝
⎛
∂
∂+Δ⎟⎟
⎠
⎞⎜⎜⎝
⎛
∂
∂+Δ⎟⎟
⎠
⎞⎜⎜⎝
⎛
∂
∂=Δ
),...,,( 21 nxxxfG =
mmm (ab)ba =→ que sabendo
As derivadas parciais são calculadas em nn xxxxxx === e , 2211
22
22
2
11
⎟⎟⎠
⎞⎜⎜⎝
⎛Δ
∂
∂+⎟⎟
⎠
⎞⎜⎜⎝
⎛Δ
∂
∂+⎟⎟
⎠
⎞⎜⎜⎝
⎛Δ
∂
∂=Δ n
n
xxG.....x
xGx
xGG ⇒
29
Exemplo 3 : Cálculo da incerteza da velocidade.
A velocidade depende de duas variáveis : o espaço x que tem uma incerteza Δx e o tempo t que tem uma incerteza Δt
txv =
Para calcular a incerteza da velocidade, Δv, utilizamos: 22
⎟⎠
⎞⎜⎝
⎛ Δ∂
∂+⎟
⎠
⎞⎜⎝
⎛ Δ∂
∂=Δ t
tvx
xvv
;0167.00.305.01)( 1
1
==Δ=Δ=Δ∂
∂=Δ
∂
∂ −−
xt
xtxxxtx
xv
1−= xtvou
2222.00.32)(22
21
−=−=−=−=∂
∂=
∂
∂ −−
txxt
txt
tv
cm 5.00.2 ±=x⎩⎨⎧
=Δ
=
cm 05.0cm 00.2
xx
s 1.00.3 ±=t⎩⎨⎧
=Δ
=
s 1.0s 0.3
tt
( ) ( ) 2228.02222.00167.0 22 =−+=Δ⇒ v
cm/s 7.0cm/s 6667.00.300.2
≈===txv
cm/s 2.07.0 ±=v
nAS=2
nAS=2
30
Exemplo 4 : Cálculo do volume de um cilindro a partir do valor do diâmetro e da altura do cilindro e da incerteza do volume.
h
hDπhDπV 22
42=⎟
⎠
⎞⎜⎝
⎛=
D
2
4DπA =
22
⎟⎠
⎞⎜⎝
⎛ Δ∂
∂+⎟
⎠
⎞⎜⎝
⎛ Δ∂
∂=Δ h
hVD
DVV
55778408.28203060153
2242
,,
=×
====∂
∂
======
π..hDππDhπDhDV
h,hDDhhDDhhDD
mm 025.0015.3 ±=D⎩⎨⎧
=Δ
=
mm 025.0mm 015.3
DD
mm 010.0030.6 ±=h⎩⎨⎧
=Δ
=
mm 011.0mm 030.6
hh
e
13944602.740153
44
22
,
2
,
====∂
∂
====
π.DππDhV
hhDDhhDD
nAS=4
nAS=4
31
h
D
2
4DπA =
Substituindo os valores na expressão acima
obtemos
3mm 718.0718250978.0 ≈=ΔV
22
⎟⎠
⎞⎜⎝
⎛ Δ∂
∂+⎟
⎠
⎞⎜⎝
⎛ Δ∂
∂=Δ h
hVD
DVV
( ) ( )22 011.013944602.7025.055778408.28 ×+×=ΔV
260061675744.0509716894.0 +=ΔV
3mm 72.005.43 ±=V3mm VVV Δ±=
05.430508595.434030.6015.3
4
22 ≈=
π×== hDπV nAS=4
nAS=4
32
3 Representação gráfica
3.1 Regras básicas para construir gráficos
33
Exemplo do que não se deve fazer num gráfico
34
3.2 Barras de erro
A barra de erro tem por amplitude o valor do desvio padrão amostra. Quando olhamos para um gráfico com barras de erro conseguimos visualizar a dispersão dos valores.
Por exemplo, para a primeira altura, h = 0.5m, os valores cronometrados variaram aproximadamente entre 0.28 e 0.36 s, com um valor medio a 0.32 s.
35
3.3 Linearização de gráficos