simulaÇÃo e tratamento de sinaiselicardo.com/fisica4/3modelofisicodosom.pdf · onde além dos...
TRANSCRIPT
SIMULAÇÃO E TRATAMENTO DE SINAIS SONOROS USANDO OCTAVE
Um livro de:
Elicardo Alves de Souza Gonçalves Rudi Garrido da Costa Lima
Fabrício Luciano da Silva Profilo Lucas da Costa de Souza
Miguel Ângelo Oliveira Martins Caio da Silva Nápole Rodrigues
3 - MODELOS FÍSICOS PARA O SOM 3.1 – ONDAS No contexto mais geral, ondas são perturbações que se propagam no espaço
sem que haja propagação equivalente de matéria. Isso significa que a energia
se desloca de alguma forma que não precise ser transportada por partículas
ou moléculas. Em casos mais particulares e em situações mais específicas,
uma única perturbação é chamada de pulso e onda é a denominação de
sequência regular destes.
A natureza destas ondas é uma distinção importante. Os tipos mais comuns
são as ondas eletromagnéticas e as ondas mecânicas. Ondas
eletromagnéticas se manifestam pela oscilação de campos magnéticos e
elétricos, que se propagam no vácuo ou em diversos outros meios. Esse tipo
engloba ondas de raio, TV, micro-ondas, raios gama, raios-X, infravermelho,
ultravioleta e a própria luz.
Ondas mecânicas, como o próprio nome sugere, se manifestam pela
pertubação mecânica que se propaga em algum material ou meio físico. Esse
tipo de onda engloba vibrações dos mais diversos tipos, ultrassom, ondas do
mar (e demais ondas na superfície da água), e também o som.
Figura 3.1 – A propagação do som é caracterizada pela propagação de zonas de compressão e descompressão.
A propagação pode ser em uma, duas ou três dimensões, dependendo de sua
natureza e do meio onde se propaga. Um exemplo de uma onda se
propagando em uma única direção é uma perturbação feita em uma corda
esticada. Em duas dimensões, podemos pensar na superfície de uma dada
quantidade de água, como um pequeno lago ou mesmo uma grande bacia,
sendo perturbada pela queda de um objeto.
Figura 3.2: onda unidimensional se propagando em uma corda (cima) e onda bidimensional como as que se propagam na superfície de um líquido (baixo).
Em três dimensões, não existem exemplos em que a evolução das
propagações seja visíveis aos nossos olhos, mas exemplos em que podemos
entendê-las conceitualmente em todas as direções. Um deles é o próprio som:
é possível imaginar a propagação em três dimensões a partir do momento em
que, sem obstáculos, uma fonte sonora comum, como a queda de um objeto
no chão, pode ser ouvida em qualquer direção. Ondas eletromagnéticas
também apresentam essa manifestação tridimensional, e uma fonte pontual
de luz, por exemplo, pode ser vista de todas as direções. Grande parte das
ondas tridimensionais são isotrópicas, ou seja, não tem preferência por uma
dada direção, sendo iguais em todas elas. Nestes casos, um pulso de onda
tridimensional pode ser imaginado como uma bolha esférica que nasce na
fonte da onda, e cresce igualmente em todas as dimensões. Uma sequência
desses pulsos seria, dessa forma, um conjunto de bolhas concêntricas de
raios diferentes, onde a mais externa seria a primeira a ser emitida, e a mais
interna a última.
Figura 3.3: Emissão tridimensional como “bolhas” centradas na fonte.
Caso a fonte ou a propagação seja anisotrópica, essas bolhas não seriam
perfeitamente esféricas, demonstrando preferência por uma determinada
direção.
Uma outra classificação importante nos diversos tipos de onda seria quanto a
sua direção de oscilação. Enquanto algumas manifestações ondulatórias têm
oscilações em direções perpendiculares à direção de propagação, sendo
chamadas de ondas transversais, outras oscilam no mesmo sentido da
propagação, e por causa disto são denominadas ondas longitudinais. Ondas
eletromagnéticas são essencialmente transversais, enquanto ondas sonoras
se propagando no ar são longitudinais.
3.2 – Características de uma onda.
Independente da natureza, da direção e da dimensionalidade uma onda
específica pode ser caracterizada por diversos parâmetros. Dentre os mais
importantes estão a frequência, o período, a amplitude, a velocidade, a fase o
formato e o comprimento
A frequência é uma característica de muitas manifestações da natureza, e
normalmente diz respeito ao número de repetições em um determinado
intervalo de tempo. No caso das ondas, a melhor maneira para defini-la é
tomar um ponto no espaço por onde a onda passa, e tomar nota da quantidade
de ciclos repetidos esse ponto sofrerá por segundo.
Para ser mais claro, é possível tomar como exemplo uma onda unidimensional
que se propaga ao longo de uma corda esticada. Um determinado ponto desta
corda sofrerá diversos ciclos de oscilação em um intervalo de tempo. O se
dividir o número de oscilações pelo intervalo tempo, é encontrado o valor da
frequência.
Figura 3.4: Um ponto de uma corda onde passa uma onda com frequência f terá oscilações com a mesma frequência.
No sistema internacional de medidas, esse intervalo de tempo é medido em
segundos, ou seja, a frequência é dada em ciclos por segundo (s-1) que
também é denominado Hertz (Hz). Isso não significa que não se possa usar
outras unidades de tempo para medir a frequência, apenas que esta é o
padrão. Outras unidades como o número de ciclos (ou rotações, ou voltas, ou
repetições) por minutos, por hora, por dia, por semana, por mês ou qualquer
outra unidade de tempo. Em casos de ciclos senoidais, onde a oscilação
apresenta uma analogia com movimentos circulares, é comum encontrar a
frequência caracterizada pelo valor de parte de uma rotação (uma medida de
ângulo) por segundo. Esta é conhecida como frequência angular. O ângulo é
medido em Radianos (rad), onde uma volta completa (um ciclo completo) C é
dado por:
C = 2π rad
Dessa forma, a frequência natural f está associada à frequência angular ω
pela seguinte relação matemática:
ω = 2π f
No caso das ondas, a frequência é uma propriedade herdada da fonte. Isto
significa que é a fonte quem define qual será a frequência da onda. Se
voltarmos ao exemplo da onda em uma corda, supondo que os pulsos de
ondas são gerados por uma pessoa que segura a corda em sua extremidade,
fazendo-a oscilar, a frequência de oscilação da mão da pessoa será a
frequência de oscilação de cada ponto da corda, e consequentemente, a
frequência que caracteriza a onda.
O período seria exatamente o inverso da frequência. Enquanto a primeira
mede o número de repetições por tempo, o período mede o tempo levado para
uma determinada repetição. Se por exemplo, uma determinada frequência for
igual a 2Hz, isso significa dois ciclos a cada segundo. Nesse caso, cada
segundo seria igual a 0,5 segundos, ou seja, o período é igual a meio segundo.
É razoável notar que existe uma relação entre período T e a frequência f, dada
por:
𝑇 =1
𝑓
A amplitude está relacionada com o tamanho máximo que a grandeza física
relacionada à onda consegue chegar em cada oscilação. No caso de ondas
mecânicas unidimensionais como em uma corda, este seria o tamanho do
deslocamento de cada ponto da corda ao oscilar; no caso de ondas na água,
a amplitude seria a altura destas ondas; no caso de ondas eletromagnéticas
está relacionada ao valor máximo de campo elétrico e magnético. Na prática,
a intensidade da luz, a força da onda do mar e o volume do som estão
relacionados à amplitude da onda.
A velocidade está relacionada ao meio e a alguns de seus parâmetros. Ao
mudar o meio a velocidade de propagação também muda. Isso traz algumas
consequências como refração, difração e reflexão.
A fase está ligada com a posição onde a oscilação começa. Como é possível
observar, é indicada pela fonte. Ondas iguais com fases diferentes
apresentarão “deslocamentos” uma em relação a outra. A fase está
relacionada a fenômenos como interferência e a ressonância.
Figura 3.5: Três ondas com mesma amplitude, comprimento e frequência, mas com fases diferentes.
O formato de uma onda normalmente está relacionado tanto a fonte de
emissão quanto ao meio. O modo de oscilar da fonte “desenha” a forma da
onda, e a velocidade com que esta se propaga estica om comprime esta forma,
criando o formato final. É possível entender a relação da oscilação da fonte
com a forma imaginando, no caso da corda, que o modo como a mão se move
desenhará a onda. É o mesmo que acontece na saída de um antigo sismógrafo,
onde o movimento da agulha desenha o sinal em um papel que passa por ela.
Figura 3.6: Representação de um antigo sismógrafo: O movimento da agulha as o desenho ao longo do papel, análogo ao que acontece com a oscilação
da fonte e a onda.
O comprimento de onda, ou tamanho de onda é parte de seu formato. É,
dentro de uma mesma onda, a distância entre duas repetições (dois pulsos ou
ciclos). Assim como o formato, é dependente tanto do meio quanto da fonte.
O comprimento de onda está ligado a frequência e a velocidade através da equação
fundamental da ondulatória:
v = λf
3.3 – Ondas senoidais
Grande parte das ondas têm formato senoidal, ou seja, tem o formato de um
gráfico de uma função seno ou cosseno. Esses casos acontecem quando a
oscilação da fonte é característica de uma oscilação harmônica. A oscilação
harmônica é caracterizada pela seguinte equação:
𝐴(𝑡) = 𝐴0cos(𝜔𝑡 + 𝜑)
Onde A(t) é a amplitude num determinado instante t, A0 é a amplitude máxima,
ω é o valor da frequência angular, e φ é a fase. A oscilação harmônica
acontece principalmente por causa de forças restauradoras, que fazem com
que um sistema, deslocado de sua posição de equilíbrio, volte a ele. Isto faz
com que grande parte das oscilações, e consequentemente, as ondas criadas,
tenham no deslocamento inicial sua amplitude máxima, fazendo com que a
fase φ seja igual a zero.
Quando a fonte é caracterizada dessa forma, e anda no meio com velocidade
v, a equação da onda no tempo t e no espaço x pode ser dada por:
𝐴(𝑡) = 𝐴0cos(𝑘𝑥 + 𝜔𝑡 + 𝜑)
Onde além dos parâmetros da oscilação harmônica, o valor da amplitude é
dependente do número de onda k, que é dado por
𝑘 =1
𝜆
Sendo λ o comprimento de onda.
Note que A(t) é uma função de duas variáveis: x e t. E que, a menos dos
parâmetros k e ω, essas duas variáveis matematicamente são análogas pata
o valor de A(t).
Figura 3.7: Gráfico tridimensional da amplitude de uma onda em função do tempo t e da posição x.
Normalmente para estudos dessa função, transforma-se uma das variáveis em
constante, vendo comportamento da outra. Transformar t em constante seria
como congelar a onda em um determinado instante para ser seu
comportamento ao longo do espaço; transformar x em constante seria estudar
o movimento, ao longo do tempo, de um único ponto desta onda e suas
oscilações.
3.4 – O som
O som é um tipo específico de onda mecânica que se propaga no espaço
principalmente (mas não somente) através do ar. Trata-se da propagação de
frentes de compressão, sendo a pressão a grandeza que oscila ao longo do
tempo.
O ouvido humano é capaz de ouvir ondas mecânicas deste tipo num espectro
de frequência que vai de 20 Hz até 20000 Hz. Alguns animais têm espectros
em diferentes janelas, fazendo com que alguns sons sejam percebidos por
eles e não por nós e vice-versa. Mas numa definição mais conservadora, pode-
se limitar a caracterização do que é som como o que se encaixa dentro da
janela de percepção humana.
A captura do som é feita pelo ouvido, nos vertebrados. Resumidamente, nele
existe uma membrana sensível a vibrações sonoras, o tímpano e uma
estrutura de transmissão dessas vibrações mecânicas até uma região
chamada cóclea, onde células sensíveis específicas transformarão essas
vibrações em sinais elétricos distinguindo a frequência e a amplitude do som.
Análogo a isto, a captura de sons para transmissão, armazenamento,
reprodução e/ou análise elétrica/eletrônica é feita convertendo-se as vibrações
sonoras em sinal elétrico. Como toda conversão, ela não é extremamente fiel
ao sinal de entrada, sendo mais eficiente em determinadas frequências e/ou
intensidades do que em outras. Isso faz o sinal sonoro sofrer alterações ao ser
captado, como será mostrado mais à frente.
3.5 – Características do Som
3.5.1 – Frequência, altura, velocidade e comprimento de onda.
As características de ondas mecânicas se refletem em manifestações
conhecidas no som. A altura (não confundir com volume), por exemplo, que
indica o quão grave ou agudo é um som, está relacionado à frequência da
onda. Dessa forma, cada nota musical tem um valor característico, em hertz.
A nota musical padrão é o La 3 (na classificação brasileira) de 440 Hz. Como
frequência é uma característica herdada da fonte sonora, independente da
velocidade de propagação do som, a frequência é a mesma. A velocidade, por
sua vez, é dependente do meio e de suas condições. Sabe-se por exemplo,
que a velocidade de propagação do som no ar gira em torno de 331 m/s nas
condições normais pressão e temperatura, enquanto o mesmo som na água
se propagaria com velocidade de 1435 m/s. Esses valores ainda variam de
acordo com fatores como composição química do meio, densidade,
temperatura entre outros. Por causa da equação fundamental da ondulatória,
é possível dizer que o comprimento de onda depende tanto da fonte quanto
do meio.
3.5.2 – Amplitude, Intensidade sonora, volume e nível de intensidade
A onda sonora se propagando no ar é essencialmente uma onda que se
propaga tridimensionalmente e é possível ser imaginada como bolhas saindo
da fonte sonora, e na maior parte das vezes, crescendo isotropicamente. O
esforço de uma fonte ao emitir som é usualmente medido em unidades de
energia por tempo, o que dá a grandeza de potência. Ao se propagar em três
dimensões, essa potência emitida pela fonte é diluída ao longo da área da
“bolha” de emissão. Ou seja, a intensidade a fonte sonora é caracterizada pela
potência de emissão, cuja unidade padrão é o watt (w). Diferente disto,
intensidade da onda sonora é caracterizada pela razão da potência pela área
abrangida, e é medida em watt por metro quadrado (w/m2). Esta é a unidade
da amplitude das ondas sonoras e é o que caracterizará o volume do som que
ouvimos.
É importante notar que nossos ouvidos têm uma determinada área padrão, e
ao caracterizarmos o som que ouvimos, este também será medido em watts.
Como a área depende do raio, que é basicamente a distância da fonte até a
borda da “bolha”, onde estaria uma região ou objeto afetado (como os ouvidos
de uma pessoa, por exemplo), é possível imaginar que quanto mais distante a
fonte deste objeto, maior a área, mais diluída a intensidade e menor a
intensidade sentida pelo próprio objeto.
A área A de uma bolha esférica é dada por:
𝐴 = 𝜋𝑟2
Onde r é o raio, ou a distância. Isso significa é a intensidade sentida por um
determinado objeto é inversamente proporcional ao quadrado da distância
até a fonte.
Figura 3.8: A uma distância d, um objeto O com área A é afetado por uma determinada potência. A uma distância 2d essa mesma potência afeta uma área quadro vezes maior, ou seja, o mesmo objeto O, que obre um quarto
dessa região é afetado por um quatro da potência. Dobra-se a distância, e a potência decresce de um fator de 22. É um exemplo clássico de como
funciona a lei do inverso do quadrado da distância.
Nossos ouvidos, e todos os dispositivos capazes de detectar sons são
sensíveis a uma ampla faixa de intensidades, e, por causa disto, é comum o
som ser caracterizado pelo nível de intensidade: uma escala com variação
numérica muito menor.
O nível de intensidade β pode ser dado por
𝛽 = log(𝐼
𝐼0)
Onde I é a intensidade detectada pelo instrumento ou ouvido e I0 é uma
grandeza padrão, definida como a menor intensidade ouvida pelo ouvido
humano:
I0 = 10-12 w/m2
A unidade do nível de intensidade é o bel, representado pela letra B. Ele é
mais conhecido na sua subunidade dez vezes menor, o decibel (dB). Para
achar β em decibéis, a equação fica:
𝛽 = 10log(𝐼
𝐼0)
3.5.3 – Formato da onda, timbre e teorema de Fourier
O formato de uma onda está estritamente ligado ao seu timbre. Desta forma,
ao ouvirmos a mesma nota musical em diversos instrumentos diferentes,
conseguimos diferenciá-los. O formato em si, é criado pela forma de oscilar da
fonte sonora.
Figura 3.9 – Diferentes timbres e seus respectivos formatos de onda.
Graças ao teorema de Fourier, e às operações matemáticas correspondentes,
todo sinal sonoro poderá ser visto como uma soma de senóides, simplificando
sua matematização e sua simulação.
Se tivéssemos um sinal infinito (ou muito grande) de uma nota em um
determinado timbre, seria fácil decompô-la em uma soma de senoide; mas na
prática o sinal é ruidoso e é periódico apenas por um tempo, visto que o som
de uma nota é finita e não muito grande para os padrões de repetição. Visto
isso, o ideal seria encontrar as frequências em uma determinada nota em um
timbre aplicando a transformada de Fourier.
Na prática a diferença entre a transformada contínua e discreta (em série) será
o erro associado. Enquanto o sinal perfeitamente periódico é transformado em
valores perfeitos e discretos, na transformada é possível também ver esses
valores, mas dentro de uma variação estatística, que se encaixa muito bem no
modelo gaussiano.
Figura 3.10: Série de Fourier para um sinal periódico ideal (esquerda) e transformada de Fourier de um exemplo equivalente, em situações reais. A
largura da transformada de Fourier está associada a um erro relativo
3.6 – Propriedades do som digital
Até o momento foram apresentadas as características físicas e os modelos
para representá-las. Mas o som representado digitalmente tem algumas
características intrínsecas ao processo de digitalização ou criação virtual.
Dentre as mais importantes estão a amostragem e a profundidade.
O armazenamento do sinal sonoro na forma digital é feita através de
sequências numéricas. Essas sequências representam o valor da amplitude
no detector (e/ou no emissor) em cada intervalo regular de tempo.
Figura 3.11: o som digital é armazenado na forma de valores numéricos.
Os valores entre dois números seguidos não são conhecidos, podendo apenas
ser estimados. Dessa forma, quanto menor for o intervalo entre estes dois
valores, mais fiel será a representação do som original. Deve-se levar em
conta que sempre haverá perda de informação no processo de digitalização,
pois por menor que seja, existirá um intervalo entre dois números.
Como todos os intervalos são regulares, é usual quantificá-los pelo seu inverso,
ou seja, número de medidas em um determinado intervalo de tempo. Este
valor é conhecido como frequência amostral, ou simplesmente amostragem.
De acordo com o teorema da amostragem de Nyquist–Shannon, para se
armazenar um sinal ondulatório com uma determinada frequência f, é preciso
ter uma amostragem de, no mínimo o dobro desta frequência, ou seja, 2f.
Sabe-se que o ouvido humano consegue ouvir até aproximadamente 20000
Hz, (varia com idade, condições e até de pessoa para pessoa) e por isso
tradicionalmente as gravações profissionais usam uma frequência pouco
maior que o dobro disto: 44100 Hz.
Figura 3.12: Representação de um sinal contínuo representado em diferentes amostragens.
O outro parâmetro de qualidade do som digital está associado à precisão de
cada medida (que se transformará em cada um dos números no sistema
digital). Esses números estão associados à amplitude gravada em cada
intervalo de tempo, e sua precisão depende do espaço armazenado a cada
medida. Como a amplitude de reprodução dependerá do dispositivo que
reproduz o som, essa amplitude é dividida entre valores intermediários entre
o valor mínimo e o valor máximo. O número de possíveis valores entre esse
mínimo e máximo é conhecido como número de degraus, e a medida da
quantidade de degraus é conhecida como profundidade. A menor precisão
possível é denominada binária, com apenas dois degraus: os próprios valores
- mínimo e o máximo; uma profundidade de quatro degraus pode assumir
estes dois valores extremos e dois intermediários.
A quantificação dessa profundidade é dada em bits:
D = 2n
Onde D é o número de degraus, e n o número de bits.
Em uma profundidade de 8 bits, por exemplo, cada medida pode assumir cada
um dos 256 valores diferentes.
Os dois parâmetros mencionados interferem diretamente na qualidade do som
digital, mas é preciso lembrar que isso remete no espaço para armazenamento.
O tamanho de um arquivo de som, sem compressão seria igual ao produto do
valor da profundidade com o valor da amostragem, multiplicado ainda pelo
tempo de duração do som.
Tamanho = profundidade x amostragem x tempo
Uma gravação de dez segundos com amostragem de 44100 Hz de
amostragem e 24 bits (padrão de qualidade de um disco Blu-Ray) de
profundidade ocuparia um espaço de aproximadamente 1,3 megabytes.
Figura 3.13: Sinal original representado em diferentes profundidades