hiểu biết về hệ thống Âm thanh

4
Hiu biết vHthống Âm thanh, Loa và Tương tác phòng By: Phm Thanh Sơn (Sonkeyboard) Phn 1 Nếu người ta có thể nghe âm thanh trực tiếp của loa thì thế gii slà một nơi rất khác nhau! Thật không may, trường nghe tdo, nơi không có phản xạ, các chế độ của phòng hay độ n xung quanh, là khó để đạt được trong cuc sống hàng ngày, do đó chúng ta nghe các loa trong các phòng thc tế. Việc tương tác của hthống loa và phòng có thể rt phc tạp để hiu, mẫu mã hay đo đạc! Một cách để đo sự tương tác này là đó là đó đáp ứng xung ca hthng loa hoặc phòng. Đáp ứng xung ca hthống âm thanh tiêu chuẩn trong một phòng chứa rt nhiều thông tin thú vị, bao gm: 1) Delay giữa loa và micro đo 2) Tlmức âm thanh trực tiếp và âm vang dội 3) Thời gian đến, dung lượng tn svà mức phn xâm thanh 4) Tlsuy gim sớm và muộn của âm thanh 5) Đáp tuyến tn scủa âm thanh trực tiếp Đây là điểm thú vị đặc bit cuối cùng. Câu hỏi là: “Chúng ta muốn đo gì và tại sao?”

Upload: pham-thanh-son

Post on 22-Mar-2016

218 views

Category:

Documents


4 download

DESCRIPTION

Hiểu biết về Hệ thống Âm thanh

TRANSCRIPT

Hiểu biết về Hệ thống Âm thanh, Loa và Tương tác phòng

By: Pham Thanh Sơn (Sonkeyboard)

Phần 1

Nếu người ta có thể nghe âm thanh trực tiếp của loa thì thế giới sẽ là một nơi rất khác nhau!

Thật không may, trường nghe tự do, nơi không có phản xạ, các chế độ của phòng hay độ ồn xung

quanh, là khó để đạt được trong cuộc sống hàng ngày, do đó chúng ta nghe các loa trong các phòng

thực tế. Việc tương tác của hệ thống loa và phòng có thể rất phức tạp để hiểu, mẫu mã hay đo đạc!

Một cách để đo sự tương tác này là đó là đó đáp ứng xung của hệ thống loa hoặc phòng. Đáp ứng

xung của hệ thống âm thanh tiêu chuẩn trong một phòng chứa rất nhiều thông tin thú vị, bao gồm:

1) Delay giữa loa và micro đo

2) Tỉ lệ mức âm thanh trực tiếp và âm vang dội

3) Thời gian đến, dung lượng tần số và mức phản xạ âm thanh

4) Tỉ lệ suy giảm sớm và muộn của âm thanh

5) Đáp tuyến tần số của âm thanh trực tiếp

Đây là điểm thú vị đặc biệt cuối cùng. Câu hỏi là: “Chúng ta muốn đo gì và tại sao?”

Hình 1: Đáp tuyến xung của một hội trường đa năng 1250 chỗ ngồi. Trục X là thời gian (~0.75 giây)

và trục Y là cường độ tính bằng dB. Có ghi chú âm thanh trực tiếp, các âm phản xạ, sự suy giảm của

tiếng vang dội và độ ồn nền.

Một câu hỏi mà sẽ chạm vào tâm điểm của việc đo lường “hệ thống” và các vấn đề tối ưu hóa là:

“Nếu đáp ứng xung chứa đựng đáp tuyến tần số của âm thanh trực tiếp, liệu chúng ta có thể tách đáp

tuyến loa ra khỏi đáp tuyến phòng?”

Ngoài ra “Liệu chúng ta có thể làm điều chúng ta muốn?”

Hình 1 cho thấy một đáp ứng xung được hiển thị trong miền thời gian. Chỗ “tăng vọt” đại diện cho

âm thanh trực tiếp một cách trung thực chứa đựng tần số và thông tin pha về loa. Để nhìn được thông

tin này chúng ta phải chuyển đổi phần nhỏ này của đáp ứng xung sang miền tần số.

Hình 2: Đáp ứng xung của một hội trường đa năng 1250 chỗ ngồi. Các đường thẳng đứng ám chỉ một

cửa sổ thời gian mà bỏ qua hầu hết các tác động của phòng tại các tần số mà các chu kỳ của chúng dài

hơn cửa sổ thời gian (các tần số trầm chẳng hạn).

Để đạt được sự tách biệt này của âm thanh trực tiếp từ đáp tuyến phòng, chúng ta phải lựa chọn một

cửa sổ thời gian bao gồm âm thanh trực tiếp nhưng không bao gồm các phản xạ và sự suy giảm của

phòng.

Hình 2 hiển thị một cửa sổ thời gian. Số đo này được thực hiện bằng cách sử dụng một hệ thống loa

toàn dải với khoảng cách micro khoảng 60′ cách loa. Pink noise được sử dụng như một tín hiệu tham

chiếu và đáp ứng xung được tính toán bằng cách sử dụng một FFT 512k (mặc dù chỉ có chỉ số ~0.75

giây đầu tiên được hiển thị).

Phần 2

Chúng ta có thể lấy dữ liệu “cửa sổ thời gian” và chuyển đổi nó sang miền tần số bằng cách sử dụng

các thuật toán FFT. Chuyển đổi này tạo ra một kết quả mà cho biết bao nhiêu năng lượng được thể

hiện tại mỗi tần số, như trong Hình 3.

Bạn có thể nhìn thấy rõ nét năng lượng tại khu vực các tần số thấp. Bạn cũng có thể nhận thấy sự

thiếu độ phân giải LF trong hình này. Việc thiếu độ phân giải tại LF được bù đắp bởi việc dư thừa độ

phân giải tại HF. Độ phân giải không đồng đều giữa năng lượng LF và HF là kết quả của các thuật

toán FFT được sử dụng để chuyển đổi dữ liệu từ miền thời gian sang miền tần số. Các tiêu chuẩn FFT

tạo ra các dữ liệu mà được phân bổ một cách tuyến tính trong tần số (một điểm dữ liệu ở mỗi X

Hertz).

Thật không may, tai con người chỉ cảm nhận tần số theo hàm logarit.

Hình 3: Đáp tuyến tần số của phần âm thanh trực tiếp của đáp ứng xung của hội trường đa năng 1250

chỗ ngồi. Đáp tuyến được tính toán bằng cách sử dụng một điểm FFT 512 (bằng 512/48000 hoặc ~11

ms). Như bạn có thể nhìn thấy đáp tuyến tần số được hiển thị rõ nét tại khu vực LF.

Việc thiếu độ phân giải của LF trong Hình 3 là một kết quả trực tiếp của việc sử dụng một cửa sổ thời

gian ngắn trong việc chuyển đổi của chúng ta từ miền thời gian tới miền tần số. Thật thú vị khi biểu

đồ này không liên quan đến những gì chúng ta nghe. Việc nghe đơn giản hệ thống loa toàn dải mà

chúng ta đo đạc làm cho nó rõ ràng rằng hệ thống đang tái tạo năng lượng LF ít nhất là 100 Hz!

Tôi đề xuất rằng mục tiêu đầu tiên của một hệ thống đo lường hiệu quả nên cung cấp các kết quả có

liên quan đến những gì chúng ta nghe. Do đó việc thiếu liên quan giữa những gì chúng ta nghe và

những gì chúng ta đo được gợi ý một sự sửa đổi đến phương pháp tiếp cận của chúng ta.

Khi một phương pháp tiếp cận thay thế để cố gắng tìm ra một phép đo mà liên quan với những gì

chúng ta nghe, chúng ta có thể cố gắng sử dụng một cửa sổ thời gian dài hơn để “nhìn” đáp tuyến LF

với độ phân giải tốt hơn.

Một cửa sổ thời gian dài hơn xấp xỉ 250 ms được hiển thị tại Hình 4.

Hình 4: Đáp ứng xung của một hội trường đa năng 1250 chỗ ngồi. Các đường thẳng cho thấy một cửa

sổ thời gian BAO GỒM phần lớn các hiệu ứng của phòng. Cửa sổ thời gian cho biết sấp xỉ 0.25 giây.

Để chuyển đổi “lát cắt” dài hơn này của đáp ứng xung vào miền tần số, chúng ta sẽ sử dụng một FFT

8k mà bằng 8k/48000 giây hoặc 0.171 giây. Lưu ý thêm rằng cửa sổ thời gian này bao gồm cả âm

thanh trực tiếp và đáp tuyến của phòng.

Trong Hình 5 thông tin tần số thấp được nhìn thấy ở độ phân giải đầy đủ, tuy nhiên các kết quả của

tần số cao nhìn khó hiểu. Biểu đồ cho biết dữ liệu có độ phân giải 5 Hz (tức là một điểm dữ liệu tại

mỗi 5 Hz). Trong khi độ phân giải này cung cấp độ phân giải LF tuyệt vời (giữa 31 Hz và 62.5 Hz có

15 điểm dữ liệu). Tuy nhiên tại HF chúng ta có độ phân giải quá mức – giữa 4 kHz và 8 kHz có xấp

xỉ 800 điểm dữ liệu. Nói một cách đơn giản, cửa sổ thời gian dài hơn cung cấp độ phân giải LF tốt

hơn nhưng độ phân giải HF bị quá mức.

Kết quả nghiên cứu những biểu đồ này có thể đưa bạn đến kết luận rằng để thực hiện các phép đo

tương quan tốt với kinh nghiệm nghe của chúng ta, chúng ta phải sử dụng những cửa sổ thời gian

ngắn mà cô lập âm thanh trực tiếp tại các tần số cao, và gia tăng các cửa sổ thời gian dài hơn khi

chúng ta nhìn các tần số thấp.

Ở cái nhìn đầu tiên ý tưởng này dường như vi phạm các cụm từ thường trích dẫn, “Người ta chỉ có

thể ảnh hưởng đến âm thanh trực tiếp với việc xử lý.”

Tuy nhiên đây không phải là trường hợp. Tại các tần số trung trầm và trầm, sự tương tác của một hệ

thống âm thanh và một căn phòng có thể bị ảnh hưởng và được tối ưu hóa bằng việc xử lý tín

hiệu. Nói cách khác, tại các tần số trầm (các bước sóng dài) âm thanh trực tiếp và các phản xạ âm từ

các bề mặt gần đó tạo thành một phản ứng tổng hợp. Đó là âm thanh tổng hợp đến người nghe.

Khả năng để đo tại một vài cửa sổ thời gian đồng thời cung cấp một phép đo mà tương quan tốt với

cả việc nghe và nhìn vào tín hiệu được gửi tới loa có thể được điều chỉnh (thông qua các bộ lọc tần số

(EQ), hoặc thiết bị xử lý khác) để tối ưu hóa loa/ảnh hưởng phòng.

Hình 5: Đáp tuyến tần số của phần âm thanh trực tiếp của đáp ứng xung của một hội trường đa năng

1250 chỗ ngồi. Đáp tuyến được tính toán bằng cách sử dụng điểm FFT 8192 (bằng 8192/48000 hoặc

~107 ms). Như bạn có thể nhìn thấy đáp tuyến tần số hiển thị năng lượng tần số thấp nhìn rõ ràng hơn

nhiều so với cửa sổ thời gian ngắn hơn.

Hình minh họa cuối cùng của chúng ta cho biết một phép đo của một hệ thống loa bao gồm nhiều cửa

sổ thời gian và hiển thị cả cường độ và đáp tuyến pha của “hệ thống.” Việc sử dụng nhiều cửa sổ thời

gian cho phép người ta cô lập âm thanh trực tiếp của một loa trong một tình huống thực tế ở các tần

số cao. Tuy nhiên, tại các tần số thấp hơn, các cửa sổ thời gian dài hơn bao gồm tương tác loa/phòng

đã được tìm thấy tương quan tốt với kinh nghiệm nghe của chúng ta.

Nhiều cửa sổ thời gian trong một phép đo đơn lẻ là một cách cực kỳ thú vị để đo và tối ưu hóa đáp

tuyến của một hệ thống âm thanh trong một căn phòng.