|
Masking
[สารบัญกลุ่มเรื่องที่กำลังศึกษา]
masking หมายถึง กระบวนการที่ทำให้เราไม่ได้ยินเสียงหนึ่งเพราะการมีอยู่ของอีกเสียงหนึ่ง แบ่งได้เป็น 2 ประเภทใหญ่ ๆ คือ (1) simultaneous masking กับ (2) non-simultaneous masking (บางทีเรียก temporal masking)
Simultaneous Maskingเกิดขึ้นเมื่อ มีเสียงกระตุ้นตั้งแต่ 2 ตัวขึ้นไปปรากฏขึ้นพร้อมกันที่ auditory system, จากมุมมองในโดเมนความถี่นั้น รูปร่างของ masker และขนาดสเปกตรัมของ maskee เป็นตัวกำหนดว่า การมีอยู่ของพลังงานสเปกตรัมของเสียงหนึ่งจะ mask อีกเสียงหนึ่งแค่ไหน นอกจากนี้ ในโดเมนเวลา ความสัมพันธ์ของเฟสระหว่างเสียงกระตุ้นก็อาจส่งผลกระทบต่อ masking, การจำแนกเพื่อวัตถุประสงค์ coding เรามักแบ่ง simultaneous masking ออกเป็น 3 กลุ่ม ได้แก่ noise-masking-tone (NMT), tone-masking-noise (TMN) และ noise-masking-noise (NMN)
Noise-Masking-Tone
เกิดขึ้นเมื่อ narrowband noise ซึ่งมีความกว้าง 1 บาร์ค (Bark) ได้ mask โทนตัวหนึ่งที่อยู่ใน critical band เดียวกัน เมื่อความเข้มของโทนที่ถูก mask (ต่อไปจะเรียกว่า masked tone) ตัวนั้น อยู่ต่ำกว่า threshold การได้ยิน ซึ่ง threshold หรือ ขีดเริ่มการได้ยินดังกล่าว สัมพันธ์โดยตรงกับความเข้มและความถี่กลางของ masking noise
ที่ threshold ของการได้ยินเสียง masked tone นั้น ค่า signal-to-mask ratio (SMR) มีค่าต่ำสุดเมื่อ ความถี่ของ masked tone ใกล้กับความถี่กลางของ masker (คำว่า SMR ต่ำสุด หมายถึง ค่าความแตกต่างระหว่าง SPL ของ masking noise ("signal") กับของ masked tone ("mask") มีค่าน้อยที่สุด) ในการศึกษาส่วนใหญ่ พบว่า SMR ต่ำสุดมีค่าอยู่ระหว่าง -5 ถึง +5 dB
ตัวอย่างรูปด้านล่าง แสดง noise masker ที่มีความกว้างเท่ากับ critical band ตัวหนึ่ง ซึ่งมีความถี่กลางที่ 410 Hz และมีความเข้ม 80 dB SPL กำลัง mask โทนตัวหนึ่ง ซึ่งมีความถี่ 410 Hz 76 dB SPL และค่า SMR ที่ threshold ของการได้ยินโทนตัวนี้คือ 4 dB หมายความว่า ถ้าโทนตัวนี้มีระดับเสียงมากกว่า 76 dB SPL มันก็จะไม่ถูก mask โดย noise และเราก็จะได้ยินเสียงโทน

ความสามารถในการ mask (หรือ masking power) ลดลง (= SMR เพิ่มขึ้น) เมื่อโทนมีความถี่สูงหรือต่ำกว่าความถี่ของโทนที่ SMR ต่ำสุด
Tone-Masking-Noise
เกิดขึ้นเมื่อ pure tone ที่ศูนย์กลางของ critical band ได้ mask สัญญาณ noise ที่มีความกว้างไม่มากกว่า critical band เมื่อสเปกตรัมของ noise ตัวนั้นอยู่ต่ำกว่า threshold การได้ยิน ซึ่ง threshold หรือ ขีดเริ่มการได้ยินดังกล่าว สัมพันธ์โดยตรงกับความเข้มและความถี่ของ masking tone
ทำนองเดียวกับ NMT, ค่า SMR ต่ำสุดที่ขีดเริ่มการได้ยินเสียงสัญญาณ noise (ซึ่งก็คือ ค่าต่ำสุดของผลต่างระหว่าง SPL ของ masking tone ("signal") กับของ masked noise ("mask")) เกิดขึ้นเมื่อความถี่ของ masker ใกล้กับความถี่กลางของ probe noise จากการศึกษา พบว่า SMR ต่ำสุดมีค่าอยู่ระหว่าง 21 ถึง 28 dB
ตัวอย่างรูปด้านล่าง masking tone ความถี่ 1 kHz 80 dB SPL กำลัง mask สัญญาณ masked noise ที่กว้างเท่ากับ critical band และมีความถี่กลางที่ 1 kHz 56 dB SPL มีค่า SMR 24 dB จากกรณีของรูปนี้ หมายความว่า ถ้าโทนเกิดเลื่อนไปซ้ายหรือขวาของ 1 kHz ค่า threshold SMR จะเพิ่มมากขึ้น หมายความว่า masking power ลดลง หรือพูดอีกอย่างว่า ถ้ายังอยากจะ mask สัญญาณ noise ตัวเดิม เราต้องเพิ่มความเข้มของ tonal masker

Noise-Masking-Noise
เกิดขึ้นเมื่อ narrowband noise ตัวหนึ่ง mask สัญญาณ narrowband noise อีกตัว ค่อนข้างซับซ้อนกว่า NMT และ TMN เพราะความสัมพันธ์ของเฟสระหว่าง masker กับ maskee ที่มีผลต่อ threshold SMR
การศึกษาหนึ่งบอกว่า สำหรับ NMN นั้น threashold SMR มีค่าประมาณ 26 dB
Asymmetry of Masking
จากสองรูปข้างบน เราจะเห็น asymmetry ของ masking ถึงแม้ระดับ dB SPL ของ noise masker กับ tonal masker จะเท่ากัน คือ 80 dB แต่ threshold SMR ต่างกันถึง 20 dB
The Spread of Masking
NMT, TMN และ NMN ที่กล่าวไปก่อนหน้า ไม่ได้เกิดขึ้นแค่ภายใน critical band แต่ในความเป็นจริง masker ที่อยู่ใน critical band หนึ่ง อาจส่งผล (ที่ทำนายได้) ต่อ threshold การได้ยินของอีก critical band กรณีเช่นนี้เรียกว่า interband masking หรือ spread of masking โดยทั่วไป นิยมโมเดลในงานกลุ่ม coding โดยการประมาณ spreading function ให้มีรูปคล้ายสามเหลี่ยมที่ด้าน 2 ด้านมีความชัน +25 และ -10 dB ต่อบาร์ค ดังสมการ

เมื่อ x มีหน่วยเป็นบาร์ค และ SFdB(x) มีหน่วยเป็น dB
ตัวอย่างแสดงดังรูป ในกรณีที่ masker ถูกควอนไตซ์โดยใช้ m-bit uniform scalar quantizer ผลลัพธ์ที่ได้อาจเท่ากับการเพิ่ม noise ที่ระดับ m

Non-simultaneous Maskingหมายถึง masking ในโดเมนเวลาที่เกิดขึ้นก่อนหน้าและหลังจาก simultaneous masking เท่ากับ เป็น masking ที่ตัว masker ไม่มีอยู่ในทางกายภาพ ณ เวลานั้น ตัวอย่างรูปด้านล่างแสดงทั้ง backward masking เกิดขึ้นก่อน masker จะเริ่มปรากฏ ไม่กี่ ms และ forward masking ซึ่งเกิดขึ้นหลังจากเอา masker ออกไปแล้ว postmasking จะเกิดขึ้นนานกว่า 100 ms

ที่มา: สรุปจากหัวข้อ 5.4 - 5.5 หนังสือ Audio Signal Processing and Coding ของ A. Spanias, T. Painter กับ V. Atti
Create Date : 03 กันยายน 2556 |
Last Update : 3 กันยายน 2556 23:19:56 น. |
|
1 comments
|
Counter : 2819 Pageviews. |
 |
|
|
โดย: Mr.Feynman วันที่: 4 กันยายน 2556 เวลา:12:21:23 น. |
|
|
|
| |
|