Bloggang.com : ศล - Masking

Bloggang.com : weblog for you and your gang

creatio ex nihilo

ศล

Location :
กรุงเทพ Thailand

[Profile ทั้งหมด]

ฝากข้อความหลังไมค์

Smember

ผู้ติดตามบล็อก : 85 คน [?]

Group Blog

All Blogs

Friends' blogs

Webmaster - BlogGang

[Add ศล's blog to your web]

Links

BlogGang.com

Masking

[สารบัญกลุ่มเรื่องที่กำลังศึกษา]

masking หมายถึง กระบวนการที่ทำให้เราไม่ได้ยินเสียงหนึ่งเพราะการมีอยู่ของอีกเสียงหนึ่ง แบ่งได้เป็น 2 ประเภทใหญ่ ๆ คือ (1) simultaneous masking กับ (2) non-simultaneous masking (บางทีเรียก temporal masking)

Simultaneous Masking

เกิดขึ้นเมื่อ มีเสียงกระตุ้นตั้งแต่ 2 ตัวขึ้นไปปรากฏขึ้นพร้อมกันที่ auditory system, จากมุมมองในโดเมนความถี่นั้น รูปร่างของ masker และขนาดสเปกตรัมของ maskee เป็นตัวกำหนดว่า การมีอยู่ของพลังงานสเปกตรัมของเสียงหนึ่งจะ mask อีกเสียงหนึ่งแค่ไหน นอกจากนี้ ในโดเมนเวลา ความสัมพันธ์ของเฟสระหว่างเสียงกระตุ้นก็อาจส่งผลกระทบต่อ masking, การจำแนกเพื่อวัตถุประสงค์ coding เรามักแบ่ง simultaneous masking ออกเป็น 3 กลุ่ม ได้แก่ noise-masking-tone (NMT), tone-masking-noise (TMN) และ noise-masking-noise (NMN)

Noise-Masking-Tone

เกิดขึ้นเมื่อ narrowband noise ซึ่งมีความกว้าง 1 บาร์ค (Bark) ได้ mask โทนตัวหนึ่งที่อยู่ใน critical band เดียวกัน เมื่อความเข้มของโทนที่ถูก mask (ต่อไปจะเรียกว่า masked tone) ตัวนั้น อยู่ต่ำกว่า threshold การได้ยิน ซึ่ง threshold หรือ ขีดเริ่มการได้ยินดังกล่าว สัมพันธ์โดยตรงกับความเข้มและความถี่กลางของ masking noise

ที่ threshold ของการได้ยินเสียง masked tone นั้น ค่า signal-to-mask ratio (SMR) มีค่าต่ำสุดเมื่อ ความถี่ของ masked tone ใกล้กับความถี่กลางของ masker (คำว่า SMR ต่ำสุด หมายถึง ค่าความแตกต่างระหว่าง SPL ของ masking noise ("signal") กับของ masked tone ("mask") มีค่าน้อยที่สุด) ในการศึกษาส่วนใหญ่ พบว่า SMR ต่ำสุดมีค่าอยู่ระหว่าง -5 ถึง +5 dB

ตัวอย่างรูปด้านล่าง แสดง noise masker ที่มีความกว้างเท่ากับ critical band ตัวหนึ่ง ซึ่งมีความถี่กลางที่ 410 Hz และมีความเข้ม 80 dB SPL กำลัง mask โทนตัวหนึ่ง ซึ่งมีความถี่ 410 Hz 76 dB SPL และค่า SMR ที่ threshold ของการได้ยินโทนตัวนี้คือ 4 dB หมายความว่า ถ้าโทนตัวนี้มีระดับเสียงมากกว่า 76 dB SPL มันก็จะไม่ถูก mask โดย noise และเราก็จะได้ยินเสียงโทน

ความสามารถในการ mask (หรือ masking power) ลดลง (= SMR เพิ่มขึ้น) เมื่อโทนมีความถี่สูงหรือต่ำกว่าความถี่ของโทนที่ SMR ต่ำสุด

Tone-Masking-Noise

เกิดขึ้นเมื่อ pure tone ที่ศูนย์กลางของ critical band ได้ mask สัญญาณ noise ที่มีความกว้างไม่มากกว่า critical band เมื่อสเปกตรัมของ noise ตัวนั้นอยู่ต่ำกว่า threshold การได้ยิน ซึ่ง threshold หรือ ขีดเริ่มการได้ยินดังกล่าว สัมพันธ์โดยตรงกับความเข้มและความถี่ของ masking tone

ทำนองเดียวกับ NMT, ค่า SMR ต่ำสุดที่ขีดเริ่มการได้ยินเสียงสัญญาณ noise (ซึ่งก็คือ ค่าต่ำสุดของผลต่างระหว่าง SPL ของ masking tone ("signal") กับของ masked noise ("mask")) เกิดขึ้นเมื่อความถี่ของ masker ใกล้กับความถี่กลางของ probe noise จากการศึกษา พบว่า SMR ต่ำสุดมีค่าอยู่ระหว่าง 21 ถึง 28 dB

ตัวอย่างรูปด้านล่าง masking tone ความถี่ 1 kHz 80 dB SPL กำลัง mask สัญญาณ masked noise ที่กว้างเท่ากับ critical band และมีความถี่กลางที่ 1 kHz 56 dB SPL มีค่า SMR 24 dB จากกรณีของรูปนี้ หมายความว่า ถ้าโทนเกิดเลื่อนไปซ้ายหรือขวาของ 1 kHz ค่า threshold SMR จะเพิ่มมากขึ้น หมายความว่า masking power ลดลง หรือพูดอีกอย่างว่า ถ้ายังอยากจะ mask สัญญาณ noise ตัวเดิม เราต้องเพิ่มความเข้มของ tonal masker

Noise-Masking-Noise

เกิดขึ้นเมื่อ narrowband noise ตัวหนึ่ง mask สัญญาณ narrowband noise อีกตัว ค่อนข้างซับซ้อนกว่า NMT และ TMN เพราะความสัมพันธ์ของเฟสระหว่าง masker กับ maskee ที่มีผลต่อ threshold SMR

การศึกษาหนึ่งบอกว่า สำหรับ NMN นั้น threashold SMR มีค่าประมาณ 26 dB

Asymmetry of Masking

จากสองรูปข้างบน เราจะเห็น asymmetry ของ masking ถึงแม้ระดับ dB SPL ของ noise masker กับ tonal masker จะเท่ากัน คือ 80 dB แต่ threshold SMR ต่างกันถึง 20 dB

The Spread of Masking

NMT, TMN และ NMN ที่กล่าวไปก่อนหน้า ไม่ได้เกิดขึ้นแค่ภายใน critical band แต่ในความเป็นจริง masker ที่อยู่ใน critical band หนึ่ง อาจส่งผล (ที่ทำนายได้) ต่อ threshold การได้ยินของอีก critical band กรณีเช่นนี้เรียกว่า interband masking หรือ spread of masking โดยทั่วไป นิยมโมเดลในงานกลุ่ม coding โดยการประมาณ spreading function ให้มีรูปคล้ายสามเหลี่ยมที่ด้าน 2 ด้านมีความชัน +25 และ -10 dB ต่อบาร์ค ดังสมการ

เมื่อ x มีหน่วยเป็นบาร์ค และ SF_dB(x) มีหน่วยเป็น dB

ตัวอย่างแสดงดังรูป ในกรณีที่ masker ถูกควอนไตซ์โดยใช้ m-bit uniform scalar quantizer ผลลัพธ์ที่ได้อาจเท่ากับการเพิ่ม noise ที่ระดับ m

Non-simultaneous Masking

หมายถึง masking ในโดเมนเวลาที่เกิดขึ้นก่อนหน้าและหลังจาก simultaneous masking เท่ากับ เป็น masking ที่ตัว masker ไม่มีอยู่ในทางกายภาพ ณ เวลานั้น ตัวอย่างรูปด้านล่างแสดงทั้ง backward masking เกิดขึ้นก่อน masker จะเริ่มปรากฏ ไม่กี่ ms และ forward masking ซึ่งเกิดขึ้นหลังจากเอา masker ออกไปแล้ว postmasking จะเกิดขึ้นนานกว่า 100 ms

ที่มา: สรุปจากหัวข้อ 5.4 - 5.5 หนังสือ Audio Signal Processing and Coding ของ A. Spanias, T. Painter กับ V. Atti

Create Date : 03 กันยายน 2556

Last Update : 3 กันยายน 2556 23:19:56 น.

1 comments

Counter : 2365 Pageviews.

โดย: Mr.Feynman

วันที่: 4 กันยายน 2556 เวลา:12:21:23 น.

Pantip.com | PantipMarket.com | Pantown.com | © 2004 BlogGang.com allrights reserved.