creatio ex nihilo

ศล
Location :
กรุงเทพ Thailand

[Profile ทั้งหมด]

ให้ทิปเจ้าของ Blog [?]
ฝากข้อความหลังไมค์
Rss Feed
Smember
ผู้ติดตามบล็อก : 80 คน [?]




Group Blog
 
All Blogs
 
Friends' blogs
[Add ศล's blog to your web]
Links
 

 
The Sense of Hearing



อยากเขียนแนะนำหนังสือเล่มนี้ตั้งแต่ปีที่แล้ว หลังอ่านจบหมาด ๆ แต่ก็ตั้งใจว่า จะแนะนำหลังจากเขียนสรุปเนื้อหาครบทั้งเล่ม พอเอาเข้าจริง เขียนค้างไว้ 6 บทนานข้ามปีล่ะ (ดู สรุปเนื้อหาบทที่ 2 ถึง 7) และคิดว่าคงไม่ได้เขียนต่อเร็ว ๆ นี้แน่ครับ หนังสือ The Sense of Hearing ว่าด้วยจิตวิทยาการรับรู้เสียงของคน เป็นหนังสือ introduction ที่ไม่ต้องการความรู้พื้นฐานก่อนอ่านมากนัก ความรู้ฟิสิกส์ ชีววิทยา คณิตศาสตร์สำหรับนักศึกษาปี 1-2 คณะวิศวกรรมศาสตร์หรือวิทยาศาสตร์น่าจะเพียงพอ ในแง่ที่มันเป็นตำราเรียน คงพูดได้ว่าอ่านสนุกเหลือเชื่อ ไม่น่าเบื่อ และมีอารมณ์ขัน (ระดับเสียงที่สูงเกิน 120 dB SPL แกเรียกว่าเป็นระดับร็อกเกอร์ Ozzy Osbourne, อ่าน แล้วจะเก็ตมุก) หลังจากนี้ผมจะพูดไปแบบเรื่อยเปื่อย มีเนื้อหาโดยตรงจากหนังสือบ้าง นอกเรื่องบ้าง แบบคนพยายามจะขายของชวนเชื่อว่า จิตวิทยาการรับรู้เสียงนี่มันน่าสนใจนะ แต่ผลลัพธ์สุดท้ายจะกลายเป็นน่าเบื่อหรือไม่ ไม่รับประกัน

รู้ใช่มั้ยฮะว่า หูเป็นอวัยวะรับสัมผัสที่อ่อนไหวที่สุดของคน อากาศที่สั่นเพียงน้อยนิดในระดับเส้นผ่านศูนย์กลางของไฮโดรเจนอะตอม หูของเรายังตรวจจับได้ กระดูกชิ้นที่เล็กที่สุดในร่างกายมนุษย์ก็อยู่ในหูชั้นกลาง (โกลน) เป็นตัวกระทุ้งเนื้อเยื้อหน้าต่างวงรีของ cochlea ในหูชั้นใน พูดถึงข้อมูลเสียงที่เดินทางมาถึงหูก่อนจะถูกแปลงเป็นข้อมูลในรูปของเคมีกับไฟฟ้าก็ต้องผ่านตัวกลางทั้งสามสถานะ เริ่มจากใครบางคนพูด ส่งข้อมูลเสียงผ่านอากาศสั่น ๆ จนมาถึงหูชั้นนอก แล้วเปลี่ยนตัวกลางจากแก๊สเป็นของแข็ง คือเจ้ากระดูกสามชิ้นในหูชั้นกลาง ก่อนจะถูกส่งต่อให้กับของเหลวที่มีสมบัติสำคัญประการหนึ่งคือ ไม่ยอมถูกบีบอัด ของเหลวนี้อยู่ภายในในท่อ scala vestibuli กับ scala tympani ของหูชั้นใน พอข้อมูลถูกส่งมาถึงมัน ของเหลวนั้นจะไปกด basilar membrane (เนื้อเยื้อที่กั้นระหว่าง 2 ท่อเมื่อตะกี้) โดยที่ตลอดความยาวของเจ้าเม็มเบรน (ในทางกายภาพมันขดเป็นก้นหอย) มีความกว้างและความแข็งทื่อไม่เท่ากัน ทำให้แต่ละตำแหน่งบนตัวมันตอบสนองต่อความถี่ที่ไม่ตรงกัน ทีนี้ บนเม็มเบรนดังกล่าวมีเซลล์ขนที่เปิดปิดรับโปรตัสเซียมไอออนทำให้ศักดาไฟฟ้าของเซลล์ขนเปลี่ยน (การเปิดปิดถูกควบคุมด้วยการเคลื่อนที่ของ tectorial membrane ซึ่งจะสั่นสอดคล้องกับการสั่นของ basilar membrane) และศักดาไฟฟ้าที่เปลี่ยนจะควบคุมปริมาณการปล่อยสารเคมีสื่อประสาทผ่าน synaptic cleft ไปยังเซลล์ประสาทในเส้นประสาทรับรู้เสียงก่อนส่งต่อไปยังสมอง นี่เป็นการเดินทางที่น่าอัศจรรย์มั้ยฮะ มองในแง่ของการถอดรหัสข้อมูลก็ยิ่งเต็มไปด้วยความอัศจรรย์ เราสามารถบอกทิศทางของเสียงโดยที่ไม่ต้องมอง เราสามารถเลือกที่จะให้ความสนใจกับเสียงบางเสียงได้ (cocktail party effect) เป็นต้น ในด้านเทคโนโลยี ก็มีสิ่งประดิษฐ์มากมายที่เติบโตมาจากความรู้จิตวิทยาการได้ยิน เช่น MP3 เราสามารถตัดข้อมูลจำนวนมากทิ้งไปโดยที่ความรับรู้แทบไม่แตกต่างกันได้อย่างไร คำตอบอยู่ที่พฤติกรรมในเชิงการประมวลผลสัญญาณของ basilar membrane ซึ่งประพฤติประหนึ่ง band-pass filter bank (จากการทดลองวัดขีดเริ่มการได้ยินสุดแสนคลาสสิกของ Fletcher ซึ่งต่อมาก็ให้คำอธิบายซึ่งอิงกับข้อเสนอของ Helmholtz ที่บอกเป็นนัยว่ามี auditory filter อยู่, หนังสือเล่มนี้ อาจารย์ของผมเคยแนะนำให้อ่านคู่กับตำราของ Moore รายละเอียดในเรื่องดังกล่าว An Introduction to the Psychology of Hearing ของ Moore เขียนไว้ละเอียดกว่า) แล้วเราพบว่าองค์ประกอบสัญญาณในโดเมนความถี่บางตัวที่อยู่ภายในย่านความถี่ผ่านของ band-pass filter เดียวกันอาจถูกข่มโดยองค์ประกอบสัญญาณในโดเมนความถี่ตัวอื่น ทำให้เราสามารถกำจัดตัวที่โดนข่มนั้นทิ้งได้ และการข่มดังว่าในทางกายภาพก็สามารถอธิบายได้ด้วยการสั่นของ basilar membrane นั่นแหละครับ

อีกสักหนึ่งตัวอย่าง สมมติคุณสร้างอิมพัลซ์ของเสียงหลายความถี่ พอเราวิเคราะห์ในโดเมนความถี่ เราจะเห็นองค์ประกอบทางความถี่หลาย ๆ ตัว ทุกตัวเกิดขึ้นที่เวลาเดียวกันในทางกายภาพ แต่ในแง่ของการได้ยิน เมื่อเรามองที่ basilar membrane มองผ่านสายตาของเม็มเบรน มันจะรับรู้การมีตัวตนขององค์ประกอบความถี่สูงช้ากว่า และถ้ามีใครบางคนแกล้งหน่วงให้องค์ประกอบความถี่สูงถูกรับรู้ที่เม็มเบรนช้ากว่าเดิมไปอีกนิด (สร้างสัญญาณที่คล้ายอิมพัลซ์ที่หน่วงองค์ประกอบความถี่สูงไว้หน่อยหนึ่ง) เราไม่สามารถรับรู้ความแตกต่างของสองกรณีนี้ได้ เป็นแรงบันดาลใจให้นักวิจัยเสนอการซ่อนข้อมูลในเสียงโดยการหน่วงองค์ประกอบความถี่สูงของเสียง ทำได้โดยควบคุมเวลาหน่วงสอดคล้องกับข้อมูลไบนารี่ เช่น บิต 1 หน่วง x วินาที บิต 0 หน่วง y วินาที เป็นต้น (ในทางปฏิบัติใช้ฟิลเตอร์ group-delay สองตัว)

ผมให้


Create Date : 17 พฤศจิกายน 2557
Last Update : 17 พฤศจิกายน 2557 21:53:22 น. 0 comments
Counter : 527 Pageviews.

ชื่อ : * blog นี้ comment ได้เฉพาะสมาชิก
Comment :
  *ส่วน comment ไม่สามารถใช้ javascript และ style sheet
 
 Pantip.com | PantipMarket.com | Pantown.com | © 2004 BlogGang.com allrights reserved.