Reversible Watermarking for Digital Audio Based on Cochlear Delay Characteristics
[สารบัญกลุ่มเรื่องที่กำลังศึกษา]

เนื้อหาตอนนี้ ผมสรุปจากบทความในชื่อเดียวกัน โดย Masashi Unoki กับ Ryota Miyauchi ใน 7th International Conference on Intelligent Information Hiding and Multimedia Signal Processing ปี 2011 ที่ Dalian, China

จากเทคนิค watermarking ที่อาศัยสมบัติ cochlear delay (CD) ของหูที่ผมเคยเล่าไปก่อนหน้า (ดู Method of Digital-Audio Watermarking Based on Cochlear Delay Characteristics) สำหรับบทความนี้ ผู้เขียนได้พัฒนาต่อยอดให้เป็น reversible watermarking หมายความว่า ภาครับหรือภาคถอดรหัส นอกจากจะต้องดึง watermark ŝ(k) ออกมาจาก watermarked signal y(n) แล้ว ยังต้องแปลง y(n) กลับเพื่อให้ได้สัญญาณต้นฉบับ x̂(n) ฉะนั้น ข้อแตกต่างสำคัญของสองเปเปอร์คือ ผู้เขียนจะต้องทำให้ระบบจากเดิมที่เป็นแบบ non-blind ให้เป็น blind method และนี่คือคีย์เวิร์ดของบทความนี้ครับ

block diagram ของ reversible audio watermarking แสดงดัง Figure 1.


จากรูป ในส่วน inaudible watermarking ทำแบบเดิมครับ คือ ใช้ CD filter สองตัวที่หน่วงเวลาขององค์ประกอบความถี่ต่ำคนละค่ากันเพื่อแทนการฝัง "1" และ "0"


ในส่วน blind detection ใช้ chirp z-transform (CZT) ที่ r = 1/b0 และ r = 1/b1 (r คือ magnitude ของ z = r·e, b0 กับ b1 เป็นพารามิเตอร์ของ CD filters) เพื่อหาสเปกตรัมความถี่ต่ำสุดของการแปลง Ym(0) แล้วเปรียบเทียบค่า Y0(0) กับ Y1(0) เพื่อหา ŝ(k) มีขั้นตอนดังรูป


ทำไมใช้ CZT? ตัวอย่างสเปกตรัมที่ได้จากการวิเคราะห์ CZT ของสัญญาณต้นฉบับ x(t) และสัญญาณหลังจากใส่ลายน้ำ y(n) แสดงใน Figure 3. โดยรูป (a) แสดง pole กับ zero ของ Hm(z) ด้วย 'x' กับ 'o' ตามลำดับ (เนื่องจาก transfer function Hm(z) ของ CD filter อยู่ในรูป (-bm + z-1)/(1 - bmz-1) เมื่อ 0 < bm < 1 ดังนั้น pole ของ Hm(z) คือที่ z = bm และ zero คือที่ z = 1/bm ทีนี้ ผู้เขียนใช้ b0 = 0.795, b1 = 0.865 ลองแทนค่าตัวเลขดังกล่าว เราจะได้ค่าตรงตามในรูปนะครับ) รูป (b), (c), (d) เป็นสเปกตรัมฟูริเยร์ของ x(n), y0(n) กับ y1(n) ตามลำดับ เห็นว่า หน้าตามันคล้าย ๆ กัน (การแปลง z กรณี r = 1 ก็คือการแปลงฟูริเยร์แบบไม่ต่อเนื่อง, ผมคิดว่ารูป (c) ค่า r น่าจะเป็น 1 มากกว่า r = 1/b0 นะครับ) เอามาใช้ประโยชน์อะไรไม่ได้ แต่สเปกตรัม CZT ที่ r = 1/bm ของพวกมันแตกต่างกัน ดังรูป (e) - (j) โดยเฉพาะที่ความถี่ต่ำ หมายความว่า เราอาจใช้การเปรียบเทียบสเปกตรัม CZT ที่ความถี่ต่ำสุดเพื่อใช้ในการระบุค่า ŝ(k)


ผลการประเมิน inaudibility (เปรียบเทียบระหว่าง x(n) กับ y(n)) กับ bit-detection rate แสดงใน Figure 5.


ตรงที่เขียน with/ without spline หมายถึง มีหรือไม่มีการทำ spline interpolation ระหว่างเฟรม (segment) ที่ฝังลายน้ำ

Figure 6. ผลการประเมินเปรียบเทียบระหว่าง x(n) กับ x̂(n) (ดูเส้น -o-)


noise ของ SNR ของสัญญาณ x̂(n) ในที่นี้คือความแตกต่างระหว่าง x(n) กับ x̂(n)



Create Date : 27 กรกฎาคม 2556
Last Update : 27 กรกฎาคม 2556 10:45:37 น.
Counter : 814 Pageviews.

0 comments
วัดภาวนาโซล ประเทศเกาหลีใต้ จัดโครงการปฏิบัติธรรมนานาชาติ ณ ศูนย์ปฏิบัติธรรม นานาชาติโทชิหงิญี่ปุ่น Turtle Came to See Me
(13 มี.ค. 2562 20:11:50 น.)
Don't Worry Be Happy - Bobby McFerrin ... ความหมาย tuk-tuk@korat
(24 ก.พ. 2562 16:10:07 น.)
วิธีรับมือกับ...มรสุมฝุ่น Princezz Matcha Latte
(31 ม.ค. 2562 17:07:35 น.)
พระแก้วนาคสวาท : พระแก้วในรัชกาลที่ 3 ผู้ชายในสายลมหนาว
(17 ก.พ. 2562 12:00:03 น.)
ชื่อ : * blog นี้ comment ได้เฉพาะสมาชิก
Comment :
 *ส่วน comment ไม่สามารถใช้ javascript และ style sheet
 

Zol.BlogGang.com

ศล
Location :
กรุงเทพ  Thailand

[ดู Profile ทั้งหมด]
 ผู้ติดตามบล็อก : 85 คน [?]

บทความทั้งหมด