creatio ex nihilo

ศล
Location :
กรุงเทพ Thailand

[Profile ทั้งหมด]

ฝากข้อความหลังไมค์
Rss Feed
Smember
ผู้ติดตามบล็อก : 85 คน [?]




Group Blog
 
All Blogs
 
Friends' blogs
[Add ศล's blog to your web]
Links
 

 
Reversible Watermarking for Digital Audio Based on Cochlear Delay Characteristics

[สารบัญกลุ่มเรื่องที่กำลังศึกษา]

เนื้อหาตอนนี้ ผมสรุปจากบทความในชื่อเดียวกัน โดย Masashi Unoki กับ Ryota Miyauchi ใน 7th International Conference on Intelligent Information Hiding and Multimedia Signal Processing ปี 2011 ที่ Dalian, China

จากเทคนิค watermarking ที่อาศัยสมบัติ cochlear delay (CD) ของหูที่ผมเคยเล่าไปก่อนหน้า (ดู Method of Digital-Audio Watermarking Based on Cochlear Delay Characteristics) สำหรับบทความนี้ ผู้เขียนได้พัฒนาต่อยอดให้เป็น reversible watermarking หมายความว่า ภาครับหรือภาคถอดรหัส นอกจากจะต้องดึง watermark ŝ(k) ออกมาจาก watermarked signal y(n) แล้ว ยังต้องแปลง y(n) กลับเพื่อให้ได้สัญญาณต้นฉบับ x̂(n) ฉะนั้น ข้อแตกต่างสำคัญของสองเปเปอร์คือ ผู้เขียนจะต้องทำให้ระบบจากเดิมที่เป็นแบบ non-blind ให้เป็น blind method และนี่คือคีย์เวิร์ดของบทความนี้ครับ

block diagram ของ reversible audio watermarking แสดงดัง Figure 1.


จากรูป ในส่วน inaudible watermarking ทำแบบเดิมครับ คือ ใช้ CD filter สองตัวที่หน่วงเวลาขององค์ประกอบความถี่ต่ำคนละค่ากันเพื่อแทนการฝัง "1" และ "0"


ในส่วน blind detection ใช้ chirp z-transform (CZT) ที่ r = 1/b0 และ r = 1/b1 (r คือ magnitude ของ z = r·e, b0 กับ b1 เป็นพารามิเตอร์ของ CD filters) เพื่อหาสเปกตรัมความถี่ต่ำสุดของการแปลง Ym(0) แล้วเปรียบเทียบค่า Y0(0) กับ Y1(0) เพื่อหา ŝ(k) มีขั้นตอนดังรูป


ทำไมใช้ CZT? ตัวอย่างสเปกตรัมที่ได้จากการวิเคราะห์ CZT ของสัญญาณต้นฉบับ x(t) และสัญญาณหลังจากใส่ลายน้ำ y(n) แสดงใน Figure 3. โดยรูป (a) แสดง pole กับ zero ของ Hm(z) ด้วย 'x' กับ 'o' ตามลำดับ (เนื่องจาก transfer function Hm(z) ของ CD filter อยู่ในรูป (-bm + z-1)/(1 - bmz-1) เมื่อ 0 < bm < 1 ดังนั้น pole ของ Hm(z) คือที่ z = bm และ zero คือที่ z = 1/bm ทีนี้ ผู้เขียนใช้ b0 = 0.795, b1 = 0.865 ลองแทนค่าตัวเลขดังกล่าว เราจะได้ค่าตรงตามในรูปนะครับ) รูป (b), (c), (d) เป็นสเปกตรัมฟูริเยร์ของ x(n), y0(n) กับ y1(n) ตามลำดับ เห็นว่า หน้าตามันคล้าย ๆ กัน (การแปลง z กรณี r = 1 ก็คือการแปลงฟูริเยร์แบบไม่ต่อเนื่อง, ผมคิดว่ารูป (c) ค่า r น่าจะเป็น 1 มากกว่า r = 1/b0 นะครับ) เอามาใช้ประโยชน์อะไรไม่ได้ แต่สเปกตรัม CZT ที่ r = 1/bm ของพวกมันแตกต่างกัน ดังรูป (e) - (j) โดยเฉพาะที่ความถี่ต่ำ หมายความว่า เราอาจใช้การเปรียบเทียบสเปกตรัม CZT ที่ความถี่ต่ำสุดเพื่อใช้ในการระบุค่า ŝ(k)


ผลการประเมิน inaudibility (เปรียบเทียบระหว่าง x(n) กับ y(n)) กับ bit-detection rate แสดงใน Figure 5.


ตรงที่เขียน with/ without spline หมายถึง มีหรือไม่มีการทำ spline interpolation ระหว่างเฟรม (segment) ที่ฝังลายน้ำ

Figure 6. ผลการประเมินเปรียบเทียบระหว่าง x(n) กับ x̂(n) (ดูเส้น -o-)


noise ของ SNR ของสัญญาณ x̂(n) ในที่นี้คือความแตกต่างระหว่าง x(n) กับ x̂(n)


Create Date : 27 กรกฎาคม 2556
Last Update : 27 กรกฎาคม 2556 10:45:37 น. 0 comments
Counter : 1370 Pageviews.

ชื่อ : * blog นี้ comment ได้เฉพาะสมาชิก
Comment :
  *ส่วน comment ไม่สามารถใช้ javascript และ style sheet
 
 Pantip.com | PantipMarket.com | Pantown.com | © 2004 BlogGang.com allrights reserved.