Bloggang.com : ศล - Reversible Watermarking for Digital Audio Based on Cochlear Delay Characteristics

Reversible Watermarking for Digital Audio Based on Cochlear Delay Characteristics

[สารบัญกลุ่มเรื่องที่กำลังศึกษา]

เนื้อหาตอนนี้ ผมสรุปจากบทความในชื่อเดียวกัน โดย Masashi Unoki กับ Ryota Miyauchi ใน 7^th International Conference on Intelligent Information Hiding and Multimedia Signal Processing ปี 2011 ที่ Dalian, China

จากเทคนิค watermarking ที่อาศัยสมบัติ cochlear delay (CD) ของหูที่ผมเคยเล่าไปก่อนหน้า (ดู Method of Digital-Audio Watermarking Based on Cochlear Delay Characteristics) สำหรับบทความนี้ ผู้เขียนได้พัฒนาต่อยอดให้เป็น reversible watermarking หมายความว่า ภาครับหรือภาคถอดรหัส นอกจากจะต้องดึง watermark ŝ(k) ออกมาจาก watermarked signal y(n) แล้ว ยังต้องแปลง y(n) กลับเพื่อให้ได้สัญญาณต้นฉบับ x̂(n) ฉะนั้น ข้อแตกต่างสำคัญของสองเปเปอร์คือ ผู้เขียนจะต้องทำให้ระบบจากเดิมที่เป็นแบบ non-blind ให้เป็น blind method และนี่คือคีย์เวิร์ดของบทความนี้ครับ

block diagram ของ reversible audio watermarking แสดงดัง Figure 1.

จากรูป ในส่วน inaudible watermarking ทำแบบเดิมครับ คือ ใช้ CD filter สองตัวที่หน่วงเวลาขององค์ประกอบความถี่ต่ำคนละค่ากันเพื่อแทนการฝัง "1" และ "0"

ในส่วน blind detection ใช้ chirp z-transform (CZT) ที่ r = 1/b₀ และ r = 1/b₁ (r คือ magnitude ของ z = r·e^jω, b₀ กับ b₁ เป็นพารามิเตอร์ของ CD filters) เพื่อหาสเปกตรัมความถี่ต่ำสุดของการแปลง Y_m(0) แล้วเปรียบเทียบค่า Y₀(0) กับ Y₁(0) เพื่อหา ŝ(k) มีขั้นตอนดังรูป

ทำไมใช้ CZT? ตัวอย่างสเปกตรัมที่ได้จากการวิเคราะห์ CZT ของสัญญาณต้นฉบับ x(t) และสัญญาณหลังจากใส่ลายน้ำ y(n) แสดงใน Figure 3. โดยรูป (a) แสดง pole กับ zero ของ H_m(z) ด้วย 'x' กับ 'o' ตามลำดับ (เนื่องจาก transfer function H_m(z) ของ CD filter อยู่ในรูป (-b_m + z^-1)/(1 - b_mz^-1) เมื่อ 0 < b_m < 1 ดังนั้น pole ของ H_m(z) คือที่ z = b_m และ zero คือที่ z = 1/b_m ทีนี้ ผู้เขียนใช้ b₀ = 0.795, b₁ = 0.865 ลองแทนค่าตัวเลขดังกล่าว เราจะได้ค่าตรงตามในรูปนะครับ) รูป (b), (c), (d) เป็นสเปกตรัมฟูริเยร์ของ x(n), y₀(n) กับ y₁(n) ตามลำดับ เห็นว่า หน้าตามันคล้าย ๆ กัน (การแปลง z กรณี r = 1 ก็คือการแปลงฟูริเยร์แบบไม่ต่อเนื่อง, ผมคิดว่ารูป (c) ค่า r น่าจะเป็น 1 มากกว่า r = 1/b₀ นะครับ) เอามาใช้ประโยชน์อะไรไม่ได้ แต่สเปกตรัม CZT ที่ r = 1/b_m ของพวกมันแตกต่างกัน ดังรูป (e) - (j) โดยเฉพาะที่ความถี่ต่ำ หมายความว่า เราอาจใช้การเปรียบเทียบสเปกตรัม CZT ที่ความถี่ต่ำสุดเพื่อใช้ในการระบุค่า ŝ(k)

ผลการประเมิน inaudibility (เปรียบเทียบระหว่าง x(n) กับ y(n)) กับ bit-detection rate แสดงใน Figure 5.

ตรงที่เขียน with/ without spline หมายถึง มีหรือไม่มีการทำ spline interpolation ระหว่างเฟรม (segment) ที่ฝังลายน้ำ

Figure 6. ผลการประเมินเปรียบเทียบระหว่าง x(n) กับ x̂(n) (ดูเส้น -o-)

noise ของ SNR ของสัญญาณ x̂(n) ในที่นี้คือความแตกต่างระหว่าง x(n) กับ x̂(n)

Create Date : 27 กรกฎาคม 2556
Last Update : 27 กรกฎาคม 2556 10:45:37 น.
Counter : 1374 Pageviews.

0 comments

	you're halfway there พุดดิ้งรสกาแฟ (11 ม.ค. 2568 13:23:07 น.)		BookWalker Taiwan ประกาศอันดับ BL e-Book ขายดี ประจำปี 2024 iamZEON (12 ม.ค. 2568 18:59:46 น.)
	งานซ้อมใหญ่พยุหยาตราทางชลมารค 2567 (6) ผู้ชายในสายลมหนาว (10 ม.ค. 2568 14:17:46 น.)		3 M E A L S_ A D A Y ป้ายเหลืองสไตล์ nonnoiGiwGiw (8 ม.ค. 2568 15:18:41 น.)

Zol.BlogGang.com

ศล

Location :
กรุงเทพ Thailand

[ดู Profile ทั้งหมด]

ผู้ติดตามบล็อก : 85 คน [?]

บทความทั้งหมด