โปรเจคสุดเจ๋ง ถอดรหัสเสียงจากไฟล์วิดีโอ (ที่ไม่มีเสียง)

virtual-microphone-head

ด้วยเทคโนโลยีของกล้องถ่ายภาพที่พัฒนาไปอย่างรวดเร็วในตอนนี้ แม้แต่กล้องระดับมืออาชีพอย่าง DSLR ก็ยังสามารถถ่ายวิดีโอได้แล้ว ทำให้มีโปรเจคที่น่าสนใจที่ใช้ภาพวิดีโอมาประมวลผลเกิดขึ้นอย่างมากมาย โดยกล้องรุ่นใหม่ๆ นั้นมีข้อดีหลายอย่างทั้งความละเอียดที่สูงขึ้น (กล้องมือถือปัจจุบันสามารถอัดวิดีโอระดับ 4K ได้ไม่ยาก) และสิ่งที่กำลังจะตามมาในอนาคตคือเฟรตเรตของวิดีโอที่กำลังขยับขึ้นไปจากที่เมื่อก่อนเราใช้กล้องกันอย่างมากก็ได้แค่ 24 เฟรมต่อวินาที ปัจจุบันเรากำลังจะได้ใช้กล้องระดับผู้ใช้ตามบ้านในระดับเฟรมเรตเกิน 100 เฟรมต่อวินาที

ด้วยวิดีโอที่ได้ทั้งความละเอียดสูง และเฟรมเรตที่สูงมากเช่นนี้ก็ทำให้สามารถนำภาพวิดีโอที่ได้นั้นมาวิเคราะห์ได้หลายทาง เช่นโปรเจคที่ผมเอามานำเสนอวันนี้คือ Virtual Microphone ที่คิดค้นโดยนักวิจัยสถาบันเทคโนโลยี MIT ที่สามารถสร้างเสียงขึ้นมาใหม่ได้ แม้ว่าเราจะไม่ได้ยินในวิดีโอก็ตามที

virtual-microphone

เป็นที่ทราบกันดีว่าเสียงนั้นเมื่อกระทบกับวัตถุจะทำให้เกิดการสั่นสะเทือนและสะท้อนกลับไปยังทิศทางต่างๆ ซึ่งหากเรามองด้วยตาเปล่าก็คงมองไม่เห็น (แต่หากเราจับวัตถุนั้นๆ ขณะพูดอยู่ก็คงรู้สึกได้ถึงแรงสั่นสะเทือนที่ว่า) ทีมวิจัยกลุ่มนี้นำสิ่งเหล่านี้มาสร้างให้เกิดเป็นโปรเจคใหม่ขึ้นมาโดยสามารถสร้างเสียงขึ้นมาใหม่ จากการอ่านการสั่นสะเทือนของวัตถุในภาพวิดีโอที่อัดมาด้วยความละเอียดและเฟรมเรตที่สูง โดยหากวิดีโอที่ว่านั้นเรามองด้วยตาเปล่าแทบจะมองไม่เห็นการสั่นสะเทือนเลย แต่หากวิเคราะห์ให้ดีจะเห็นการสั่นสะเทือนที่ต่ำมากในระดับ 1/100 pixel ซึ่งทีมงานก็สามารถเขียนโปรแกรมวิเคราะห์ออกมาได้โดยสามารถแปลงการสั่นสะเทือน ออกมาเป็นเสียงที่ใกล้เคียงต้นฉบับ (แม้ว่าจะไม่ชัดเจน แต่หากเป็นเสียงคนพูดก็สามารถแกะออกมาได้ไม่ยากเย็นเลย)

virtual-microphone-001

virtual-microphone-002
สามารถถอดรหัสจากหูฟังที่วางอยู่ก็ได้เช่นกัน

นอกจากนี้โครงการนี้ยังสามารถทดลองกับกล้อง DSLR รุ่นใหม่ๆ ที่ถ่ายวิดีโอได้ในระดับ 60 เฟรมต่อวินาทีได้ด้วย ถึงแม้ว่าจะเสียงจะไม่สามารถแกะออกมาได้ชัดเจนเท่ากล้องความเร็วสูง แต่ก็พอรู้เรื่องกันละหากตัดพวก noise ออกไป

virtual-microphone-003

น่าสนใจทีเดียวว่าเทคโนโลยีตัวนี้จะนำไปใช้ในทิศทางไหนบ้างที่น่าสนใจ โดยสิ่งหนึ่งที่พอจะรู้ได้คือคุณสามารถรับรู้หรือสอดแนมผู้อื่นได้ผ่านการถ่ายภาพการสั่นสะเทือนของวัตถุกันแล้ว จากที่ก่อนหน้านี้ในยุคสงครามเย็นก็มีการใช้งานเทคโนโลยีคล้ายๆ กันนี้มาบ้างผ่านสิ่งที่เรียกว่า laser microphone ซึ่งเป็นอุปกรณ์ที่ยิงเลเซอร์ไปยังกระจกและรับสัญญาณสะท้อนกลับมาเพื่อถอดรหัสอีกครั้งซึ่งสามารถใช้ในการสอดแนมฝั่งตรงข้ามได้เป็นอย่างดี หากใครไม่เก็ทก็สามารถดูวิดีโอข้างล่างได้ครับ

Leave a Reply

Your email address will not be published. Required fields are marked *