技術文章
-
實現開放式 AI 穿戴裝置的私密聆聽
執行摘要 (Executive Summary)
將AI助理整合至眼鏡裝置中,面臨著一個關鍵障礙:聲學隱私(acoustic privacy)。傳統的開放式揚聲器就像微型的全向廣播台,旁人容易聽到敏感的AI回覆、簡訊朗讀或導航提示。這種「漏音 (sound leakage)」現象對於個人AI裝置而言,是一個根本性的安全漏洞。
本報告詳細介紹了一種專為解決此挑戰而設計的專用聲學架構。透過利用「雙極相位抵消(Dipole Phase Cancellation)」技術,我們設計了一種微型揚聲器系統,能將聲壓(SPL)集中在近場(使用者的耳朵),同時主動抑制聲音傳播到遠場(旁人區域)。模擬結果證實了「隱私指數(Privacy Index)」顯著的提升,確保與AI互動時,保持在安全私密的個人體驗,而非公開廣播。1. 隱私挑戰:開放式聆聽的悖論 (The Open-Ear Paradox)
為了確保全天候佩戴的安全與舒適,AI眼鏡必須保持「開放式」設計,讓使用者能聽見環境音。然而,物理定律指出,在開放空間中的驅動喇叭單體,傾向於在低、中頻率區段向所有方向均勻地輻射聲音。
對於AI裝置來說,這是不可接受的。當助理朗讀機密郵件或健康通知時,必須僅讓佩戴者聽見。因此,設計的挑戰在於打破「耳邊聲壓響度」與「遠處聲壓響度」之間的關聯。我們必須創造一條極其陡峭的「聲學衰減曲線 (acoustic decay curve)」。
目標:在使用者的耳朵處達到至少85 dB的聲壓(確保清晰度),同時在 0.5公尺距離處維持低於45 dB的聲壓(環境背景噪音水平)。2. 解決方案:雙極相位抵消物理學 (Dipole Phase Cancellation Physics)
我們放棄了傳統的 「單極(monopole)」 揚聲器設計(即像球體一樣向外360度輻射聲音),轉而採用雙極(dipole)架構。雙極聲源由兩個輻射相位差為180°的聲學開孔組成:
2.1 主發聲孔 (The Primary Port / Speaker Face):將正相位的聲波直接射入使用者的耳道。
2.2 次發(洩)聲孔 (The Secondary Port / Rear Vent):向模擬確認後的最佳化位置(方向)發射負相位的聲波。
如何創造靜音區:當這兩股相位相反的聲波在裝置外的開放空氣中相遇時,它們會產生破壞性干涉 (destructively interfere)。主波的正峰值會被次波的負波谷有效「抵消」。這因此產生了一種聲學「短路 (short-circuit)」現象,導致聲能離開鏡腳幾公分後迅速消散。
3. 技術驗證:模擬結果 (Technical Validation: Simulation Results)
為了驗證此架構,我們利用COMSOL Multiphysics進行了有限元素分析(FEA),模擬在無響室環境下的 AI眼鏡鏡腳部分。
3.1 模擬模型的建立條件
圖1: 模擬條件_01:AI眼鏡鏡腳中僅與揚聲器(聲音輸出)相關的部件: (圖示包含:次發(洩)聲孔/後通風口/揚聲器背面、揚聲器本體、主發聲孔/揚聲器正面)。

圖2: 裝置被一個空氣球體包圍,即模擬無響室環境。定義第一個參考點(使用者的耳朵),用於計算聲壓。(圖示說明:接收聲音的點(使用者耳朵)距離為1公分)

圖3 (zoom in): 定義第一個參考點(使用者的耳朵),用於計算聲壓。(圖示說明:接收聲音的點(使用者耳朵)距離為1公分)


圖4 &圖5:模擬條件_02:旁人的距離在1跟10公分(參考用)與50公分

圖6 (zoom in): 定義第二個以及其他參考點(旁人)
3.2 模擬結果 (The simulation results)
3.2.1 聲學衰減曲線(無次發(洩)聲孔- 標準微型揚聲器)圖6:(圖表顯示聲音隨距離衰減較慢)
圖7: 頻率響應曲線比對(無次發(洩)聲孔-一般標準微型揚聲器)
3.2.2聲學衰減曲線(有次發(洩)聲孔- AI 隱私架構)圖8:(圖表顯示聲音隨距離衰減極快)

圖8: 頻率響應曲線比對(有次發(洩)聲孔- AI隱私架構)
3.3 聲壓 (SPL) 分佈圖
下圖展示了1 kHz(人聲清晰度的關鍵頻率)下的聲音空間分佈 。
圖9:1 kHz處的SPL分佈。請注意聲能極度集中(紅色區域)於近場耳道,並在距離鏡腳 10 到50公分迅速衰減至底噪水平(藍色區域)。
4. 性能指標:隱私指數 (Performance Metrics: The Privacy Index)
為了量化防漏音技術的成效,我們定義了「隱私指數」,這是傳遞給目標(耳膜)的聲能與洩漏給旁人(0.5 公尺處)的聲能之比率。
性能對比表:性能對比表:
註:聲壓每降低 10 dB,人耳感知到的響度即減半。降低 45 dB 代表可聽到的漏音大幅減少。指標 標準微型揚聲器 AI 隱私架構 改善幅度 耳邊聲壓 @ 1 kHz(目標)(至少應達到 85 dB) 91 dB 87 dB - 0.5 m 處聲壓 @ 1 kHz(漏音)(至少應低於 45 dB) 51 dB(清晰可聽見) 16 dB(如耳語般安靜) 降低 35 dB 人聲頻段清晰度 高 高 - 結論 (Conclusion)
透過運用聲學相位抵消的物理原理,我們成功設計出一套開放式音訊系統,解決了AI穿戴裝置對隱私的關鍵需求。數據證實,我們可以在提供使用者清晰、易懂的AI語音助理的同時,避免將敏感數據變成「公開廣播」。此架構將揚聲器從單純的音訊元件,轉變為適合下一代AI智慧眼鏡的安全通訊傳輸裝置。

詢價