專題副刊

AI穿戴式語音裝置 助失聲者發聲

文\蔡宗桓

加州有生物工程師團隊發明了一款新型穿戴式語音輔助裝置,利用柔軟磁彈機制來捕捉喉嚨肌肉在發聲過程中的微小運動,成功把喉嚨發出的聲音轉譯為清晰語音,且準確率高達94.68%,以此協助無法自然發出聲音的人士重拾溝通能力。

Advertisement

隨着智慧型裝置的平民化,舉凡眼鏡、耳機、手錶、衣服、手環等穿戴式裝置皆已與智慧型裝置結合並融入人們生活中,加上人工智慧AI在醫學領域的創新發展,使得穿戴式裝置可隨時監控個人的健康,推動整個市場蓬勃發展。

近期來自加州大學洛杉磯分校(UCLA, University of California, Los Angeles)的生物工程師團隊發明了一款新型穿戴式語音輔助裝置,為的是協助那些無法自然發出聲音的人士。

這款名為“生物電子語音系統”的正方形創新裝置,邊長僅有2.5公分,重量約為7克,但卻能將喉嚨肌肉的微小運動準確轉譯成清晰可辨識的語音。

該裝置邊長僅2.5公分,重量約為7克,不僅體積小巧輕便,穿戴時也會感到舒適無負擔。

ADVERTISEMENT

它不僅體積小巧輕便,穿戴時舒適無負擔,更關鍵的是該研發團隊是藉由AI技術實現人機合作,以幫助失聲者重拾溝通能力。

首先,這項裝置利用了一種獨特的柔軟磁彈機制(Soft Magnetoelastic Mechanis)來捕捉喉嚨肌肉在發聲過程中的微小運動,並把這些運動產生的磁場變化準確轉換成高保真度的電流訊號(High-fidelity Electrical Signals)。

接下來,由感測元件採集到的電訊號把被輸入該裝置的第二個關鍵元素──機器學習模型。

這項模型經過了大量數據的訓練,能把人類喉嚨肌肉活動的各種模式與特定語音進行配對,並生成對應的語音,最後再把語音訊號實體化輸出。

研究員在8名健康成年人身上進行測試時,曾讓他們無聲朗讀不同的句子,結果該裝置的準確率高達94.68%,並成功把他們喉嚨肌肉的運動轉譯為清晰的語音。

名為“生物電子語音系統”的新型穿戴式語音輔助裝置能把喉嚨肌肉的微小運動準確轉譯成清晰可辨識的語音。

因此,這項突破讓“肌肉說話”成為了可能,而未來因聲帶疾病或喉嚨受傷而失聲的患者,將可借助這項輔助設備重拾與一般人溝通的能力。

根據統計,全球有將近30%的人士在有生之年內將至少經歷一次聲帶障礙的狀況,而當前的主流治療方式包括手術切除或是聲帶療法,但恢復期往往漫長且曲折,大概落在3個月至1年不等。

另外也有侵入性的治療方式,例如食道穿刺等則更需要長久的術後恢復與保養。與這款來自加州大學洛杉磯分校團隊發明的穿戴裝置相比,這款穿戴裝置無疑提供了非侵入,且更有效的解決之道。

據了解,該工程師團隊的創新之處在於把AI融入了醫療輔助環節,讓科技與人體完美結合。

AI助手日益擬人化

使用者或產生情感依附

根據Google(谷歌)旗下的AI研究實驗室DeepMind的研究員指出,用戶或會對AI助手產生過度的情感依附,而這將帶來一系列的負面社會後果。

DeepMind的研究人員指出,用戶對於AI助手可能產生過度的情感依附,或帶來負面社會後果。

Google旗下的DeepMind人工智能研究實驗室所發表的一篇研究論文強調先進個人化AI助手的潛在好處,並稱這些助手“可能徹底改變工作、教育、創意追求的性質,以及我們之間的溝通、協調和談判方式,最終影響我們想成為何種人,以及成為何種人的能力。

然而,這種影響力也存有潛在的風險,其中一個關鍵風險是用戶與AI助手之間可能形成不適當的情感依附,特別是當AI助手呈現出類似人類的形象或面孔時,這種情況可能加劇。

該論文指出,這些AI助手甚至可能表達對用戶的所謂友誼或愛慕之情,從而為用戶與AI之間形成長期的情感依附奠定基礎。

如果不加以控制,這種依附可能導致用戶失去自主權,並因為AI能夠取代一般人際互動而失去社交聯繫。

這不僅是純粹理論上的風險,8年前,名為“Amy Ingram”的AI助手甚至以足夠逼真的形象激發了一些用戶寄情書給她,甚至試圖親自去找她。

DeepMind倫理研究小組的研究科學家Iason Gabriel和該論文的共同作者提醒民眾說,隨着AI助手日益個人化和類似人類的形象越來越常見,這已引入了關於擬人化、隱私、信任及與AI建立適當關係的新問題。

“越來越個人化和貼近人類的助手形式引發了關於擬人化、私隱、信任以及與人工智能的適當關係等新問題。”

Iason Gabriel認為有必要加強保障措施,對這一社會現象採取更全面的方法。

“該研究論文還討論了價值共識、安全性和濫用在人工智能助手發展中的重要性。儘管人工智能助手可以幫助用戶改善福祉、提升創造力和優化時間利用,但作者們警告說還存在其他風險,例如與用戶和社會利益不一致、對他人強加價值觀、用於惡意目的以及易受對抗性攻擊。”

為應對這些風險,DeepMind團隊建議發展全面評估人工智能助手的方法,並加速發展有益社會的人工智能助手。

“我們目前正處於這個技術和社會變革的開始階段。因此,我們有機會現在就行動起來——作為開發人員、研究人員、政策制定者和公共利益相關者,塑造我們想在世界上看到的人工智能助手。”

避免AirTag被濫用

蘋果導入跨平台偵測防追蹤

自AirTag推出後,坊間就不時傳出濫用AirTag事件,而當中最常聽聞的就是不法之徒利用AirTag跟蹤民眾,而有專家也說明不法之徒如何使用AirTag來偷盜轎車。

為了緩解民眾的擔憂,Apple(蘋果)作出了一連串的改變,例如增強聲音警報系統、增加對精準查找的支援,以及安裝不必要的追蹤器的警報系統,但成效都不如預期。

Apple的這些措施並沒有真正縮小差距,那是因為AirTag並不是市面上唯一一款藍牙追蹤器,這表示不法之徒還可利用其他品牌的追蹤器來跟蹤受害者,無論用戶使用的是Android或iPhone手機。

不過,隨着早前推出的iOS 17.5更新後,這項惱人的缺陷終於得到修復,此次更新中也導入一項名為“跨平台追蹤偵測”的新功能,該功能不僅可檢測用戶周圍未知的 AirTag,還可檢測其他品牌的藍牙追蹤器。

根據該公司的說明,如果非用戶擁有的相容藍牙追蹤器正隨用戶一起移動,那麼,無論該裝置與哪個作業系統配對,都會向用戶發出警示通知,而這項新功能會運行在更新到最新iOS 17.5版的手機,Android 6.0或更高版本的裝置也有這功能。

最新功能是作為“偵測不需要的位置追蹤器”標準協定的一部分而開發,該協定是Apple和Google兩家公司共同努力的結果。以低功耗藍牙(Bluetooth LE)協定為底,如果手機偵測到來自與用戶一起移動的未知藍牙設備的Ping,或是設備已被移動,警報系統就會發送提醒,在iPhone上,用戶可看到追蹤器的標識符號詳細資訊,然後是有關如何永久停用它的說明內容。

除了Apple的AirTag,其他製造藍牙追蹤器的品牌,如Chipolo、eufy、Jio、Motorola和Pebblebee也承諾會強化其追蹤硬體支援安全標準。標準化工作由網絡工程任務組 (IETF) 提供,該工作組現在將開始偵測不需要的位置追蹤器系統列為“有效網絡草案”的標註。

值得注意的是,這並不是努力的結束,因為藍牙技術只是追蹤設備可用的多種格式之一,因此濫用的可能性仍然非常需要關注。值得慶幸的是,IETF與Google和Apple正在一起正在努力解決這個問題。電子前沿基金會引用DULT規範草案時指出其中還描述了非藍牙追蹤器的警報協議,包括使用GPS、Wi-Fi、LTE定位等追蹤器。

Apple和Google兩家科技巨頭合作,對大多數藍牙追蹤器提供反追蹤提醒。

谷歌AI助理功能提升

具備記憶回憶功能

稍早前,Google(谷歌)於I/O活動中發表了許多關於人工智慧的相關應用,其中最讓人感到驚艷的莫過於Project Astra。

在概念上,Project Astra屬於Google AI助理Gemini的擴增功能之一,它可讓Gemini有“看見”和“理解”現實世界的能力,並且具備“記憶”和“回憶”功能,方便用戶隨時隨地對AI發出提問。

Project Astra仍處於早期開發階段的原型,目標是打造一款對於日常生活有幫助的通用型AI助理。

根據Google公開的示範視頻,未來只要借助Project Astra技術,用戶只需開啟手機相機拍攝,即能向AI展開一系列的提問,像是對着喇叭詢問“這部分的零件叫什麼名字”,或是指向電腦熒幕上正在撰寫的程式碼,問道“這些是做什麼用的”,AI會以視覺分析即時解答問題,好比視頻版本的Google Lens智慧眼鏡。

Project Astra也將能安裝在智慧眼鏡上,同樣是藉由鏡頭捕捉畫面,Google視頻就能通過一款原型眼鏡實測,當測試員戴上之後,望向白板上繪製的生產流程,便能向AI詢問如何改善,也能要求AI一起來個腦力激盪,替眼前的狗隻與玩偶取名字。

與此同時,Project Astra還擁有一定的記憶能力。舉例來說,Google在示範Project Astra的過程中,刻意讓手機鏡頭掃過並拍下整個辦公室,而當操作者突然詢問“請問你還記得我的眼鏡放在哪裡嗎?”的時候,Project Astra和 Gemini立刻給出了回應,準確指出眼鏡就放在桌子上、一顆紅色蘋果的旁邊,即便手機鏡頭當下根本沒有對準放着眼鏡的那個角落。

Google說明,Project Astra除了要進行視覺數據分析,還要記下看到的內容,因此會需要處理大量的資訊,所以 Google將聲音、畫面輸出歸類至時間軸的事件,並且以緩存的方式,以利AI迅速調出相關數據,以最快速度給予回應。目前,Project Astra尚未有正式發布計劃,Google僅透露部分功能會出現在Gemini App之中,未來則可能藉由手機或是新型態的眼鏡取得。

用戶未來只需要開啟手機相機拍攝,接着對着喇叭詢問“這部分的零件叫什麼名字”,AI會以視覺分析即時解答問題。

 

Tags
你也可能感兴趣...