專題副刊

3D打造第3根拇指 助人類加強手部動作

文\蔡宗桓

如果人類多了一根拇指,會不會在生活上更方便、更靈活,或者能更進一步提高我們的能力和生產力?為此,科學家展開了一項研究,以探究這個想法與技術的可行性及可控性,並且開發出“第三根拇指”。因此,或許在不久的未來,義肢或許不只是用來幫助殘障人士,也可以讓一般人戴上以增強手部動作。

Advertisement

科學家開發出「第三根拇指」,並且只需一分鐘就能掌握。

英國劍橋大學(University of Cambridge)的科學家近期公佈了一項3D列印機器人體配件——第三根拇指(Third Thumb),並在人體增強及腦神經科學領域獲得進展,或許這將打破我們過去長久以來對身體的習慣“用法”。

這項專案是於2020年時公布,且起初是由倫敦大學學院(University College London)負責開發,而新的劍橋大學研究團隊則是在科學期刊《Science Robotics》發表大規模試驗結果,即共596名年齡、背景各異的參與者,幾乎都在一分鐘內學會如何使用這個人體新配件。

究竟第三根拇指是如何運作的呢?其實,這個由3D列印製作的“第三根拇指”還佩上腳趾壓力偵測器,而用戶可以把它戴在右手上,通過腳趾的壓力來控制拇指的移動。當腳趾對右側偵測器施加壓力,就可以讓拇指在手上橫向移動;而左側偵測器則是控制拇指向上靠近手指,當施壓越大,拇指移動速度則越快,一旦鬆開腳趾,拇指就會回到初始位置。

ADVERTISEMENT

這也代表用戶可以用腳控制拇指,並通過藍牙連接來給予拇指訊息。而腳踏控制第三根拇指的概念則是來自於我們原先就使用雙手和腳協作的產品,例如駕駛汽車,使用縫紉機或彈鋼琴。

雖然這聽起來有點怪,但參與者確實是通過這項裝置設計執行了許多對單手來說頗具挑戰性或不可能完成的任務,例如打開瓶子、剝香蕉或握住多個玻璃杯等。

研究團隊利用功能性磁共振成像技術(fMRI),觀察並分析參與者大腦感覺運動皮層的變化,顯示了使用第三拇指會讓大腦中不同手指的神經活動變得相似,手指之間的區別度減少。換句話說,大腦對不同手指的辨識度降低了。

這樣的腦部變化,也會發生在人們失去肢體或感覺功能時。這時,大腦會重新調整神經表徵以適應變化,導致其他部位的神經表徵擴大或重疊。

讓人好奇的是,這是不是代表取下第三拇指後,對大腦來說可能像是“少了一根手指”的感覺呢?由於大腦已調整了神經表徵來整合第三拇指的使用,因此突然取下第三拇指可能會使大腦失去一部分已適應的感覺和運動控制系統。

不過,研究團隊指這樣的腦部變化是短期的,且不會影響手指的正常活動。

這項研究也展示了人體擴增技術的潛力,未來不僅可提高身障人士的能力,還可能幫助手部靈活性逐漸下降的人群。

根據評估,第三拇指很適合失去一隻手臂,需要單手執行複雜任務的人士,而相關研究也對人類增強和腦科學領域的推進有積極意義。

如同他們在論文中所寫:“技術正在改變我們對於人類的定義。機器影響了我們的思考乃至身體。我想到的是,如果我有‘第三根拇指’,至少拿手機會更穩,尤其是睡前躺着滑手機的時候——這是人類祖先以前沒有的需求。”

左手腕上為藍牙模組與電機,用於無線連接和數據傳輸,以及驅動和控制第三根拇指的動作,右腳靴上的藍牙用於無線連接和數據傳輸,而右腳鞋底則為壓力感應器。

無需任何文字指示

V2A可為視頻生成語音配樂

現今AI(人工智能)能做的事情越來越多,就在我們對AI能用文字生成出音樂和配樂的表現大感驚艷時,Google的最新AI技術“V2A”已可以做到針對無聲音的視頻直接生成出合適的配樂或語音。

雖然谷歌釋出的幾部視頻令人感覺不錯,但它也承認目前還沒有到達完美的境地,且仍面對一些限制,尤其是語音部分。

Google DeepMind近期釋出的一個全新的影像配樂生成AI技術“V2A”(video-to-audio)功能,讓用戶得以通過文字指令和視頻,生成與視頻相匹配的戲劇配樂、逼真音效或對話。此工具目前尚未普遍開放,因為仍需接受“嚴格的安全評估和測試”。當它可用時,其輸出內容將加上Google的SynthID浮水印,標記出是AI生成的內容。

DeepMind指出,視頻生成模型的發展速度很快,但目前許多系統只能生成無聲的內容,無法生成和視頻同步的音訊,而他們希望通過V2A技術能把生成電影變為現實,並也將這項工具定位為處理歷史畫面的工具。

將視頻和音訊配對並不新鮮,但DeepMind強調V2A技術的獨特之處在於可以理解視頻的原始像素,並自動將生成的聲音與視頻同步,因此可以選擇不輸入文字指令。

把視頻和音訊配對的概念並不新鮮,但DeepMind強調V2A技術的獨特之處在於能理解視頻的原始像素,並自動將生成的聲音和視頻同步,因此,用戶可以選擇不輸入文字指令。

Google DeepMind也給出了幾段示範視頻,其中包括用“汽車打滑、油門聲、天使電子音樂”等文字指令描述聲音,有興趣者可前往Google DeepMind官方部落格(https://deepmind.google/discover/blog/generating-audio-for-video/)看看音效如何與視頻內容相匹配。

該工具還可以為視頻生成數量“無限”的配樂,讓用戶能使用無窮無盡的配樂選項。與此同時,V2A也可和DeepMind的AI視頻生成工具Veo配對運用。

V2A是通過視頻、音訊和註釋來訓練AI工具,包括“對聲音的詳細描述、口語對話逐字稿”,這讓視頻──音訊生成器能把音訊與視覺場景相配對。

DeepMind目前正在嘗試提升嘴唇動作和對話同步的能力,此外,DeepMind也強調,視頻品質很重要,任何顆粒狀或失真的內容都可能導致聲音品質明顯下降。

手機版Chrome 125

添朗讀內容功能

過去,當你用手機爬文瀏覽Chrome網頁時,或許需花費眼力細看文字,如今,你只需直接用耳朵“聽”內容即可。

Google近日釋出Android手機版Chrome 125更新版本,最大亮點就是加入文字轉語音的“朗讀”新功能,且能直接把網頁上的文字轉換成擬真人語音的音訊播放出來,且還可自行調整朗讀播放速度、切換不同聲調等。

若是想要使用英文、日文或法文網頁,只需點選瀏覽器右上角,從選單介面先點擊“翻譯”,之後再點選“朗讀此頁內容”,就能聽到經翻譯成中文的語音朗讀內容。

再者,這部新機還具備“突出顯示文字和自動捲動”功能,語音播報朗讀時會與文字內容同步捲動。目前,朗讀網頁文字功能,僅率先供Android裝置獨享。

據Google官網頁面的說明,並非所有網站的頁頁內容都有支援“朗讀此頁”功能,若該網站尚未提供,則選單介面就不會出現“朗讀此頁”的功能選項。

此外,在使用Android手機或其平板裝置時若使用Chrome瀏覽器的“朗讀此頁”功能,則目前支援的語言共有12 種,包括中文、英文、法文、德文、日文、俄文、西班牙文、葡萄牙文、印尼文、印地文、阿拉伯文與孟加拉文。

使用安卓手機實測時則發現,在把Chrome升級至125版本後,大部分網站帶有文字內容網頁都有提供“朗讀此頁”功能,且操作方式為點選瀏覽器最右上方的“…”以開啟選單介面,即可在“翻譯”與“加到主畫面”這個區塊看到“朗讀此頁”功能選項。

目前,多數中文網頁都有顯示該新功能選項,若選單沒出現,建議可先點選“翻譯”,之後即可看到選單多了一項“朗讀此頁”功能選項。按下後,網頁底端會出現一個迷你的音訊播放器,點擊展開後,即可進一步更改語音播放速度從0.5X、0.8X、1X至4X,按一下右下角的“…”即可選擇語音聲調。目前,中文語音只提供男聲低音版與女聲中音版。

Androi手機版Chrome 125加入文字轉語音的“朗讀”新功能,可直接把網頁上的文字轉換擬真人語音的音訊播放,且還可自行調整喜愛的朗讀播放速度、切換不同聲調等。

港研發磁力共振掃描儀

成本 安全度更勝MRI

低功耗、小型、無屏蔽MRI掃描器原型及其原理。

核磁力共振影像(MRI)以其非電離、非侵入性、多重對比、定量功能,為醫療保健帶來革命性改變。然而,標準MRI 掃描儀造價高,功耗大,有特別的安裝和使用要求,像是電波隔離室等,限制了它的成本和可移動性,未能普及應用於一般醫療環境中。

由香港大學林護基金教授(生物醫學工程)講座教授吳學奎領導的電機電子工程科研團隊近日開發出一種適用於全身的磁力共振掃描儀,成本遠比目前的MRI掃描儀低,而且更安全,無需昂貴的安裝設施和屏蔽技術,只要接駁標準的插座電源即可,而該項研究也已刊登於知名科學期刊Science。

這款磁力共振掃描儀採用小型0.05 Tesla超低磁場強度的永久磁鐵,結合主動感測和深度學習來處理電磁干擾EMI訊號。同時研究員在掃描儀周圍部署EMI感測線圈,運用深度學習方法,從收集的數據中直接預測無電磁干擾的核磁共振訊號,並也開發了深度學習影像形成方法,提升影像質素並加快掃描時間,或可短至8分鐘就完成整個掃描過程。

不僅如此,當中也整合影像重建和3D超解析度,並利用高場高解析度MRI資料中的同質人體解剖結構和影像對比度。

該研究團隊在研發磁力共振掃描儀過程中,也找來健康志願者進行影像掃描,分別捕捉大腦、脊椎、腹部、肺部、肌肉骨骼和心臟影像,而深度學習有效消除EMI訊號,實現無屏蔽情況下可獲取清晰成像。

至於腦部影像則顯示了各種腦組織,脊椎影像則顯示了椎間盤、脊髓和腦脊髓液,而腹部影像則顯示了肝臟、腎臟和脾臟等主要結構,至於肺部影像則顯示了肺血管和薄壁組織,膝蓋影像則識別了膝蓋結構,例如軟骨和半月板,而心臟動態影像也成功描繪出左心室收縮,頸部血管造影則顯示了頸動脈。

此外,深度學習也很大程度地提高各種解剖結構,包括大腦、脊椎、腹部和膝蓋的影像素質,且有效地抑制雜訊和偽影,並加強影像空間解析度。

吳學奎指出,此次的突破性研究成果將促進開發一種全新的超低場MRI掃描儀技術,以解決全球未滿足的臨床需求。

“我們期待在未來幾年與校?和全球的臨床科學家合作,藉此推進計算驅動的成像技術發展並探索臨床價值。核磁共振現象是大自然賦予我們人類的禮物,我們須更多發掘和利用這種物理現象,造福人類。”

Tags
你也可能感兴趣...