上傳個人照錄1分鐘語音微軟生成逼真影片

2023-11-26

文＼蔡宗桓

從圖像、視訊到語音，DeepFake（深偽技術）正在建構一個虛假的世界。稍早前，微軟推出虛擬主播服務“Deepfakes Creator”，用戶只需輸入文字既可產生逼真的會說話的真人影片。隨着這項技術不斷成熟，卻也帶來隱藏的“虛假”風險。

微軟在Microsoft Ignite 2023大會中推出的一款新工具“Deepfakes Creator”，使用 Azure AI Speech的功能生成逼真的真人視頻。用戶只需上傳個人形象照，並錄製一段為時約一分鐘的語音， Deepfakes Creator就可根據有關文字生成稿引用用戶的形象說話的視頻，這些話甚至可能是用戶從來沒說過的詞語。

Microsoft Ignite 2023大會推出新產品“Deepfakes Creator”，並使用新工具Azure AI Speech來通過文字與語音形象更有效地創作視頻。

用戶只需上傳想要使用的形象並輸入文字稿，Deepfakes Creator就可以生成逼真的視頻。

此外，Deepfakes Creator還可使用OpenAI的GPT-3.5等AI模型來製作虛擬助手、聊天機器人等，並提供大家自然的互動式對話。只要錄製一段一分鐘的語音樣本，Deepfakes Creator就可以快速複製樣本的聲音來訂製語音助手或者為用戶的內容配音。

不過，由於AI目前的法律界定仍較模糊，為免Deepfakes Creator被濫用，甚至被用於詐騙等手段上，Microsoft針對像Deepfakes Creator這種生成式AI工具使用聲音的部分會有比較多的防護措施。其中包括禁止使用預錄的語音，需要用戶提供“明確同意”的錄音聲明並驗證是否與其他一次性訓練數據匹配，確定後才能讓民眾使用合成語音的功能。此外，也必須添加水印來辨認AI合成語音，以確保有關使用合法和符合倫理。

Deepfakes Creator提供個人化語音功能，而用戶屆時只需提供一分鐘的語音樣本，就能快速複製用月的聲音，用於客製化語音助理和內容配音。

深偽服務恐淪詐騙工具

隨着微軟宣布推出Deepfakes Creator服務，網上也隨之傳來各種質疑聲音。

製造虛假圖像的Deepfake技術（深度偽造技術）玩起來很有趣，但它潛在危害巨大。為了避免被AI deepfakes技術愚弄，有必要了解它們會帶來什麼樣的危險。

眼見為憑，耳聽為證？ DeepfakeAI換臉變聲如何成為詐騙犯罪工具：

何謂“深偽技術（Deepfake）”?

“深偽”（Deepfake）是由深度學習（Deep Learning）及偽造（fake）二詞所組成,它是運用人工智慧（AI）概念的一種技術,可應用於各式媒體素材如圖片、影像、聲音的合成，達到換臉、變的效果。

電影“玩命關頭7”便是使用類似技術，讓拍攝途中因車禍意外離世的男星保羅沃克,其五官及聲音得以“重生”於大銀幕前。不過，這樣的技術卻被有心人士拿來惡作劇，製造假新聞、假訊息，甚至是淪為詐騙工具。

詐騙集團會如何利用Deepfake?

◆電話詐騙：猜猜我是誰

詐騙集團通過聲音合成假冒成受害者的親戚朋友，再撥打電話給受害者, 並指因故急需用錢，請求儘速匯款應急，或是把換臉技術用於視訊，然後偽裝成公司高層，向下屬發出轉帳的指示等。

◆視訊詐騙

DeepFake甚至可發展成視訊詐騙，除了政治人物，名人也是被仿冒的對象，比如馬斯克和幣安執行長都曾遭人冒用來推銷詐騙加密貨幣。2023年5月，一家科技公司的郭姓老闆接了一通好友的視訊電話後，在10分鐘內蒸發1873萬台幣，原來好友的影像竟然就是AI合成。

◆不雅照恐嚇信

據外媒報導，國外有多名知名大學教授的肖像遭詐騙集團移花接木合成不雅照片。再以此寄送恐嚇信向這些教授勒索，威脅說若不繳交封口費便將其照片散布出去。不法份子利用Deepfake技術產出的合成影像、圖片及語音，讓這些騙術變得更加真實。

◆大量生產假新聞

像ChatGPT這樣的大型語言模型非常擅長生成聽起來像人類所製作的文案，且目前沒有有效的工具來發現真假文案之間的差異。因此，若落入有心人手中，恐將變成製作成本很低的假新聞和陰謀論工具，屆時須花更長時間才能揭穿。

◆該怎麼加以預防?

針對來電匯款要求應保持警覺，並主動確認通過深偽製作的合成語音可能讓受話者難辨真偽,甚至會誤認為那是親戚朋友打來的電話，遇到類似情形，應主動暫停通話，並通過其他管道聯繫對方以確認事件真實性，只要能多一層警覺，有關謊言將不攻自破!

◆不要被AI Deepfake愚弄

Deepfake可以以極低的成本快速部署，所需的專業知識或運算能力也很低。它們可採用生成的圖像、語音或AI生成的圖像、音訊和文字組合的形式。過去製作Deepfake困難且耗時，但如今隨着大量AI應用的出現，幾乎任何人都可使用用於創建Deepfake的工具。隨着AI Deepfake技術變得越來越先進，帶來的危險也變得越高。

在AI的幫助下，Deepfake跨越了大多數人沒有準備好的界限——聲音合成。只需少量原始音頻（可能來自你曾發布的TikTok/IG視頻，或你出現在其中的 YouTube視頻),AI模型就可以複製出你的聲音。

遏止防冒 YouTube祭新措施

生成式AI技術興起，為了防止被濫用以製作具有誤導性的視頻，YouTube宣布將強制創作者對使用AI技術製作的視頻進行標註，以提醒觀眾識別此類內容。

這項新政策的相關工作目前還在初步階段，YouTube指出，預計在未來幾個月至明年實施，將推出更新，讓觀眾在看到這類內容時能被提醒。具體而言，YouTube將提供新選項，要求創作者在上傳內容時，指出該內容是否經過變造、合成，或使用AI生成。

如果內容可能經過變造或合成，YouTube會以兩種方式告知觀眾，即在說明面板中新增標籤，標示部分內容經過數位修改或生成，至於涉及敏感議題等特定內容類型，則會在視頻播放器中加上更顯眼的標籤。

此外，若有關視頻由AI產生，那麼，經過合成或修改，且包含臉孔、聲音等可辨識個人身份的模擬內容，用戶能根據隱私權申訴程序要求移除。

YouTube也將對AI生成的音樂內容採取更嚴格的態度，像是之前流行的“AI孫燕姿”、“AI周杰倫”等，未來將不被允許，唱片公司或版權者可以要求移除。

今年9款最佳安卓手機

外媒《ZDNET》從2023年實測過的所有手機中，盤點出9款最佳安卓手機，用戶不妨作為換機參考。

《ZDNET》推薦的9款安卓手機包括三星S23 Ultra、OnePlus Open、Motorola Razr Plus、Google Pixel 8 Pro、Nothing Phone 2、OnePlus 11、Google Pixel 7a、三星A54、華碩ROG Phone 7 Ultimate，而部分機型本地並未販售。

其中，三星S23 Ultra被評選為整體表現最佳，提供最完整的安卓體驗，4鏡頭可靈活運用，以及整合S Pen，儘管需要通過保護殼來擴充。Google Pixel 8 Pro被認為是安卓陣營的最佳拍照手機，並擁有大量AI功能，官方承諾7年軟件更新。

Google Pixel 7a、三星A54這兩款屬於最佳CP值，Google Pixel 7a雖然只有雙鏡頭，但靠極佳的拍照能力脫穎而出，也支援無線充電。三星A54的優點則是120Hz的高流暢熒幕。

此外，華碩ROG Phone 7 Ultimate榮登最佳遊戲手機，除了機體規格強悍，還擁有豐富配件，例如外掛散熱。

最佳摺疊手機方面，《ZDNET》給了OnePlus Open、Motorola Razr Plus，並非三星。Nothing Phone 2擁有最佳設計的頭銜。

明治推出香菇形耳機

支援127種語言

今年7月日本食品公司明治（Meiji）通過網絡發布架空趣味雜貨的圖片，明治的知名產品都被作成日常生活用品，像是明治牛奶立可帶、明治巧克力郵票、明治冰淇淋電風扇，最廣受討論的就是“明治蘑菇山（きのこの山）造型無線耳機”。

當時就有許多網民都希望能把香菇造型耳機商品化。明治宣布週二將在2024年春季推出香菇造型巧克力餅乾無線耳機，並搭載支援127種語言的同步翻譯功能。

明治宣布將在2024年春季推出明治蘑菇山造型的無線耳機，更計劃要把明治齊旗下蘑菇山和竹筍里兩個商品打造成全球品牌。

明治與產品設計師ミチル合作推出明治蘑菇山造型無線耳機，耳機為入耳式設計，耳機盒也按造蘑菇山真實商品包裝設計。

明治蘑菇山造型無線耳機會搭載AI即時翻譯系統“Wooask”，預計可以支援127種語言的同步翻譯功能。同步翻譯功能需要在手機下載專用App才能夠與蘑菇山造型無線耳機連線使用。

明治這次決定商品化架空趣味雜貨的決定想必也讓許多人更期待未來是否會有更多的架空趣味雜貨的腦洞也能被商品化，例如明治牛奶立可帶或明治冰淇淋電風扇。