專題副刊

AI圖編Drag Your GAN 可擅改表情姿勢物件大小

文\蔡宗桓

Drag Your GAN這款實驗性AI圖片編輯工具,能輕易地改變人臉頭部轉向、嘴巴、眼睛開關,甚至可以改變姿勢,也可用來修改車身大小及模特兒的服裝長度,效果讓人非常驚艷。

Advertisement

“Drag Your GAN”展示改變動物姿勢,頭轉向、張嘴閉嘴、張眼閉眼的效果,不僅如此,它還可被用來修改車身大小及模特兒的服裝長度。

現今的修圖軟件的效果常讓人感到驚艷,甚至讓人無法辨別照片的真偽,而隨着人工智慧(AI)越來越強大,預料人類未來將更難辨識經修改的照片的真偽。

最近,網絡更出現一款名為“Drag Your GAN”的實驗性AI圖片編輯工具,並標榜可助一般人輕易達成修圖目的,而用戶只需施以簡單的拖動動作,就可以改變照片中的人或物體的外觀,甚至改變照片中的人物的表情。

來自Google、麻省理工學院、賓夕法尼亞大學和德國馬克斯·普朗克學會的科學家們,早前通過網絡發表一篇論文,內容詳述一種實驗性的AI工具“Drag Your GAN”可助一般人更易掌握影像編輯的操作方式。

ADVERTISEMENT

“Drag Your GAN”的介面很簡單,左邊為功能面板,右邊則是圖片,用戶只需在圖片上方點擊要改變的內容,然後於左邊使用相對應功能,就可達到想要的效果,例如改變照片中人的臉部表情。

該網站也以美國總統拜登的臉部表情為例,並把他原本咧嘴而笑的嘴巴閉上,然後將之改成臉朝右,而不是正面。

這些修改都是靠AI運算完成,而用戶只需指定位置和選擇功能鍵即可,操作非常簡單,不像Photoshop之類的專業修圖軟件,用戶必須動用很多圖層和工具才能完成修圖工作。

該論文說明,若使用NVIDIA的GeForce RTX 3090顯示卡,DragGAN在短短幾秒鐘內就能轉變圖像內容,而且無需依賴多個神經網絡就能達到效果。

接下來,他們還打算創造全新的模型,讓用戶可用點狀來編輯3D模型。

從“Drag Your GAN”展示的效果可以發現,很多原本需要專業技術才能達致的效果,未來將可輕鬆完成。

不過,“Drag Your GAN”目前還沒開放給民眾使用,但GitHub指6月將會釋放程式碼。

原本美國總統拜登正面笑開嘴的表情,在經過幾個指令後,即可將其改為閉上嘴巴且臉朝右的模樣。

由於模擬音色還原度高,“AI孫燕姿”在網絡上瞬間引起熱議。

AI孫燕姿推出多首新歌

人工智慧音樂稀釋市場

AI技術持續發展,而它無論在文字、圖像甚至音樂領域上都有所涉獵,但也並非人人都歡迎AI的到來,至少在音樂行業上就不是。

就以最近突然爆紅的“AI孫燕姿”為例,AI用神似她的聲音出了多首“新歌”,對此,孫燕姿稍早更新部落格時坦言無奈:“我想說的是,你跟一個每幾分鐘就能推出一張新專輯的人還有什麼好爭的”。

打開YouTube或中國影音網站B站便可以發現,“AI孫燕姿”翻唱各類歌曲的作品從4月起便爆發式增長,當中不少都獲得百萬點擊率,比如周傑倫的歌曲《髮如雪》、南拳媽媽的歌曲《下雨天》,以及原由王菲演唱的《紅豆》等。

有媒體公布不完全統計時指出,這類翻唱作品至今已有超過1000首,且數量遠遠超出孫燕姿出道廿多年的作品總和。

科技小白也能做到

雖然AI翻唱技術在唱腔、技巧上離原唱者還有一定差距,但音色已經基本實現復刻,足以以假亂真,顯現歌手聲音擁有權的警訊。孫燕姿本人也為此發文分享看法,“AI超越人類原本就是預期中的事,靜靜看着技術發展、繼續做好自己,已然足夠”。

根據網上提供的教程,製作一首“AI孫燕姿”演唱的歌曲似乎並不困難。用戶先是需要通過軟件的提取,獲得去除噪聲、混響和伴奏的原聲素材。接着把這些人聲素材用於訓練孫燕姿的歌聲音色轉換模型,之後才用模型將歌曲的人聲替換成孫燕姿,一首由“AI孫燕姿”翻唱的歌曲便誕生了。

在這一過程中,核心皆是使用Github上的So-VITS-SVC 4.0替換原曲聲線,簡單來說,它就像一個變聲器,能實現音色的自由切換。即使對AI技術一竅不通的外行,也能通過教程,打造一名AI歌手。

除了孫燕姿,早前也有網民通過網絡發佈視頻,指使用AI生成加拿大歌手Drake和The Weeknd聲音,並模仿他們演唱歌曲Heart On My Sleeve 。該曲目曾在音樂流媒體平台上短暫播放過,其後,環球音樂集團(Universal Music Group)提出版權投訴後,該歌曲便被撤下。

不能讓AI反客為主

日前,英國音樂家Sting接受英國廣播公司採訪時,對AI技術表示擔憂,並指這將是一場必要的戰鬥,同時捍衛人力資本免受AI 侵害。

Sting認為,充作輔助用途的AI可說是百利而無一害,但前提是用戶必須學會駕馭這些技術,不能讓AI反客為主,他也強調:“音樂的基礎屬於我們,屬於人類。”

當然,也有人認為這些AI歌手翻唱的老歌新曲,大家都只是聽聽而已,並沒有進行商業性質交換,所以應該不算是侵權,但若明星的聲音可“被訓練”,那麼,一般人的聲音不就也有被利用的可能?

面對AI版權問題,今年5月,知名串流平台Spotify宣布將陸續下架由AI平台Boomy生成的歌曲,以保障原創者的版權收入。

Spotify指出,人工造假的歌曲一直都是整個行業所面對的問題。“正努力從平台消除上述問題,所以決定讓人工造假串流音樂下架和扣留版稅,以保護誠實、勤奮藝術家的版權稅收入”。

環球唱片執行副總裁邁克爾·納什(Michael Nash)則說:“人工智慧音樂”正在稀釋市場,使原創作品更難找到,並侵犯藝術家獲得作品報酬的合法權利。

谷歌採用生成式AI技術搜尋引擎

先供美國用戶試用

Google(谷歌)稍早前宣布,將採用生成式AI技術的搜尋引擎(SGE),且即日起開放供美國用戶搶先試用。

究竟通過AI能為搜尋帶來哪些改變?對此,Google通過官方部落格親自解釋3種優勢。

1.加速理解全新或複雜的主題

假設你想知道“學習烏克麗麗、吉他的差異”,以往必須拆散主題分別搜尋,如今,AI會替用戶統整資料進行比較,同時分析選擇任一者需要考慮的因素。此外,若想要自行創業,用戶也可搜尋“成為自由業者前,建立公司的好處”,而AI除了可快速理解相關資訊,同時也能通過文章連結,獲得更深入的研究。

2.針對特定問題獲得解答

我們平日常會遇到一些非常具體的問題,而只要擁有更多細節,就能讓AI發揮作用,Google舉例說,如用戶可詢問:“如何去除毛衣上的咖啡漬”或是“如何快速更換護照?”新的Google搜尋引擎將能確保結合用戶所給的條件,提供一系列可採取的行動建議。

3.購物建議

在網購比價方面,AI搜尋引擎也能發揮作用,並得以加入更多因素在關鍵字裡,例如廚房使用的壁紙、用在泳池派對的藍牙喇叭,除了能找到價格與用戶評價,AI更會針對用戶的需求篩選,以找出具有防水保護及較長電池壽命的機款。Google也將支援對話功能,讓用戶能進一步輸入詢問相關資訊。

利用“人工樹葉”製作汽車燃料鎮

電動車雖是目前相當受矚目的“零排放”汽車,但依然有不少研究希望能找出其他方式。最近有研究就開發出“人工樹葉”,即通過模擬類似光合作用的效果,將二氧化碳轉為可充作汽車燃料的乙醇和丙醇。

劍橋大學的研究人員最近發表新的報告,指他們已開發出一種“人工樹葉”,其原理是使用銅、玻璃、銀和石墨等多種材料,配合吸光劑和催化劑,模擬真正樹葉的光合作用,然後將它放在陽光下,就可把二氧化碳轉化為乙醇和丙醇,且可把水轉化成氧氣。

這種轉化作用之前一直需要耗用電力進行,現在則可以只憑陽光便達到同樣效果,而且不會產生合成氣。

科學家指出,這將使得有關技術更實用和具有擴充潛力。雖然該技術目前仍處於實驗室階段,但研究員仍在積極改良吸光劑和催化劑,以提升效能,並認為未來技術成熟之後,有助推動大馬脫離化石燃料。

科學家研發出“人工樹葉”,以光合作用製作汽車燃料。

西班牙創新猷

機械臂達文西完成肺部移植

最近一眾歐洲國家的醫學科技發展可謂創舉不斷,繼早前意大利研發出“可食用電池”,西班牙最近也有全球首例全過程以機械臂完成肺部移植手術的消息傳出。

據外媒報導,西班牙希伯倫谷大學醫院(Vall d’Hebron University Hospital)完成了全球首宗全程運用4頭機械臂“達文西”的肺部移植手術。

眾所週知,肺部器官移植手術是一項極其複雜、高風險的手術,醫生需切開患者胸骨,並會留下近30cm的傷口。對醫生和患者來說,都是極大的考驗。

新技術的面世將大大改變現狀。通過4頭機械臂“達文西”及3D相機技術,手術所造成的傷口將縮小至8cm。

胸腔外科手術及肺部移植項目總監Dr Albert Jauregui說,這項技術能從胸骨之間精準地將新的肺植入人體,且只需割開小面積皮膚,並且相信新技術能減低患者的痛楚,並有助其術後康復。

作為全球首位使用相關技術的器官移植者65歲的Xavier指,他在為時約5小時的手術過程中,完全沒有感覺到痛楚。

Dr Jauregui 繼稱,他們希望新技術日後能被應用在更多領域,以延長患者的壽命。

西班牙完成全球首宗全程運用4頭機械臂「達文西」的肺部移植手術。

 

Tags
你也可能感兴趣...