专题副刊

OpenAI推出聲音引擎 輸入人聲 生成人聲

文\蔡宗桓

OpenAI今年動作頻頻,早前才剛展示“只需輸入文字或靜態圖片作為提示,就能生成長達60秒、包含精準場景、複雜運鏡技術等影片”的AI模型“Sora”,如今又展示生成式AI領域的新成果,即一款“只需輸入15秒語音素材,就能生成與人類聲音相似的Voice Engine(聲音引擎)”,並表明可以產生“自然的語音”和“情感豐富且真實的聲音”,再次引發熱議,當中多人更擔憂被不法之徒濫用作為詐騙工具。

Advertisement

OpenAI繼早前推出能生成寫實視頻的AI工具Sora後,再次展現新的研究成果,即一款只需用戶提供短短15秒的語音素材,就能生成與有關語音極為相似的音訊的新工具

標籤
你也可能感兴趣...
Close