Nvidia 推出 Fugatto,革新音訊生成技術
發佈時間:2024/11/28
為什麼重要
Nvidia 開發的 Fugatto 人工智慧模型將為音樂娛樂、翻譯服務等行業帶來創新工具,提升音訊創作與處理的效率與多樣性。
背景故事
#Fugatto、#AI 影響、#娛樂行業
Nvidia 開發了名為 Fugatto 的新型人工智慧模型,該模型能夠創造聲音效果、改變人聲並使用自然語言提示生成音樂。
Fugatto 被定位為一項研究專案,Nvidia 目前沒有發布此技術的計劃,但該技術可能對從音樂娛樂到翻譯服務的多個行業產生廣泛影響。
娛樂行業與 AI 的關係複雜,美國作家協會和美國演員工會曾因擔心好萊塢工作室使用 AI 削減寫作職位或複製演員形象而與工作室進行過抗爭。
發生了什麼
#多功能性、#突現屬性、#情感音訊
Fugatto 能夠執行多個模型的任務,這使其與其他模型不同,例如可以透過標準詞提示生成音訊,也可以操作上傳的音訊檔案,如將某人的話轉譯成另一種語言,同時保持其聲音特徵。
Fugatto 是第一個具有突現屬性的基礎模型,能夠混合其訓練的元素並遵循「自由形式指令」。
Fugatto 不僅可以生成音訊,還可以讀取檔案並以任何聲音讀出,甚至可以產生帶有情感重量的聲音。
接下來如何
#音樂創作、#倫理問題、#工會關注
Fugatto 的開發可能會對音樂家和音樂創作方式產生重大影響,提供新的工具和探索音訊的新途徑。
該技術的進一步發展和應用可能會引起娛樂行業和相關工會的關注,特別是在使用 AI 技術與創意工作相關的倫理和就業問題上。
他們說什麼
Nvidia 的應用深度學習研究副總裁 Bryan Catanzaro 表示:「Fugatto 能夠使用語言合成音訊,我希望這項技術能幫助音樂家,音訊一直是探索的豐富領域。」
提到的股票
概念股
參考資料
- Nvidia unveils AI model for audio modification and generation
- Nvidia debuts AI model that can create music, mimic speech
- 輝達 (NVDA) 2025 Q3 法說會逐字稿
編輯整理:Maggie Wei