Open AI 使用 Youtube 內容訓練模型涉版權爭議
為什麼重要
此事凸顯了在快速發展的人工智能領域中,內容版權和數據使用的法律與道德問題,對於依賴大量數據訓練其模型的公司如 OpenAI 和 Google,可能需要重新評估其數據獲取策略。
透過此事件,投資人可了解到 AI 技術發展與內容創建平台之間的緊張關係,這可能影響到 AI 公司與內容平台的合作模式,進而影響這些公司的商業模式和盈利能力。
背景故事
AI 領域的競爭已經引發了對數據的搶奪熱潮,包括 Reddit 與 Google 達成了每年 6000 萬美元的授權協議,將其內容用於訓練後者的 AI 工具。
發生了什麼
YouTube CEO Neal Mohan 表示,使用 YouTube 影片來訓練 OpenAI 的文字到影片生成器將違反平台服務條款。
Mohan 強調,創作者將作品上傳到 YouTube 時,期望平台遵守服務條款,不允許下載轉錄或影片片段。
OpenAI 承認使用了受版權保護的數據來訓練其 AI 模型,稱建立這項技術而不使用這些數據是「不可能的」。
接下來如何
Alphabet 正在開發自己的一系列 AI 工具,這使得 Alphabet 更加關注潛在競爭對手可能以違反其服務條款的方式使用其內容。
Google 和 YouTube 確保使用影片作訓練 Google AI 的數據,是與創作者簽署的服務條款或合約相一致的。
隨著 AI 技術的進步,預計會有更多類似於 Reddit 與 Google 授權協議的合作出現,以合法方式獲取訓練數據。
他們說什麼
YouTube CEO Neal Mohan 在接受 Bloomberg Originals 主持人 Emily Chang 採訪時首次就此話題發表公開評論,指出使用 YouTube 影片訓練 AI 違反服務條款。
OpenAI 首席技術官 Mira Murati 在接受華爾街日報採訪時表示,她不確定 Sora 是否訓練於 YouTube、Facebook 和 Instagram 的用戶生成影片上,並補充說,任何使用的數據都是公開可用或已獲得許可的。
提到的股票
概念股
參考資料
- YouTube Says OpenAI Training Sora With Its Videos Would Break Rules
- OpenAI could be in a ‘clear violation’ of YouTube’s terms of service, CEO says—depending on how it trains its Sora video tool