據報道,OpenAI將向出版商提供高達500萬美元的新聞內容授權費用,以訓練其大型語言模型(LLM)。據稱,蘋果公司也在進行類似的談判。這一消息是在《紐約時報》宣布起訴OpenAI侵犯其版權一周之后發布的。《紐約時報》指控OpenAI未經其許可使用其文章訓練LLM。
《紐約時報》于2023年12月27日宣布起訴OpenAI侵犯版權,稱后者使用了其數百萬篇文章來訓練其LLM。
2023年,版權所有者一直在批評人工智能開發者使用圖像和文本數據來訓練模型,而不考慮這些數據是否受版權保護。大部分數據來自于從互聯網上胡亂抓取的信息,要么是利用專門構建的網絡爬蟲抓取的,要么是從LAION之類的開源數據提供商獲得的,然后再進行審核和整理。這一整理過程在多大程度上會刪除受版權保護的數據仍是未知數。
《紐約時報》起訴OpenAI侵犯版權,稱其LLM是“通過復制和使用數百萬篇《紐約時報》受版權保護的新聞文章、深度調查、觀點文章、評論、操作指南等內容而構建的”。當時,OpenAI發言人告訴《紐約時報》,OpenAI尊重“內容創作者和所有者的權利,并致力于與他們合作,確保他們從人工智能技術和新的收入模式中獲益”。
OpenAI與主要媒體品牌進行許可談判的決定被視為其避免未來類似訴訟所采用的一種方式。該人工智能實驗室已經與《美聯社》和媒體巨鱷阿克塞爾.施普林格(Axel Springer)達成了協議,與后者的協議將允許OpenAI的ChatGPT服務的用戶接收來自阿克塞爾.施普林格新聞網站的內容摘要,并看到模型對具體問題的回答,同時會注明相關文章來自出版商。這兩項交易的財務條款尚不清楚。不過,據美國科技媒體《The Information》報道,OpenAI為媒體公司提供的內容授權價格在100萬至500萬美元之間。與此同時,據報道蘋果公司將提供更高的報酬,但同時要求對新聞內容擁有更廣泛的使用權。
在版權侵權問題上,OpenAI還面臨著越來越不確定的監管環境。歐盟曾表示,如果使用受版權保護的內容來訓練其模型,LLM開發者必須作出聲明。不過,英國和日本等其他司法管轄區已經宣布,他們有意允許受版權保護的數據用于訓練商業人工智能模型(盡管磋商仍在進行中)。與此同時,包括微軟、谷歌和Adobe在內的幾家大型科技企業已經提出,如果客戶因使用其人工智能產品而面臨版權索賠,它們將對客戶進行賠償。(編譯自techmonitor.ai)
| 中文字幕色色五月天 | 一级女性全黄久久生活片免费 | 午夜福利精品a在线观看 | 色性国产精品不卡视频 | 一级a在线观看中文字幕 |