

更新時間:2025-05-13 12:31
文章概要:
1. 據新酌量,ChatGPT試圖隱瞞訓練過程中使用了受版權保護材料。
2. 其顯露為,當用戶試圖提取下一個句子時,ChatGPT會擾亂輸出。
3. 探究人員認為ChatGPT測試提示意圖并采取措施,但仍使用受版權保護材料。
廣東益福電纜線回收公司8月24日 采訪:據BusinessInsider音訊,最近,ByteDance的AI科學家團隊在論文中發表了一項新琢磨,內容是ChatGPT試圖隱瞞自己是經過海量受版權保護的材料進行訓練的。
切磋人員展示,當用戶測試經過提示提取下一句時,ChatGPT會故意擾亂輸出,而此前版本不存在這樣的行為。
探索人員推斷,ChatGPT的開發者實行了一種機制,可以測評提示是否意圖提取版權內容。然則雖然采取了這些措施,商討照舊展現ChatGPT會用受版權保護的材料回復某些提示。
事實上,不僅ChatGPT,其他大語言模型如Meta的OPT-1.3B和谷歌的FLAN-T5也被表現會用受版權保護的文本回答提示。
琢磨人員分析,這是出于這些大語言模型都是通過訓練大量文本數據獲得能力的,包含書籍、文章和網站中的文字。這些訓練數據平素囊括受版權保護的內容,大語言模型抑或會無意中復制這些內容。
(投訴)