自掏腰包買書訓練AI合法嗎?Anthropic獲關鍵勝訴:「合理使用」原則是什麼?
美國AI新創Anthropic去年遭到多位作家提起集體訴訟,指控該公司使用「盜版材料」訓練Claude AI模型。該訴訟還涉及Anthropic將購買來的書籍掃描建,檔供AI訓練的種種侵權行為。
事實上,資料是訓練AI不可或缺的資源,要在沒有海量資料的前提下,通用人工智慧AGI的願景可以說遙不可及。也因此,包括OpenAI等AI巨頭,無不花費大把資金與新聞、圖庫等內容提供平台簽約,以獲得合法的資料進用權。
但現在的問題是,如果一家AI公司自掏腰包買下一堆書籍,並建檔作為訓練AI的資料,是法律允許的嗎?
買書訓練AI「亮綠燈」:屬合理使用範圍
美國加州北區聯邦法院針對上述問題做出關鍵裁定,法官威廉.奧爾薩普(William Alsup)指出,如果Anthropic透過合法管道購買書籍訓練AI模型,屬於「合理使用」範疇。
邁阿密大學法學院法律寫作教授克里斯蒂娜.弗羅霍克(Christina Frohock)解釋,法院認為AI從版權材料中學習,就像 「你我拿起一本書閱讀並形成自己的想法,這是合理使用。」
法官奧爾薩普進一步闡述,著作權法的目的在於促進原創作品的創作,而不是為了保護作者免受競爭,「作者們的抱怨,與他們抱怨訓練兒童寫作會導致競爭作品爆炸式增長,並無不同。」
換言之,奧爾薩普認為 AI 模型的學習過程,與人類透過閱讀學習、進而創作新作品的過程,具有相似的本質。
值得一提的是,Meta在類似訴訟中也提出他們是「合理使用」,認為作者的指控應該被駁回,不過尚不知負責該訴訟的法官,是否與這次Anthropic訴訟抱持相同的看法。
使用盜版材料訓練仍違法
儘管 Anthropic 在「合法購買書籍訓練 AI」的部分取得了勝利,但這項裁決並非全然對其有利 。法官奧爾薩普同時指出,Anthropic 從「盜版」途徑獲取了超過700萬本書籍,並將這些盜版書籍存儲在其「中央圖書館」,即使部份書籍未用於訓練,不構成「合理使用」。
這代表儘管購買市售書籍掃描用於訓練雖然沒問題,Anthropic 仍將面臨一場獨立的審判,以釐清其使用盜版內容的法律責任以及可能造成的損害賠償。 另外,法官裁定的「合理使用」僅限於訓練模型,並沒有解決AI輸出內容是否侵權的問題。
Anthropic發言人向媒體表示,「與版權促進創造力和科學進步的宗旨相同,Anthropic的大型語言模型以作品作為訓練對象,並非為了趕上、複製或取代它們,而是為了突破困境、創造出與眾不同的東西。」
不過,Anthropic表示他們並不同意將有另一場獨立審判的決定,但對訴訟整體仍然抱持信心。
近年來,為了避免類似的爭議,AI公司開始主動與媒體、內容產業合作獲得使用授權,例如OpenAI已經與新聞集團、華盛頓郵報、Shutterstock等公司達成合作;Google也與社群平台Reddit合作,以取得平台上的內容。
延伸閱讀:AI讓工程師變工頭?亞馬遜內部實況曝光:大量「工作降級」,AI好得令人害怕
資料來源:華爾街日報、The Verge、TechCrunch
本文初稿由AI撰寫,編輯:陳建鈞
責任編輯:李先泰
延伸閱讀
ETF大戰開打!富邦006208宣布調降費用率,再添「分割條款」對決龍頭0050
AI轉型先裁員!KKday宣布「精簡15%人力」:估100人以上丟飯碗,官方怎麼說?
「加入《數位時代》LINE好友,科技新聞不漏接」
留言 0