● 第 44a 條的「暫時性重製」(Temporary acts of reproduction):如果複製行為是「技術過程所必要」(an integral and essential part of a technical process)的,並且「沒有獨立的經濟價值」(have no independent economic significance),就允許對作品進行臨時、短暫的複製。舉例來說,瀏覽器會暫時儲存網頁的內容,這是顯示網頁所必要的,也沒有獨立的經濟價值,就可能被認定為「暫時性重製」。另外,複製的目的必須是為了「傳輸」或「合法使用作品」。
● 第 44b 條的「文字和資料探勘」(Text and data mining):允許個人或機構為了進行資料探勘(從資料中萃取出有價值的資訊而進行的自動化分析)而複製作品的行為。不過著作權人也可以選擇保留自己的權利,主動以「機器可讀」的形式(machine-readable format)「選擇退出」(opt-out),此時第三方就不能任意使用作品。例如內容提供商可以在網頁上使用 robot.txt,讓自動化的第三方爬蟲快速判斷內容是不可主動抓取的。
● 第 60d 條的「為科學研究目的之文字和資料探勘」(Text and data mining for scientific research purposes):例如大學、科學研究院等研究機構,只要不是追求商業利益、或是為了公益,就可以使用他人的作品。另外,文化遺產機構如圖書館、博物館,或是不追求商業利益的個人使用者也同樣可受到豁免。與第 44b 條不同的是,著作權人無法選擇退出。
雖然原告指出LAION 與 Stability AI 等商業公司關係密切,而 Stability AI 就是使用 LAION-5B 資料集來訓練其商業 AI 模型 Stable Diffusion;除此之外,LAION 曾接受商業公司的資金支持,甚至 LAION 的部分成員就任職於這些商業公司,明顯存在利益關係。然而,法院認為重點是 LAION 自身的行為是否具有商業目的,並非資金來源,而也沒有證據指出資金被 LAION 用於開發自己的商業產品。
不過客觀上來說,似乎難以否認 Stability AI 與 LAION 有某種程度的依存關係(沒有 LAION-5B,就難以打造 Stable Diffusion),只是在訴訟中原告無法成功舉證 Stability AI 對 LAION 有實質的控制力。若原告選擇上訴,這應該仍會是攻防的關鍵點。[5]
雖然 LAION 可以稍微鬆一口氣。但反過來說,這個判決只有利於專門建立資料集的機構,而其他實際用 LAION-5B 資料集訓練 AI 模型的廠商,如Midjourney、Stability AI 等明顯更商業導向的公司,幾乎不可能獲得第 60d 條的豁免,只能冀望其他條款的適用。
「建立」與「使用」資料集是兩種不同的行為
判決書中, 法院刻意區分「建立資料集」和「訓練 AI 」這兩種行為,並指出 LAION 僅負責建立資料集,並未參與 AI 模型的訓練或使用,是否也是在暗示其他使用 LAION 資料集的廠商在法庭上會有不同的結果?另外,法院認為LAION 的複製行為不是「暫時性重製」,且網站只要以一般文字標註就可以符合「機器可讀」的選擇退出,對 AI 開發商是明顯不利的。
話雖如此,那 OpenAI、Meta 等生成式 AI 的開發商,在德國就會陷入極大風險嗎?倒也未必。在判決理由中,德國法院多次提及歐盟的《DSM Directive》以及《AI Act》,而在《AI Act》中歐盟似乎已經表態,訓練 AI 模型應該也屬於《DSM Directive》所規定的一種資料探勘,因此若商業公司尊重著作權人的選擇退出聲明,應可降低部分風險。