開源開發(fā)者須知:歐盟《人工智能法案》對(duì)通用人工智能模型的最新要求
?? 本文不構(gòu)成任何法律意見或建議。
快速摘要 (TL;DR): 自 2025 年 8 月 2 日起,歐盟《人工智能法》將對(duì)通用人工智能(GPAI)模型的提供者模型提供者提出新的合規(guī)要求。但是對(duì)于用于科研目的,或者是以自由和開源許可證方式發(fā)布的模型,則可以獲得全部或部分豁免。本指南旨在幫助 AI 開發(fā)者判斷這些合規(guī)要求是否與自己在通用人工智能(GPAI)模型相關(guān)的工作有關(guān),以及在必要時(shí)應(yīng)如何履行,依據(jù)包括《人工智能法》,GPAI 行為準(zhǔn)則(Code of Prtice)和GPAI 指南等文件。
人工智能法:
Regulation - EU - 2024/1689 - EN - EUR-Lex
GPAI 行為準(zhǔn)則 (Code of Pratice) :
The General-Purpose AI Code of Practice
GPAI 指南:
Guidelines on the scope of obligations for providers of general-purpose AI...
訓(xùn)練數(shù)據(jù)公開摘要模板:
Commission presents template for General-Purpose AI model providers to...
歐盟《人工智能法》已于 2024 年 8 月 1 日正式生效,確立了一套基于風(fēng)險(xiǎn)的監(jiān)管規(guī)則,用來(lái)決定哪些人工智能系統(tǒng)和通用人工智能(GPAI)模型可以在歐盟市場(chǎng)銷售和部署,以及具體的方式。該法律將分階段實(shí)施,直至 2027 年 8 月全面落地。并且自 2025 年 8 月 2 日起,所有在歐盟市場(chǎng)投放 GPAI 模型的提供者,都必須遵守一系列合規(guī)要求,無(wú)論企業(yè)是否設(shè)立在歐盟境內(nèi)。對(duì)于在 2025 年 8 月 2 日之前已進(jìn)入歐盟市場(chǎng)的 GPAI 模型,其提供者必須在 2027 年 8 月 2 日之前完成合規(guī)。
對(duì)開源社區(qū)來(lái)說(shuō),這是一個(gè)好消息 —— 歐盟《人工智能法》為研究人員和開源開發(fā)者提供了更便捷的合規(guī)路徑,甚至在一定情況下實(shí)現(xiàn)自動(dòng)合規(guī)。許多為科學(xué)研究目的而開發(fā) GPAI 模型的研究人員,并不在該法規(guī)的適用范圍之內(nèi),非商業(yè)活動(dòng)下的開發(fā)同樣如此。對(duì)于那些確實(shí)落入歐盟《人工智能法》適用范圍的模型,如果以自由和開源許可證方式發(fā)布,其開發(fā)者也可以部分豁免。這些豁免條款體現(xiàn)了監(jiān)管方對(duì)開放式開發(fā)的價(jià)值與潛力的認(rèn)可,同時(shí)也確保了必要的責(zé)任追究。不過(guò),在現(xiàn)實(shí)中是很難判斷這些豁免在何種情況下、以及在多大程度上適用。
本指南的核心目標(biāo)是幫助解答這些問(wèn)題,并為研究人員和開發(fā)者在使用或開發(fā)開源 GPAI 模型時(shí),提供一個(gè)清晰易懂的入門途徑。我們將帶你逐步了解關(guān)鍵定義、相關(guān)義務(wù),以及開源豁免條款,并說(shuō)明開源提供者如何依據(jù)歐盟委員會(huì)的官方指導(dǎo)來(lái)實(shí)現(xiàn)合規(guī),例如 GPAI 行為準(zhǔn)則,GPAI 指南和訓(xùn)練數(shù)據(jù)公開摘要模板。
如果你時(shí)間有限,可以使用我們制作的交互式應(yīng)用,它可以幫助你快速獲得整體概覽。?? Os Gpai Guide Flowchart - a Hugging Face Space by hfmlsoc
如果你需要更多關(guān)于《人工智能法》的指導(dǎo),我們還在 Hugging Face 和 Linux 基金會(huì)發(fā)布了面向開源開發(fā)者的一般性指南供參考。
用戶路徑:你是否符合“GPAI 模型提供者”的資格?如果是,哪些條款適用?

?? Os Gpai Guide Flowchart - a Hugging Face Space by hfmlsoc
這個(gè)應(yīng)用程序可以幫助開源開發(fā)者評(píng)估他們的 GPAI 模型項(xiàng)目是否使其符合《人工智能法》下“GPAI 模型提供者”的定義。如果是,那么有哪些相關(guān)義務(wù)需要遵守。你也可以在 Hugging Face Space 中查看更全面、更獨(dú)立的版本。
目錄
-
理解對(duì) GPAI 模型提供者的要求
- 如果僅為研究目的開發(fā) GPAI 模型,算是提供者嗎?
- 如果微調(diào)或修改了另一提供者的 GPAI 模型,算是提供者嗎?
- 什么是“GPAI 模型”?
- 什么是“GPAISR 模型”?
- 什么情況下開發(fā)者會(huì)被認(rèn)定為 GPAI 模型的“提供者”?
-
理解 GPAI 模型提供者的開源豁免
- 我是否符合開源豁免條件?
- 哪些義務(wù)包含在開源豁免之內(nèi)?
-
理解適用義務(wù)對(duì)應(yīng)的合規(guī)要求
- 第 53 條 (1a-b):透明度與文檔
- 第 53 條 (1c):版權(quán)
- 第 53 條 (1d):訓(xùn)練數(shù)據(jù)文檔
- 第 55 條:GPAISR 模型的安全性與保障
-
下一步與行動(dòng)呼吁
理解對(duì) GPAI 模型提供者的要求
什么是 “GPAI 模型”?
摘要 (TL;DR): 《人工智能法》中的 GPAI 模型這一術(shù)語(yǔ),大致相當(dāng)于人們常說(shuō)的“基礎(chǔ)模型”。通常來(lái)說(shuō),如果一個(gè)模型能夠在廣泛任務(wù)上表現(xiàn)良好,能生成文本或其他形式的媒體,并且其累計(jì)訓(xùn)練計(jì)算量達(dá)到或超過(guò) 1023 浮點(diǎn)運(yùn)算(FLOPs),那么它很可能會(huì)被歸為《人工智能法》中的 GPAI 模型。
《人工智能法》將 GPAI 模型分為兩類:一般的 GPAI 模型,以及具有系統(tǒng)性風(fēng)險(xiǎn)的 GPAI 模型(GPAISR,見下一節(jié))。根據(jù) 其第 3 條第 63 款 的定義,GPAI 模型是指:“人工智能模型,包括那些通過(guò)大規(guī)模自監(jiān)督方式訓(xùn)練、具備顯著通用性,并能夠勝任多種不同任務(wù)的模型,無(wú)論其在市場(chǎng)上的投放方式如何,該類模型都能夠被集成到各種下游系統(tǒng)或應(yīng)用中。但僅用于研究、開發(fā)或原型階段、且尚未進(jìn)入市場(chǎng)應(yīng)用的模型不屬于此范圍。”
根據(jù) GPAI 指南的說(shuō)明,判斷一個(gè)模型是否屬于 GPAI 模型的參考標(biāo)準(zhǔn)是:其訓(xùn)練計(jì)算量超過(guò) 1023 浮點(diǎn)運(yùn)算(FLOPs),且具備生成語(yǔ)言(文本或語(yǔ)音)、文本生成圖像或文本生成視頻的能力。 指南指出,這一閾值大致相當(dāng)于訓(xùn)練一個(gè)擁有十億參數(shù)規(guī)模的模型所需的計(jì)算量(在大規(guī)模數(shù)據(jù)上進(jìn)行訓(xùn)練)。指南還給出了在適用范圍內(nèi)和不在適用范圍內(nèi)的模型示例(見表 1)。
| ? GPAI 模型示例 | ? 非 GPAI 模型示例 |
|---|---|
| 一個(gè)在廣泛的自然語(yǔ)言數(shù)據(jù)(例如文本)上進(jìn)行訓(xùn)練的模型,這些數(shù)據(jù)經(jīng)過(guò)整理并從互聯(lián)網(wǎng)及其他來(lái)源抓取(當(dāng)前語(yǔ)言模型的典型做法),訓(xùn)練所使用的計(jì)算量為 1024 FLOPs。 | - 一個(gè)專門用于將語(yǔ)音轉(zhuǎn)錄為文本的模型,訓(xùn)練所使用的計(jì)算量為 1024 FLOPs。 - 一個(gè)專門用于下棋或玩電子游戲的模型,訓(xùn)練所使用的計(jì)算量為 1024 FLOPs。 - 一個(gè)專門用于氣象模式或物理系統(tǒng)建模的模型,訓(xùn)練所使用的計(jì)算量為 1024 FLOPs。 |
表 1:符合或不符合 GPAI 模型定義的示例(來(lái)源:歐盟委員會(huì),GPAI 指南)
請(qǐng)注意,GPAI 模型與《人工智能法》中的“人工智能系統(tǒng)(AI systems)”定義不同 —— “人工智能系統(tǒng)”的定義見 《人工智能法》第 3 條第 1 款。根據(jù)序言第 97 條,雖然 GPAI 模型是人工智能系統(tǒng)的重要構(gòu)建模塊,但它們本身并不是人工智能系統(tǒng)。
要成為一個(gè)人工智能系統(tǒng),模型必須與額外的組件結(jié)合,例如用戶界面或其他功能模塊,從而實(shí)現(xiàn)交互和部署。根據(jù)你提供的是 GPAI 模型、人工智能系統(tǒng),還是兩者兼有(例如,將 GPAI 模型集成到用戶界面),適用的法律要求可能會(huì)不同。
當(dāng)提供者同時(shí)提供通用人工智能模型(GPAI)與具體人工智能系統(tǒng)(AI systems)時(shí),相關(guān)要求將同時(shí)適用。而針對(duì)人工智能系統(tǒng)的要求,則取決于該系統(tǒng)可能帶來(lái)的風(fēng)險(xiǎn)強(qiáng)度與風(fēng)險(xiǎn)范圍。本指南未涵蓋這些進(jìn)一步的要求。
什么是 “GPAISR 模型”?
摘要 (TL;DR): 具有系統(tǒng)性風(fēng)險(xiǎn)的 GPAI 模型(GPAISR)大體上等同于所謂的“前沿模型”(Frontier models),即當(dāng)前市場(chǎng)上最先進(jìn)的 GPAI 模型。如果一個(gè)模型符合《人工智能法》對(duì)“高影響能力”的定義,或者其訓(xùn)練計(jì)算量超過(guò) 1025 FLOPs,那么該模型將被視為 GPAISR。
根據(jù) 《人工智能法》第 51 條第 1 款,如果 GPAI 模型符合以下兩個(gè)條件之一,就會(huì)被歸類為具有系統(tǒng)性風(fēng)險(xiǎn):
- 具備“高影響能力”,這些能力與當(dāng)前最先進(jìn)模型中記錄的能力相當(dāng)或更強(qiáng),并且是通過(guò)適當(dāng)?shù)募夹g(shù)工具、方法學(xué)、指標(biāo)和基準(zhǔn)測(cè)試進(jìn)行評(píng)估的。
- 根據(jù)歐盟委員會(huì)作出的決定,它具備與“高影響能力”等同的能力或影響,這一判斷基于《人工智能法》正文中提供的一系列標(biāo)準(zhǔn)(見附件 XIII: https://eur-lex.europa.eu/eli/reg/2024/1689/oj#anx_XIII),例如模型的規(guī)模、在基準(zhǔn)和評(píng)估中的表現(xiàn),以及其在整個(gè)歐盟的使用廣泛程度。
當(dāng) GPAI 模型的累計(jì)訓(xùn)練算力超過(guò) 10^25 次浮點(diǎn)運(yùn)算時(shí),即可推定其具備高影響力能力。目前,這一門檻主要適用于處于人工智能前沿的模型,例如 GPT-4o、Grok 4 或 Mistral 2 Large。GPAI 指南 對(duì)這一算力閾值的設(shè)定,旨在用于識(shí)別具備高影響力能力的通用人工智能模型。為了確保《人工智能法案》能夠與技術(shù)前沿保持同步,歐盟委員會(huì)可能會(huì)隨著時(shí)間推移,對(duì)性能指標(biāo)和算力閾值進(jìn)行調(diào)整。
雖然所有達(dá)到該閾值的模型都必須向歐盟委員會(huì)進(jìn)行通報(bào),依據(jù)《人工智能法》 序言第 112 條,開發(fā)者也可以提交證據(jù), “證明由于其特定特性,該通用人工智能模型在特殊情況下并不構(gòu)成系統(tǒng)性風(fēng)險(xiǎn)” 。例如,如果模型在 《行為準(zhǔn)則》(Code of Practice)安全與保障章節(jié)附錄 1.3.1 中列出的能力低于其他非 GPAISR 模型,那么這一例外機(jī)制可能適用。此類情形對(duì)一些主要作為研究成果而開發(fā)的超大規(guī)模模型中,可能具有實(shí)際意義。
什么情況下開發(fā)者會(huì)被認(rèn)定為 GPAI 模型的“提供者”?
摘要 (TL;DR): 無(wú)論是否設(shè)立在歐盟境內(nèi),如果同時(shí)滿足以下兩個(gè)條件,都會(huì)被視為 GPAI 模型的提供者:1)開發(fā)了一個(gè) GPAI 模型,或由他人代開發(fā);2)將其投放至歐盟市場(chǎng)。這意味著你本人或你所在的組織將其提供用于分發(fā),或在歐盟的商業(yè)活動(dòng)中使用,無(wú)論是有償還是無(wú)償。在撰寫本指南時(shí),關(guān)于在此語(yǔ)境下何為“商業(yè)活動(dòng)”的確切界限仍存在一定不確定性。盡管相關(guān)歐盟法規(guī)表明,其適用范圍不太可能涵蓋個(gè)人“業(yè)余開發(fā)者”的工作,也不會(huì)自動(dòng)包括開發(fā)者在 GitHub 或 Hugging Face 等平臺(tái)上以 FOSS(自由及開源軟件)許可證形式、且未進(jìn)行商業(yè)化的共享成果,但最終的認(rèn)定仍可能需要根據(jù)具體情況逐案決定。
《人工智能法》在 第 3 條第 3 款 中對(duì) GPAI 模型的提供者定義為:“自然人或法人、公共機(jī)構(gòu)、代理機(jī)構(gòu)或其他組織,在其名義或商標(biāo)下開發(fā)人工智能系統(tǒng)或 GPAI 模型,或委托他人開發(fā)人工智能系統(tǒng)或 GPAI 模型,并將其投放市場(chǎng)或投入使用的,無(wú)論是有償還是無(wú)償。”第 3 條 將“投放市場(chǎng)”定義為“首次在歐盟市場(chǎng)上提供人工智能系統(tǒng)或 GPAI 模型”(第 3 條第 9 款);并將“在市場(chǎng)上提供”定義為“在商業(yè)活動(dòng)過(guò)程中,為在歐盟市場(chǎng)分銷或使用而提供人工智能系統(tǒng)或 GPAI 模型,無(wú)論是有償還是無(wú)償”(第 3 條第 10 款)。
簡(jiǎn)單來(lái)說(shuō),根據(jù)歐盟法律,當(dāng)一項(xiàng)產(chǎn)品首次在歐盟市場(chǎng)上被提供時(shí),即被視為“投放市場(chǎng)”。此后,任何進(jìn)一步的供應(yīng)(例如從一個(gè)分銷商到另一個(gè)分銷商,或到最終用戶)都被稱為“在市場(chǎng)上提供”。 序言第 97 條(注:在歐盟法律中,序言為法律條款提供非約束性的解釋)進(jìn)一步說(shuō)明: “GPAI 模型可以通過(guò)多種方式投放市場(chǎng),包括通過(guò)代碼庫(kù)、應(yīng)用程序接口(API)、直接下載,或?qū)嶓w拷貝等形式。”
“商業(yè)活動(dòng)”的概念對(duì)于理解在什么情形下構(gòu)成在歐盟市場(chǎng)投放一個(gè)模型或系統(tǒng)至關(guān)重要;這一概念比單純的“向歐盟公民提供”更具針對(duì)性。雖然在《人工智能法》的適用范圍內(nèi),關(guān)于 AI 模型的具體認(rèn)定尚未做出,但 《藍(lán)皮書》(Blue Guide)—— 關(guān)于歐盟產(chǎn)品規(guī)則實(shí)施的指南(https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=oj:JOC_2022_247_R_0001) 被設(shè)計(jì)為立法框架下的一般性指導(dǎo)文件。根據(jù)《藍(lán)皮書》: “商業(yè)活動(dòng)被理解為在與商業(yè)相關(guān)的背景下提供商品。如果非營(yíng)利組織在這樣的背景下運(yùn)作,也可能被視為從事商業(yè)活動(dòng)。這一認(rèn)定只能根據(jù)具體情況逐案決定,需要考慮供應(yīng)的規(guī)律性、產(chǎn)品的特征、供應(yīng)者的意圖等因素。原則上,慈善機(jī)構(gòu)或業(yè)余愛好者的偶發(fā)性供應(yīng),不應(yīng)被視為發(fā)生在與商業(yè)相關(guān)的背景下。”
作為另一項(xiàng)參考,可以考慮歐盟的《網(wǎng)絡(luò)彈性法案》(CRA)。CRA 中說(shuō)明了生產(chǎn)自由和開源軟件的個(gè)人或組織是否應(yīng)被歸為該法案中的“制造商”。CRA 的序言第 18 條 部分指出: “……被認(rèn)定為自由及開源軟件(FOSS)的數(shù)字元素產(chǎn)品的提供行為,如果其制造商未對(duì)其進(jìn)行商業(yè)化,不應(yīng)被視為商業(yè)活動(dòng)。” 雖然《網(wǎng)絡(luò)彈性法案》的措辭可能對(duì)《人工智能法案》的解釋不具備約束力,但其中的這一表述以及其他相關(guān)措辭確實(shí)指向一種理解,即在FOSS 許可下提供的軟件,并不總是、也并非本質(zhì)上就應(yīng)當(dāng)被視為《網(wǎng)絡(luò)彈性法案》意義下的“商業(yè)活動(dòng)”,特別是在生產(chǎn)者未對(duì)其進(jìn)行“商業(yè)化”的情況下。這可能意味著,在《人工智能法案》的適用中,也會(huì)采取類似的處理方式。
同樣需要特別注意的是,《人工智能法》具有域外適用效力,這意味著它適用于那些將 GPAI 模型投放歐盟市場(chǎng)的提供者,而不論其是否設(shè)立在歐盟境內(nèi)或第三國(guó)。設(shè)立或位于第三國(guó)的提供者,必須在將 GPAI 模型投放歐盟市場(chǎng)之前,指定一家設(shè)立在歐盟的授權(quán)代表。然而,正如下文進(jìn)一步討論的,這一義務(wù)并不適用于以自由和開源許可證方式提供 GPAI 模型的提供者,除非這些模型構(gòu)成系統(tǒng)性風(fēng)險(xiǎn)。
僅為研究目的開發(fā) GPAI 模型,算是提供者嗎?
摘要 (TL;DR): 僅為科學(xué)研究與開發(fā)而開發(fā)的 GPAI 模型,不適用《人工智能法》,因此享有豁免。
如果僅出于科學(xué)研究與開發(fā)目的開發(fā) GPAI 模型,根據(jù)《人工智能法》,不會(huì)被認(rèn)定為提供者,因此不受其義務(wù)約束。這意味著,當(dāng) GPAI 模型的開發(fā)主要目的是將模型及相關(guān)數(shù)據(jù)作為科研成果發(fā)布時(shí),特別是在學(xué)術(shù)機(jī)構(gòu)和非營(yíng)利環(huán)境中,歐盟《人工智能法》不會(huì)施加任何額外要求。第 2 條第 6 款 規(guī)定:“本條例不適用于專門為科學(xué)研究和開發(fā)的唯一目的而開發(fā)和投入使用的人工智能系統(tǒng)或人工智能模型,包括其輸出。”
根據(jù) 序言第 25 條,在產(chǎn)品導(dǎo)向型研究過(guò)程中進(jìn)行的測(cè)試和開發(fā)活動(dòng)同樣不在《人工智能法》的適用范圍之內(nèi),盡管這種豁免在模型于測(cè)試過(guò)程中被投放市場(chǎng)或投入使用時(shí)終止。序言第 109 條 進(jìn)一步說(shuō)明,雖然為科學(xué)研究目的開發(fā) GPAI 模型的開發(fā)者享有豁免,但應(yīng)鼓勵(lì)他們自愿遵循提供者的相關(guān)義務(wù)。
微調(diào)或修改了另一提供者的 GPAI 模型,算是提供者嗎?
摘要 (TL;DR): 如果你以某種方式微調(diào) GPAI 模型,并顯著改變了模型,那么你可能需要在可行范圍內(nèi)遵守對(duì)提供者的要求。一個(gè)經(jīng)驗(yàn)法則是:如果微調(diào)所用的計(jì)算量超過(guò)基礎(chǔ)模型訓(xùn)練計(jì)算量的三分之一,就會(huì)屬于這種情況。
只有在修改導(dǎo)致模型的通用性、能力或系統(tǒng)性風(fēng)險(xiǎn)發(fā)生顯著變化時(shí),才會(huì)被視為 GPAI 模型的提供者。所謂“顯著變化”的閾值是:修改所需的訓(xùn)練計(jì)算量超過(guò)原始模型訓(xùn)練計(jì)算量的三分之一。
如果無(wú)法確定這一數(shù)值(例如原始提供者沒有披露訓(xùn)練計(jì)算量),GPAI 指南 解釋說(shuō),應(yīng)使用替代閾值:對(duì)于 GPAI 模型,是 1023 FLOPs 閾值的三分之一;對(duì)于 GPAISR 模型,是 1025 FLOPs 閾值的三分之一。
如果對(duì)模型的修改使你被認(rèn)定為提供者,那么在第 53 條中的要求僅限于你所做的修改,這意味著只需記錄微調(diào)過(guò)程、新的訓(xùn)練數(shù)據(jù)以及所做的更改即可。此外,若 GPAI 模型提供者設(shè)立在第三國(guó),則在將其投放歐盟市場(chǎng)之前,必須通過(guò)書面授權(quán)委任一名在歐盟設(shè)立的授權(quán)代表的義務(wù)同樣適用,除非該經(jīng)微調(diào)或修改的GPAI模型符合開源豁免條件。
理解 GPAI 模型提供者的開源豁免
被認(rèn)定為 GPAI 或 GPAISR 模型的“提供者”意味著該模型受到《人工智能法》的規(guī)范,并需遵守第 51 條 至 55 條 所規(guī)定的多項(xiàng)義務(wù)。然而,如果 GPAI 模型在投放歐盟市場(chǎng)時(shí)是以自由和開源許可證發(fā)布的,則可以免除其中部分要求。理解自己在《人工智能法》下的義務(wù)的下一步,就是弄清這些豁免的適用范圍。
要符合開源豁免條件,你必須同時(shí)滿足以下三個(gè)條件:
- 模型必須以自由和開源許可證發(fā)布(允許訪問(wèn)、使用、修改和再分發(fā))。
- 不允許:帶有“僅限研究”、“禁止商業(yè)用途”或其他使用限制的許可證。
- 例外:在 FOSS 許可證中,若與安全相關(guān)的使用限制是成比例的,則可能是允許的(參見 CoP 第 84 段)。
- 參數(shù)(包括權(quán)重)、模型架構(gòu)和使用信息必須公開可得。
- 模型不得被商業(yè)化。
- 不允許:對(duì)訪問(wèn)收費(fèi)、與付費(fèi)服務(wù)捆綁、基于廣告的分發(fā),或以收集用戶數(shù)據(jù)作為訪問(wèn)條件。
我是否符合開源豁免條件?
摘要 (TL;DR): 如果你以自由和開源許可證發(fā)布 GPAI 模型,并附帶足夠的文檔,同時(shí)不對(duì)模型進(jìn)行商業(yè)化,那么你將部分豁免于 GPAI 開發(fā)者的相關(guān)要求。
要符合 GPAI 模型的開源豁免條件,第 53 條第 2 款 和 GPAI 指南明確規(guī)定,你必須同時(shí)滿足以下三個(gè)條件:
- GPAI 模型必須以自由和開源許可證發(fā)布,并允許訪問(wèn)、使用、修改和分發(fā)該模型。
- 參數(shù)(包括權(quán)重)、模型架構(gòu)信息以及模型使用信息必須公開可得。
- GPAI 模型不得以收費(fèi)方式提供,也不得以其他方式商業(yè)化。
對(duì)于自由和開源許可證的定義,通常包括廣泛使用的寬松型軟件許可證,如 Apache 2.0 和 MIT,以及寬松型模型許可證,如 OpenMDW。根據(jù) GPAI 指南的解釋,必須同時(shí)滿足四項(xiàng)權(quán)利(即訪問(wèn)、使用、修改和分發(fā)) ,才算作自由和開源許可證(第 78 段)。因此,帶有使用限制的許可證(例如“僅限研究”、“可接受使用限制條款”、“商業(yè)條款”)不符合自由和開源許可證的要求(第 83 段)。不過(guò),指南在后續(xù)說(shuō)明中補(bǔ)充道,如果出于公共安全、安保或基本權(quán)利存在重大風(fēng)險(xiǎn)的擔(dān)憂,許可方在某些領(lǐng)域可以設(shè)置特定的、適度的、與安全相關(guān)的使用限制,這是可以被允許的(第 84 段)。
如果 GPAI 模型以收費(fèi)方式提供或以其他方式商業(yè)化,它將無(wú)法享受開源豁免。根據(jù) GPAI 指南,商業(yè)化的情形包括:將模型的獲取與任何形式的支付掛鉤;要求用戶從提供者處購(gòu)買其他產(chǎn)品或服務(wù)(例如技術(shù)支持或培訓(xùn)服務(wù));在開發(fā)者托管的平臺(tái)上強(qiáng)制觀看廣告;或提供者接收和/或處理個(gè)人數(shù)據(jù)。序言第 103 條 進(jìn)一步澄清: “通過(guò)開放式存儲(chǔ)庫(kù)提供人工智能組件本身不應(yīng)構(gòu)成商業(yè)化” ,但其界限取決于在模型的分發(fā)或使用過(guò)程中是否采用了額外的商業(yè)化策略。
開源豁免所涉及的要求有哪些?
摘要 (TL;DR): 如果你符合開源豁免條件,你仍然需要提供訓(xùn)練數(shù)據(jù)的詳細(xì)文檔,并證明你遵守了歐盟的版權(quán)法。但你無(wú)需滿足向歐盟委員會(huì)或下游用戶提交更詳細(xì)文檔的要求,也不需要在歐盟指定授權(quán)代表。
《人工智能法》對(duì) GPAI 模型提供者的義務(wù)采取分級(jí)方式(見表 3)。第 53 條和 54 條 規(guī)定了一些適用于所有 GPAI 模型的基線義務(wù) —— 但以自由和開源許可證發(fā)布的 GPAI 模型可免除其中部分義務(wù)(見表 3 左上角象限)。除此之外,更嚴(yán)格的義務(wù)(見第 55 條)適用于 GPAISR 模型的提供者,而這些模型不享有任何開源豁免。
| ** ** | 使用自由和開源許可證 | 未使用自由和開源許可證 | ||||
|---|---|---|---|---|---|---|
| 通用人工智能 (GPAI) | 部分豁免 | 需要遵守第 53 條第 1 款 (c)-(d) (例如:OLMo 2) | 不豁免 | 需要遵守第 53 條第 1 款和第 54 條 (例如:Llama 3-8B) | ||
| 具有系統(tǒng)性風(fēng)險(xiǎn)的通用人工智能 (GPAISR) | 不豁免 | 需要遵守第 53 條第 1 款、第 54 條和第 55 條 (目前暫無(wú)示例) | 不豁免 | 需要遵守第 53 條第 1 款、第 54 條和第 55 條 (例如:GPT-4.5) |
表 3:不同類別 GPAI 模型的義務(wù)與豁免概覽
我們?cè)诒?4 中總結(jié)了 GPAI 和 GPAISR 模型提供者的各項(xiàng)義務(wù),以及開源豁免是否適用。
| 義務(wù) | 開源 GPAI 模型 | 開源 GPAISR 模型 | 官方指導(dǎo) | |
|---|---|---|---|---|
| 第 53 條 (1a): | 制定并保持最新的模型文檔 | ? 豁免 | ? 不豁免 | 行為準(zhǔn)則:透明度章節(jié),模型文檔表格 |
| 第 53 條 (1b): | 制定、保持最新,并向有意將 GPAI 模型集成進(jìn)其 AI 系統(tǒng)的提供者提供相關(guān)文檔 | ? 豁免 | ? 不豁免 | 行為準(zhǔn)則:透明度章節(jié),模型文檔表格 |
| 第 53 條 (1c): | 建立符合歐盟版權(quán)及相關(guān)權(quán)利法律的合規(guī)政策 | ? 不豁免 | ? 不豁免 | 行為準(zhǔn)則:版權(quán)章節(jié) |
| 第 53 條 (1d): | 制定并公開足夠詳細(xì)的訓(xùn)練數(shù)據(jù)摘要 | ? 不豁免 | ? 不豁免 | 訓(xùn)練數(shù)據(jù)公開摘要模板 |
| 第 54 條: | 設(shè)立在第三國(guó)的提供者在將模型投放歐盟市場(chǎng)前,必須通過(guò)書面授權(quán)在歐盟指定授權(quán)代表 | ? 豁免 | ? 不豁免 | N/A |
| 第 55 條 (1a-d): | GPAISR 特定義務(wù),包括模型評(píng)估、系統(tǒng)性風(fēng)險(xiǎn)評(píng)估與緩解、向主管機(jī)構(gòu)報(bào)告事故、以及網(wǎng)絡(luò)安全保護(hù) | N/A | ? 不豁免 | 行為準(zhǔn)則:安全與保障章節(jié) |
表 4:GPAI 模型提供者的義務(wù)、開源豁免與官方指導(dǎo)
理解適用義務(wù)對(duì)應(yīng)的合規(guī)要求
摘要 (TL;DR): 開源 GPAI 模型的提供者必須遵守歐盟版權(quán)法,并使用人工智能辦公室(AI Office)的模板發(fā)布訓(xùn)練數(shù)據(jù)摘要,同時(shí)可豁免于透明度和文檔要求。開源 GPAISR 模型的提供者必須遵守第 53 至 55 條中的所有要求。《行為準(zhǔn)則》(Code of Practice)為遵守大部分義務(wù)提供了自愿性指導(dǎo),其中包括關(guān)于透明度和文檔、版權(quán)合規(guī)以及管理系統(tǒng)性風(fēng)險(xiǎn)的安全與安保要求的措施。
我們?cè)诖烁鶕?jù)《人工智能法》文本本身,以及歐盟官方指導(dǎo)文件 《行為準(zhǔn)則》(Code of Practice)、GPAI 指南,以及訓(xùn)練數(shù)據(jù)公開摘要模板,對(duì)開源 GPAI 開發(fā)者的合規(guī)要求和措施做簡(jiǎn)要概述。
請(qǐng)注意,這并非法律意見,而是為你提供參考,幫助你了解如果你被認(rèn)定為 GPAI 模型提供者,哪些條款可能適用于你,以及你可以采取哪些措施來(lái)合規(guī)。正如前文所述,僅為研究目的開發(fā)和分發(fā)的 GPAI 模型完全豁免。
本指南中的大部分指引來(lái)自 《行為準(zhǔn)則》(Code of Practice),該準(zhǔn)則是一個(gè)自愿性框架,旨在幫助 GPAI 和 GPAISR 模型提供者履行合規(guī)義務(wù)。一旦得到歐盟成員國(guó)和歐盟委員會(huì)的認(rèn)可,選擇自愿簽署該準(zhǔn)則的提供者可以將其作為證明自身合規(guī)的一種方式。這意味著,《行為準(zhǔn)則》是遵守《人工智能法》針對(duì) GPAI 模型規(guī)則的一種途徑,但未選擇遵循《行為準(zhǔn)則》的提供者,仍需以其他他們認(rèn)為合適的方式履行相關(guān)義務(wù)。無(wú)論如何,是否合規(guī)最終將由相關(guān)主管機(jī)構(gòu)進(jìn)行評(píng)估。
為方便參考,以下列出開源 GPAI 模型提供者必須采取的措施清單,以符合其要求:
適用于開源 GPAI 模型提供者的義務(wù)
1. 第 53 條 (1)(c):版權(quán)法合規(guī)
提供者必須制定并實(shí)施一項(xiàng)規(guī)則以確保遵守歐盟版權(quán)法。雖然《人工智能法》并未規(guī)定政策的具體形式,但 CoP 提供了一種可能的合規(guī)路徑,即通過(guò)以下方式加以落實(shí):
- 制定一份書面的版權(quán)政策文件并實(shí)施。建議公開發(fā)布該文件,但不是強(qiáng)制要求。
- 如果你使用網(wǎng)絡(luò)爬蟲自行收集數(shù)據(jù),只能收集合法可訪問(wèn)的內(nèi)容,并避免使用歐盟官方列出的侵犯版權(quán)的網(wǎng)站資源。
- 如果你使用網(wǎng)絡(luò)爬蟲自行收集數(shù)據(jù),應(yīng)遵守 robots.txt 文件和其他機(jī)器可讀的權(quán)利保留聲明,并按照最新的標(biāo)準(zhǔn)執(zhí)行。
- 在模型文檔中加入說(shuō)明,提醒下游用戶不得將模型用于侵犯版權(quán)的用途,符合歐盟法律要求。
- 實(shí)施適當(dāng)且相稱的技術(shù)保障,防止模型生成復(fù)制訓(xùn)練數(shù)據(jù)中受版權(quán)保護(hù)的內(nèi)容。
- 指定一個(gè)聯(lián)絡(luò)點(diǎn),供權(quán)利人提交關(guān)于不符合上述措施的充分證據(jù)投訴。
2. 第 53 條 (1)(d):訓(xùn)練數(shù)據(jù)摘要
必須使用 AI 辦公室提供的模板,來(lái)公開發(fā)布訓(xùn)練數(shù)據(jù)摘要:
- 在官方網(wǎng)站和分發(fā)平臺(tái)上發(fā)布該摘要。
- 包含一般的模型信息、使用的數(shù)據(jù)集以及數(shù)據(jù)處理步驟。
- 當(dāng)使用額外數(shù)據(jù)(如微調(diào)數(shù)據(jù))時(shí),更新該摘要。
- 如果訓(xùn)練數(shù)據(jù)與另一個(gè)模型版本共享,應(yīng)在摘要中標(biāo)注該共享情況。
- 截止日期:如果你的模型在2025 年 8 月 2 日之前已投放市場(chǎng),你需要在2027 年 8 月 2 日完成合規(guī)。如果你的模型在2025 年 8 月 2 日或之后投放市場(chǎng),你必須立即合規(guī)。
??注意: 如果你的模型被歸類為 GPAISR,則必須遵守第 53 條、第 54 條和第 55 條的所有義務(wù)。
第 53 條 (1a-b):透明度與文檔
摘要 (TL;DR): 開源 GPAI 模型提供者如果公開共享模型架構(gòu)信息并使用符合自由和開源要求的許可證,即可豁免于對(duì)透明度的要求;而開源 GPAISR 模型提供者則不享有豁免,可以參考《行為準(zhǔn)則》透明度章節(jié)中的指導(dǎo)。對(duì)于經(jīng)過(guò)微調(diào)或修改的開源 GPAISR 模型,只有當(dāng)修改所需的計(jì)算量超過(guò)原始模型訓(xùn)練計(jì)算量的三分之一時(shí),才會(huì)觸發(fā)這些要求,并且其責(zé)任僅限于記錄所做的具體修改。
開源 GPAI 模型的提供者可以豁免于透明度要求,因此不必遵循《行為準(zhǔn)則》透明度章節(jié)中的措施或填寫相關(guān)表格。開源 GPAISR 模型的提供者則不享有豁免,可以遵循 《行為準(zhǔn)則》透明度章節(jié),其中概述了三項(xiàng)措施,用于記錄和共享模型開發(fā)、能力與局限性等關(guān)鍵信息。
這些措施包括:
- 公開用于申請(qǐng)?jiān)L問(wèn)文檔的聯(lián)系方式;
- 在相關(guān)方提出請(qǐng)求時(shí),向 AI 辦公室、市場(chǎng)監(jiān)管機(jī)構(gòu)和下游用戶提供和開放相關(guān)文檔;
- 確保文檔保持更新、安全保存,并在模型投放歐盟市場(chǎng)后保留 10 年。
為簡(jiǎn)化合規(guī)流程,透明度章節(jié)提供了一份模型文檔表格,用于收集有關(guān)模型的所有必需信息,包括模型屬性、分發(fā)方式、許可證、用途、訓(xùn)練過(guò)程、訓(xùn)練數(shù)據(jù)、計(jì)算資源以及能耗等。這使得提供者更容易整理所需文檔,同時(shí)確保監(jiān)管機(jī)構(gòu)和下游 AI 系統(tǒng)提供者能夠獲取理解模型能力并履行自身監(jiān)管義務(wù)所需的信息。
如果我對(duì)現(xiàn)有的 GPAI 或 GPAISR 模型進(jìn)行微調(diào),該怎么辦? 正如前文所述,只有當(dāng)你的修改導(dǎo)致模型的通用性、能力或系統(tǒng)性風(fēng)險(xiǎn)發(fā)生顯著變化時(shí),你才會(huì)被認(rèn)定為提供者。如果通過(guò)這一計(jì)算你被認(rèn)定為提供者,透明度章節(jié)進(jìn)一步明確,你的文檔與透明度義務(wù)應(yīng)相應(yīng)地僅限于你所做的修改或微調(diào)部分,因?yàn)槟憧赡軣o(wú)法獲取或控制基礎(chǔ)模型的開發(fā)過(guò)程。
第 53 條 (1c):版權(quán)
摘要 (TL;DR): 《版權(quán)章節(jié)》為開源 GPAI 或 GPAISR 模型的提供者提供了指導(dǎo),其中包含五項(xiàng)措施,每項(xiàng)措施都配有強(qiáng)制要求和鼓勵(lì)性行動(dòng),幫助提供者建立一項(xiàng)符合歐盟版權(quán)及相關(guān)權(quán)利法律的政策。
GPAI 和 GPAISR 模型的提供者均不享有豁免,必須制定一個(gè)規(guī)則以遵守歐盟關(guān)于版權(quán)和相關(guān)權(quán)利的法律。《行為準(zhǔn)則》的版權(quán)章節(jié)概述了五項(xiàng)措施,供提供者實(shí)施以履行其義務(wù)。在表 5 中,我們總結(jié)了該章節(jié)中每項(xiàng)措施對(duì)應(yīng)的要求和鼓勵(lì)性行動(dòng)。
| 措施 | 要求 | 鼓勵(lì)性行動(dòng) | |
|---|---|---|---|
| 措施 1.1 | 要求提供者制定并維護(hù)一份版權(quán)政策文件,涵蓋所有五項(xiàng)措施。 | - 制定、維護(hù)并實(shí)施一份全面的版權(quán)政策文件,并分配組織責(zé)任。 | - 公開版權(quán)政策的摘要。 |
| 措施 1.2 | 就在網(wǎng)絡(luò)爬取時(shí),僅復(fù)制和提取合法可訪問(wèn)的受版權(quán)保護(hù)內(nèi)容提供指導(dǎo)。 | - 在進(jìn)行網(wǎng)絡(luò)爬取時(shí),尊重保護(hù)措施(付費(fèi)墻、訂閱模式)。 - 將歐盟持續(xù)更新的侵權(quán)網(wǎng)站列表中列出的網(wǎng)站排除在爬取活動(dòng)之外。 | |
| 措施 1.3 | 要求識(shí)別并遵守權(quán)利保留,包括遵循 robots.txt 協(xié)議及其他機(jī)器可讀標(biāo)準(zhǔn)。 | - 遵循 robots.txt 協(xié)議及其他機(jī)器可讀的權(quán)利保留,這些協(xié)議反映了權(quán)利人根據(jù)《版權(quán)指令》第 4 條第 3 款所表達(dá)的退出偏好。 | - 參與利益相關(guān)方討論,以制定機(jī)器可讀的權(quán)利保留標(biāo)準(zhǔn)。 - 向權(quán)利人提供有關(guān)網(wǎng)絡(luò)爬取實(shí)踐的透明度。 - 對(duì)于搜索引擎提供者:避免對(duì)表達(dá)權(quán)利保留的網(wǎng)站進(jìn)行懲罰性處理。 |
| 措施 1.4 | 要求實(shí)施技術(shù)保障,防止侵權(quán)輸出,并在可接受使用政策或模型文檔中禁止此類用途。 | - 實(shí)施技術(shù)保障,防止模型輸出侵犯版權(quán)的內(nèi)容。 - 在可接受使用政策或模型文檔(如開源 GPAI 模型的模型卡)中,加入禁止侵權(quán)用途的條款。 | |
| 措施 1.5 | 要求建立溝通機(jī)制,指定權(quán)利人的聯(lián)絡(luò)點(diǎn),并建立版權(quán)相關(guān)問(wèn)題的投訴機(jī)制。 | - 指定權(quán)利人聯(lián)絡(luò)點(diǎn)。 - 建立投訴機(jī)制。 |
表 5:《行為準(zhǔn)則》版權(quán)章節(jié)中的措施、要求和鼓勵(lì)性行動(dòng)(來(lái)源:歐盟委員會(huì),通用人工智能模型行為準(zhǔn)則之版權(quán)章節(jié))
第 53 條 (1d):訓(xùn)練數(shù)據(jù)文檔
摘要 (TL;DR): GPAI 和 GPAISR 模型的提供者必須使用 AI 辦公室提供的模板,公開發(fā)布其訓(xùn)練數(shù)據(jù)摘要,包括模型基本信息、所使用的數(shù)據(jù)集以及數(shù)據(jù)處理方面的信息。摘要必須以簡(jiǎn)明的敘述形式撰寫,并在模型投放歐盟市場(chǎng)時(shí),發(fā)布在官方網(wǎng)站和分發(fā)渠道上。 **
AI 辦公室發(fā)布了一份模板,供 GPAI 和 GPAISR 提供者制作并公開一份足夠詳細(xì)的訓(xùn)練數(shù)據(jù)摘要,這是第 53 條 (1d) 所要求的義務(wù)。該摘要必須在提供者的官方網(wǎng)站和所有分發(fā)渠道(例如開放代碼庫(kù))上公開發(fā)布,在模型投放歐盟市場(chǎng)時(shí)同步上線。
這一摘要的目的是提高關(guān)于 GPAI 模型訓(xùn)練所使用數(shù)據(jù)的透明度(涵蓋從預(yù)訓(xùn)練到后訓(xùn)練的所有階段,包括模型對(duì)齊和微調(diào)),其中也包括受歐盟版權(quán)法及相關(guān)權(quán)利保護(hù)的文本和數(shù)據(jù),同時(shí)確保保護(hù)商業(yè)機(jī)密和保密的商業(yè)信息。
該模板包含三個(gè)部分——模型基本信息、主要使用的數(shù)據(jù)集以及相關(guān)的數(shù)據(jù)處理方面,并提供了簡(jiǎn)明的填寫說(shuō)明,以幫助提供者以簡(jiǎn)便和統(tǒng)一的方式提交所需信息。參考案例可見 SmolLM3 的訓(xùn)練數(shù)據(jù)公開摘要:Smollm3 Eu Data Transparency - a Hugging Face Space by hfmlsoc
《說(shuō)明公告》提供了以下補(bǔ)充說(shuō)明,幫助填寫該模板:
- 摘要應(yīng)當(dāng)全面而非技術(shù)性細(xì)節(jié)導(dǎo)向,并以簡(jiǎn)明的敘述形式撰寫,確保相關(guān)方和公眾都能理解。
- 為了保護(hù)商業(yè)機(jī)密,不同數(shù)據(jù)源適用不同的披露要求——對(duì)于許可數(shù)據(jù),僅需有限細(xì)節(jié);對(duì)于私有數(shù)據(jù)集,提供一般性描述即可;對(duì)于公開可用數(shù)據(jù)集,則需要全面披露。
- 如果不同模型或不同版本的訓(xùn)練數(shù)據(jù)相同,可以為它們共用同一個(gè)摘要,但需明確說(shuō)明該摘要涵蓋哪些模型和版本。如果模型使用了不同訓(xùn)練數(shù)據(jù)且無(wú)法共享摘要,則每份摘要只需記錄修改原始模型時(shí)使用的新增訓(xùn)練數(shù)據(jù)(例如微調(diào)數(shù)據(jù)集),并引用和鏈接到原始模型的摘要。
- 如果以某種方式微調(diào)或修改 GPAI 模型,從而被認(rèn)定為 GPAI 模型的提供者(如上所述),只需記錄修改中使用的新增訓(xùn)練數(shù)據(jù),并引用原始模型的摘要。
- 如果在已投放市場(chǎng)的 GPAI 模型上繼續(xù)使用額外訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,則必須每六個(gè)月更新一次摘要,或者如果新增數(shù)據(jù)對(duì)摘要內(nèi)容有實(shí)質(zhì)性影響,則需盡早更新,以先到者為準(zhǔn)。
- 如果在 2025 年 8 月 2 日之前已將 GPAI 模型投放市場(chǎng),那么對(duì)于這些模型,必須在 2027 年 8 月 2 日之前完成合規(guī)。
第 55 條:GPAISR 模型的安全與保障
摘要 (TL;DR): 《行為準(zhǔn)則》的安全與保障章節(jié)概述了 10 項(xiàng)承諾,開源 GPAISR 模型的提供者可以遵循這些承諾,以履行第 55 條規(guī)定的要求。這些要求基于比例原則設(shè)計(jì),會(huì)根據(jù)系統(tǒng)性風(fēng)險(xiǎn)和提供者的能力進(jìn)行調(diào)整,并為中小企業(yè)(SMEs)和中型初創(chuàng)企業(yè)(SMCs),包括初創(chuàng)公司,提供簡(jiǎn)化的合規(guī)路徑。 **
雖然目前尚無(wú)開源 GPAISR 模型,但如果未來(lái)出現(xiàn),開源 GPAISR 模型的提供者將受制于第 55 條 (1a-d) 所規(guī)定的額外安全與保障義務(wù)。如果你被認(rèn)定為此類模型的提供者,《行為準(zhǔn)則》的安全與保障章節(jié)概述了 10 項(xiàng)承諾,你可以通過(guò)遵循這些承諾來(lái)在整個(gè)模型生命周期內(nèi)管理系統(tǒng)性風(fēng)險(xiǎn)并履行相關(guān)義務(wù)。這些承諾包括但不限于:
- 風(fēng)險(xiǎn)管理框架: 必須制定書面的流程,以便在 GPAISR 模型的整個(gè)開發(fā)生命周期中識(shí)別和評(píng)估系統(tǒng)性風(fēng)險(xiǎn);在關(guān)鍵觸發(fā)點(diǎn)(如開發(fā)里程碑或計(jì)算閾值)進(jìn)行評(píng)估,并建立監(jiān)測(cè)系統(tǒng)收集社區(qū)反饋和事故報(bào)告。
- 風(fēng)險(xiǎn)評(píng)估: 必須遵循結(jié)構(gòu)化的方法來(lái)識(shí)別潛在危害(例如有害內(nèi)容生成、安全漏洞、社會(huì)影響),然后制定詳細(xì)的危害情景,并使用既定的安全基準(zhǔn)進(jìn)行評(píng)估。
- 安全緩解措施: 必須實(shí)施保護(hù)措施,包括訓(xùn)練數(shù)據(jù)過(guò)濾、輸入/輸出監(jiān)測(cè)、微調(diào)模型以拒絕特定請(qǐng)求、為用戶提供安全工具,以及使用分級(jí)訪問(wèn)控制(例如 API 限額、用戶審核)。
- 安全措施: 必須針對(duì)外部攻擊者和內(nèi)部威脅設(shè)定安全目標(biāo),并實(shí)施技術(shù)保障,例如安全的分發(fā)方式、訪問(wèn)控制和未授權(quán)修改的監(jiān)測(cè)機(jī)制。
- 文檔: 必須維護(hù)技術(shù)報(bào)告,涵蓋模型架構(gòu)、能力、訓(xùn)練方法和使用場(chǎng)景,包括風(fēng)險(xiǎn)評(píng)估、緩解措施和外部評(píng)估;在風(fēng)險(xiǎn)評(píng)估發(fā)生實(shí)質(zhì)性變化時(shí),需在 5 個(gè)工作日內(nèi)進(jìn)行更新并向監(jiān)管機(jī)構(gòu)通報(bào)。你必須自文檔創(chuàng)建之日或重大事故發(fā)生之日起(以較晚者為準(zhǔn)),至少保存該文檔 5 年。
- 組織結(jié)構(gòu): 必須建立明確的風(fēng)險(xiǎn)管理角色,分配足夠的資源用于安全職能,并推動(dòng)健康的風(fēng)險(xiǎn)文化。
這些承諾圍繞著兩個(gè)比例原則進(jìn)行設(shè)計(jì):
- 合規(guī)措施應(yīng)與模型所帶來(lái)的實(shí)際系統(tǒng)性風(fēng)險(xiǎn)相匹配,確保低風(fēng)險(xiǎn)情境不會(huì)觸發(fā)不必要的繁瑣流程。
- 要求應(yīng)考慮到提供方的規(guī)模與能力,并為中小型企業(yè)(SMEs)和中型小市值企業(yè)(SMCs),包括初創(chuàng)公司,明確規(guī)定簡(jiǎn)化的合規(guī)途徑。例如,簽署《行為準(zhǔn)則》(CoP)的中小企業(yè)(SMEs)或中型小市值企業(yè)(SMCs),可依據(jù)第 56 條第 5 款 免于定期向人工智能辦公室報(bào)告的義務(wù),但仍可自愿選擇遵守。
開發(fā)者可以利用若干開源工具來(lái)遵循這些措施。例如,在風(fēng)險(xiǎn)評(píng)估與模型評(píng)估方面,開源框架如 LM Evaluation Harness、lighteval 和 Inspect 能夠?qū)崿F(xiàn)標(biāo)準(zhǔn)化的大語(yǔ)言模型(LLM)評(píng)估,而像 Weights & Biases 這樣的平臺(tái)則提供實(shí)驗(yàn)跟蹤工具,用于模型的持續(xù)監(jiān)測(cè)。
在安全緩解方面,開發(fā)者可以利用數(shù)據(jù)策劃工具或紅隊(duì)測(cè)試框架,同時(shí) NIST 人工智能風(fēng)險(xiǎn)管理框架 提供了負(fù)責(zé)任的模型開發(fā)與部署最佳實(shí)踐。 在文檔要求方面,開發(fā)者可以繼續(xù)使用他們已經(jīng)熟悉的 模型卡(model cards) 和 數(shù)據(jù)集卡(dataset cards)。
下一步與行動(dòng)呼吁
?? 鑒于針對(duì) GPAI 模型提供者的相關(guān)要求將于 2025 年 8 月 2 日開始實(shí)施,我們必須加快提升社區(qū)對(duì)這些要求的理解和認(rèn)知。通過(guò)向他人介紹這些規(guī)定并分享本指南,你可以幫助社區(qū)更好地提前做好準(zhǔn)備,共同迎接新規(guī)的到來(lái)!
??? 加入討論! 我們正在構(gòu)建關(guān)于合規(guī)工具與最佳實(shí)踐的后續(xù)資源,但我們需要你的意見,使其真正有用。無(wú)論你是對(duì)本指南有疑問(wèn)、想要分享工具和工作流程,還是希望幫助識(shí)別尚存的空白點(diǎn),都?xì)g迎聯(lián)系!讓我們攜手合作,幫助社區(qū)為《人工智能法案》的合規(guī)做好準(zhǔn)備。
本指南由 Hugging Face、Mozilla 基金會(huì) 和 Linux 基金會(huì) 的研究人員合作撰寫,作者包括:Cailean Osborne、Maximilian Gahntz、Lucie-Aimée Kaffee、Bruna Trevelin、Brigitte Toussignant 和 Yacine Jernite。我們還特別感謝 Steve Winslow 的審閱與寶貴建議。文中觀點(diǎn)僅代表各位作者個(gè)人,不一定反映其所在機(jī)構(gòu)的立場(chǎng)。
英文原文: What Open-Source Developers Need to Know about the EU AI Act's Rules for GPAI Models
原文作者: Lucie-Aimée Kaffee, Cailean Osborne, Maximilian Gahntz, Bruna Trevelin, Brigitte Tousignant, Yacine Jernite
譯者: Adeena

浙公網(wǎng)安備 33010602011771號(hào)