2025 年 8 月 6 日,OpenAI 正式發佈兩款開放權重語言模型 gpt-oss-120b 與 gpt-oss-20b,並將全部參數在 Hugging Face、Databricks、Azure 及 AWS 同步開放下載,許可證為 Apache 2.0。這是自 2019 年 GPT-2 以來,OpenAI 首次對外開放大型模型權重。官方在新聞通稿與媒體連線中強調,新系列「在同級別開放模型中表現最佳」,CEO Sam Altman 更在郵件聲明裡稱其為「數十億美元研究投入的結晶,目標是讓全球開發者都能用上最強大的開放模型」。
OpenAI 此次一次性放出兩種規模:117 B 參數的 gpt-oss-120b 與 21 B 參數的 gpt-oss-20b。前者在單張 80 GB GPU 上即可推理,後者則能在配備 16 GB 記憶體的筆電上運行,均允許商業化再分發,徹底打破以往閉源 API 的技術壁壘。
自 2019 年因「安全顧慮」停止開源後,OpenAI 一直飽受社群質疑;如今重新開放,既回應了 Altman 年初「曾站錯隊」的自省,也被視作對 DeepSeek、Qwen、Llama 等競爭對手連番開源的戰略回擊。
與 GPT-4o 相比,gpt-oss-120b 和 gpt-oss-20b 最大的變化在於「開放部署」——所有權重與推理程式碼皆以 Apache 2.0 許可證公開,企業可將模型完整下載到本地 GPU 叢集或私有雲,離線運行、微調並接入自有工具鏈。而 GPT-4o 依舊維持「伺服器託管」模式,開發者只能透過 OpenAI 的 API 遠端調用,無法觸碰底層參數。
簡而言之,gpt-oss 系列讓你可以把模型帶回家;GPT-4o 仍須倚賴 OpenAI 的後端才能發揮全部威力。
此次發佈意味著「閉源 API + 開放權重」的雙軌策略正式成形:企業可在本地離線部署或私有化微調核心流程,將敏感資料留在自有算力中,再按需調用 OpenAI 高階 API 處理更複雜任務;中小開發者也能以零成本試水 AI 應用,縮短從創意到產品的迭代週期。
與此同時,Apache 2.0 許可證降低了商業門檻,可望引發二次微調、行業垂直版及硬體適配優化的連鎖創新。但開放亦伴隨更嚴峻的濫用與監管挑戰:如何在全球範圍內統一安全基線、如何防範模型被惡意精調,將考驗 OpenAI 與政策制定者的協調能力。
