OpenAI 今(26)日正式公開其下一代前沿大模型「GPT-5.6 系列」,並破天荒採取「三位一體」的多模型家族策略,推出旗艦 Sol、平價 Terra 以及高速 Luna 三款模型。其中,Sol 具備極強的長時程網路安全漏洞研究與「超強代理(Ultra Mode)」能力,在多項基準測試中將對手 Anthropic 的 Claude Mythos 遠遠甩在後頭。
(前情提要:OpenAI 新模型 GPT-5.6 不給上:川普政府要求分階段發布)
(背景補充:紐約時報:OpenAI 傾向推遲 IPO 至 2027 年,Sam Altman 要求估值須達一兆美元)
本文目錄
- 日月地「三模型家族」降臨,Sol Ultra 創下 SOTA 新紀錄
- 史上最強網路安全模型,70 萬小時自動化紅隊壓測
- GPT-5.6 家族定價與詳細規格一覽
- 美國政府罕見介入!受限於「有限預覽」階段
在全球開發者與企業熱烈期盼下,AI 領頭羊 OpenAI 於今日(26 日)拋出了投向市場的重磅炸彈,正式發表其下一代前沿模型系列「GPT-5.6 家族」。本次 OpenAI 改變了過往單一模型的升級路徑,改採全新命名系統,一次性推出「日月星辰」三款鎖定不同場景的能力階層模型。
日月地「三模型家族」降臨,Sol Ultra 創下 SOTA 新紀錄
OpenAI 表示,新命名系統中,數字 5.6 代表世代,而 Sol、Terra、Luna 則代表不同的能力階層,未來將各自獨立推進,讓用戶能在智能、速度與成本之間做出最完美的權衡:
- GPT-5.6 Sol(太陽):家族中的終極旗艦模型。相比 GPT-5.5 有著跨越式的性能突破,專門為極其複雜的「自主代理工作(Agentic work)」而生。
- GPT-5.6 Terra(地球):日常工作平衡型模型。其性能與前代 GPT-5.5 相當,但運行成本直接暴降 2 倍,是企業高效日常應用的首選。
- GPT-5.6 Luna(月亮):高產量、極速且最親民的模型。在提供強大基礎能力的同時,將成本壓到最低,適合大規模重複性的高容量工作。
在功能層面,旗艦級的 Sol 引入了全新的 `max` reasoning effort 功能,賦予模型進行深度、長時間推理的餘裕;此外,全新的 `ultra` mode 則允許 Sol 呼叫多個「子代理(Subagents)」協同作戰。在命令列工作流基準測試 Terminal-Bench 2.1 中,Sol Ultra 創下了 91.9% 的全新世界紀錄(SOTA),大幅領先競爭對手 Anthropic 的 Claude Mythos 5。
史上最強網路安全模型,70 萬小時自動化紅隊壓測
除了程式碼與基因組定量分析外,GPT-5.6 Sol 最令人矚目的突破在於其驚人的「網路安全(Cybersecurity)」能力。Sol 是目前 OpenAI 在安全領域最強的模型,能處理長視野的漏洞研究與利用任務。在 ExploitBench 基準測試中,Sol 僅需耗費對手 Mythos Preview 約 1/3 的輸出 tokens,就能達到同等甚至更優異的漏洞挖掘成果。
為了防堵高風險的網路犯罪濫用,OpenAI 推出了至今最強的分層安全防護堆疊。該模型經歷了數週的人類紅隊測試,並通過了高達 70 萬 A100 等效 GPU 小時的自動化紅隊壓測,內建即時分類器、帳戶級審查與主動防護暗門。雖然 Sol 能在 Chromium 和 Firefox 中精準找出未知漏洞,但報告顯示它尚不具備自主產生端到端完整攻擊鏈的能力,因此未越過「關鍵網路威脅」的紅線。
GPT-5.6 家族定價與詳細規格一覽
| 模型名稱 | 輸入定價 (每百萬 Tokens) | 輸出定價 (每百萬 Tokens) | 核心定位與特點 |
|---|---|---|---|
| GPT-5.6 Sol | $5.00 | $30.00 | 前沿旗艦、極致智能、超強代理(Ultra Mode)與網絡核防禦 |
| GPT-5.6 Terra | $2.50 | $15.00 | 高CP值中階、等同 GPT-5.5 性能但成本直接降低 2 倍 |
| GPT-5.6 Luna | $1.00 | $6.00 | 親民極速、適合海量吞吐與日常自動化工作流程 |
(備註:Sol 最低快取定價為每百萬 Tokens $0.50,全系列支援最少 30 分鐘生命週期的明確快取斷點。)
美國政府罕見介入!受限於「有限預覽」階段
雖然性能令人驚艷,但許多急著體驗的開發者可能要再等一等。OpenAI 透露,目前該系列模型正處於「有限預覽(Limited Preview)」階段,僅透過 API 和 Codex 開放給少數受信任的合作夥伴。這背後的原因相當具有政治意味 —— 由於其強大的網路安全敏感度,OpenAI 目前正接受美國政府因應網路安全行政命令框架的合規審查,參與預覽的名單也已同步分享給官方。
儘管面臨監管阻力,OpenAI 重申反對將政府的長期審查程序「常態化」,認為這會阻礙企業和網路防禦者取得最佳工具。公司計畫在未來幾週內,將 GPT-5.6 家族全面普及至所有 ChatGPT 與 API 用戶。此外,自 7 月起,GPT-5.6 Sol 將與 Cerebras 晶片強強聯手,為指定客戶提供高達每秒 750 tokens 的史詩級推理超高速,再度宣示其無法動搖的 AI 霸權。
📍相關報導📍
OpenAI Codex 遭爆正殺死你的 SSD:21 天寫入 37 TB,不到一年燒盡硬碟壽命
Getty Images 盤前噴 300%!與 OpenAI 簽約、授權版權照進駐 ChatGPT
Hyperliquid 暫停 OpenAI、Anthropic 永續合約,Ventuals 收攤







