OpenAI 將 GPT-5 定位為朝向 AGI 的一大飛躍。它被介紹為一個在推理、寫作和編碼方面具有「博士級能力」的模型。
\ 承諾包括更少的幻覺、新的思考模式,以及可以在速度和深度之間調整的路由功能。
\ 但發布真的實現了這些承諾嗎?問題從一開始就存在。與其興奮,GPT-5 反而引發了挫折感,甚至對 GPT-4o 的懷舊之情。
\ 那麼發生了什麼?我們能從中學到什麼?
GPT-5 的價值主張在紙面上很明確。自適應路由將提高效率。專用的思考模式將解鎖更深層次的推理能力。還有幻覺將變得不那麼頻繁的承諾。
\ 但從一開始,事情就開始出錯。第一天,路由系統就失敗了。這使得 GPT-5 比 GPT-4o 更慢且能力更弱。
\ 然後舊模型在沒有警告的情況下被撤下。對企業來說,這擾亂了工作流程並使採用計劃不穩定。
\ 許多團隊已經圍繞 GPT-4o 優化了流程,卻發現切換到 GPT-5 帶來了更多而非更少的摩擦。
開發者經歷了最明顯的倒退。在標準任務上,GPT-5 Codex 比 GPT-4.1 慢四到七倍。
\ 這種減速打破了編碼會話的流暢性,開發者不得不閒坐等待輸出,而不是實時迭代。
\ 沒有回滾選項,生產力下降。像 Claude Code 和 DeepSeek 這樣的競爭對手突然提供了更好的速度和可用性。
更好 GPT-4o 及其變體遠非完美,但它能工作。它提供了速度、創造力和可靠性的平衡,使其值得依賴。企業圍繞它調整運營,因為它是一致的。
\ 語調也起了作用。GPT-4o 感覺更人性化,而不過於熟悉。相比之下,GPT-5 因回應更平淡、風格更冷漠機械而受到批評。
\ 許多用戶對與 GPT-4o 互動的方式產生了依戀,這種轉變讓他們感覺好像失去了某些重要的東西。曾經感覺像是協作夥伴的關係,現在感覺像是交易性的。
\ 這種差異,再加上更慢的性能和被打亂的工作流程,解釋了為什麼 GPT-4o 仍然能激發忠誠度,而 GPT-5 則難以贏得信任。
這種情況突顯了當系統依賴單一模型或提供者時會變得多麼脆弱。當 GPT-4o 被移除時,沒有後備策略的組織暴露在風險中。
\ 系統設計必須預見持續變化。如果我們對技術發展速度有一點了解,那就是它在短期內不會放緩。
\ 有實用的方法來解決這個問題。當提供者更改或淘汰模型時,抽象層使適應成為可能。為倒退進行規劃可以防止更新無法帶來改進時的挫折。這些方法保護資本,保持運營穩定,並降低中斷風險。
\ GPT-5 表明進步並不總是伴隨著版本號。它突顯了在提供者比企業適應能力更快的環境中,以模型為先的採用策略的脆弱性。
\ 教訓不是要堅持使用 GPT-4o。教訓是要設計能夠承受波動的系統。
. . .
Nick Talwar 是一位 CTO,前微軟員工,也是一位實踐型 AI 工程師,支持高管們駕馭 AI 採用。他分享關於 AI 優先策略的見解,以推動底線影響。
→ 在 LinkedIn 上關注他,了解他的最新想法。
→ 訂閱他的免費 Substack,獲取直接發送到您郵箱的深度文章。
→ 觀看直播會議,了解高度監管行業的領導者如何利用 AI 減少手動工作並提高投資回報率。


