Sentient 正在集結全球建設者與支持者陣容,包括 Founders Fund、Pantera、Franklin Templeton、alphaXiv、Fireworks 和 OpenRouter,共同解決Sentient 正在集結全球建設者與支持者陣容,包括 Founders Fund、Pantera、Franklin Templeton、alphaXiv、Fireworks 和 OpenRouter,共同解決

Founders Fund、Pantera 與 Franklin Templeton 加入 Sentient 的「Arena」以壓力測試企業 AI 代理

2026/02/27 22:00
閱讀時長 7 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。
Founders Fund、Pantera 與 Franklin Templeton 加入 Sentient 的「Arena」,對企業 AI 代理進行壓力測試

過去兩年,企業一直在競相將 AI 代理導入實際工作流程中,從客戶支援和後勤作業到金融與合規方面的決策密集流程。現在,隨著這些系統日益整合到實際工作流程中,一個新問題正在浮現:代理可以檢索資訊,但當工作變得複雜、涉及多步驟或高風險時,它們往往難以提供一致且可解釋的推理。

今天,開源 AI 實驗室 Sentient 正式推出 Arena,這是一個即時的生產級環境,數千名 AI 開發者可在此對企業最困難的推理問題進行競爭性壓力測試。參與 Arena 初始階段的首批成員包括 Founders Fund、Pantera 和 Franklin Templeton(管理資產超過 1.5 兆美元)——顯示機構在生產部署前對 AI 代理進行結構化評估的早期興趣。
「隨著企業希望將 AI 代理應用於研究、營運和面向客戶的工作流程,問題不再是這些系統是否強大……而是它們在實際工作流程中是否可靠,」Franklin Templeton Digital Assets 管理負責人 Julian Love 表示。

Love 補充說,像 Arena 這樣的結構化環境將有助於區分有前景的想法和已準備好生產的能力。

「AI 代理不再是企業內部的實驗;它們正被納入涉及客戶、資金和營運成果的工作流程中,」Sentient 聯合創辦人 Himanshu Tyagi 表示。「這種轉變改變了重要性。系統在示範中令人印象深刻是不夠的。企業需要知道代理是否能在生產環境中可靠地進行推理,在那裡失敗代價高昂,信任脆弱。他們需要可比性、可重複性,以及一種追蹤可靠性改進的方法——無論他們在底層使用哪些模型或工具。」

Arena 複製了企業工作流程的混亂現實:不完整的資訊、冗長的上下文、模糊的指令和衝突的來源。Arena 不評分代理是否得到「正確答案」,而是記錄完整的推理軌跡,以便工程團隊可以調試失敗並隨時間驗證改進。

這提供了一個中立、與供應商無關的基準,用於評估跨模型和堆疊的推理。透過專注於生產級性能而非示範,Arena 創建了可驗證的高風險代理能力,企業可以將其適配到自己的私有資料和內部工具。

在第一個挑戰中,加入 Arena 的開發者將專注於一個基礎性的企業障礙:文件推理。AI 代理將被要求對複雜的非結構化資料進行推理和運算——這類工作是金融分析、根本原因調查、投資備忘錄和客戶服務的基礎。

初始階段的其他參與者包括 alphaXiv、Fireworks、Openhands 和 OpenRouter,隨著 Arena 在任務、行業和模型整合方面的擴展,預計將有更多參與者加入。

最近的調查凸顯了 Arena 所針對的差距。85% 的企業表示他們希望成為「代理型企業」,近四分之三的企業計劃部署自主代理,然而報告擁有成熟治理的企業不到四分之一,許多企業難以大規模地從試點轉向生產。企業平均已經運行十幾個代理,通常處於孤立狀態,許多企業表示,如果沒有更好的編排,增加更多代理將產生更多複雜性而非價值。
「在 OpenHands,我們始終很高興支援使用代理解決實際問題的建構者,」OpenHands 首席科學家兼聯合創辦人 Graham Neubig 表示。「我們很高興支援使用 OpenHands Software Agent SDK 來應對這些複雜挑戰的參與者。」

「Arena 正是推動開源 AI 前進的那種倡議——它們允許研究人員公開競爭、迭代和創新。我們很高興深化與 Sentient 的合作關係,並提供使實驗更快、更容易擴展的基礎設施,」OpenRouter 聯合創辦人兼執行長 Alex Atallah 表示。

Arena 將在全球推出,邀請數千名 AI 開發者申請加入首個專屬群組,從 2026 年 3 月開始將在舊金山舉辦現場活動。

本文《Founders Fund、Pantera 與 Franklin Templeton 加入 Sentient 的「Arena」,對企業 AI 代理進行壓力測試》首次發表於 Metaverse Post。

市場機遇
Franklin 圖標
Franklin實時價格 (FRANKLIN)
$0.0001569
$0.0001569$0.0001569
-0.40%
USD
Franklin (FRANKLIN) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。