KeyFrame

Claude Code大更新、Qwen3.7登榜ITBench-AA第三、阿里首发智能体OS | 5月28日 AI日报

AI 风向标·5月28日週四·3 min中文

三句話摘要

本期 AI 風向標涵蓋 AI 動態、基礎設施、晶片半導體與科技公司四大板塊,梳理當日最重要的 AI 產業進展。 AI 產業正同步在工具體驗、安全基礎設施與商業模式三個層面加速成熟,Agent 從「能用」走向「可信賴地自主執行高價值任務」是本期最核心的主旋律。 AI Agent 平台競爭白熱化:阿里雲 Coder 推出 Cloud Agents 全託管平台,結合阿里雲 Linux 4 Agent 版內建 Skills 模組可節省 30% Token 開銷,顯示頭部雲廠商正積極搶佔 Agent 開發部署的基礎設施入口。

重點整理

重點
  • 1

    AI Agent 平台競爭白熱化:阿里雲 Coder 推出 Cloud Agents 全託管平台,結合阿里雲 Linux 4 Agent 版內建 Skills 模組可節省 30% Token 開銷,顯示頭部雲廠商正積極搶佔 Agent 開發部署的基礎設施入口。

  • 2

    安全與身份成為 Agent 關鍵議題:OpenAI 推出 Secure MCP Tunnel 與 Worker Identity Federation,以及擴展 Admin API,代表企業在大規模部署 AI Agent 時,安全連線與身份聯邦認證已成為不可迴避的基礎需求。

  • 3

    AI 商業化加速落地:Meta 首次向消費者販售 AI 訂閱、Robinhood 開放 Agent 自主交易,標誌 AI 正從工具走向可獨立執行高價值任務的「自主服務」,商業化路徑從 B 端延伸至 C 端。

  • 4

    基礎設施層面臨系統性重構:算力密度指數增長迫使資料中心供配電體系全面升級,此為 AI 規模化部署的長期結構性挑戰,不只是算力本身的問題。

實用技巧與重點

乾貨
  • Claude Code:修復閃屏問題、思考與工具調用流式輸出、MCP 連線自修復、損壞媒體文件壓縮進度顯示
  • Qwen 3.7 Max:Artificial Analysis LitBench AA 企業級 Agent 基準排名第三
  • 阿里雲 Linux 4 Agent 版:內建 Skills 模組,節省 30% Token 開銷
  • NVIDIA Polar:開源框架,Codex 在 SWE-bench 通過率 3.8% → 26.4%,提升 594%
  • Meta AI 訂閱:月費 2.99 至 49.99 美元,覆蓋 Instagram、Facebook、WhatsApp
  • Ant Group V-LINK 眼鏡:售價 899 元人民幣,已售出超過 1,000 副
  • MiniNex:全球企業與開發者客戶超百萬(半年前增長 5 倍),全球用戶約 3 億,AR2 過去兩個月翻倍增速
  • 韓國 Furious AI + Broadcom:第三代 AI 推理加速器,2nm 製程,預計 2027 年量產
  • 資料中心:機架功率需求 10 年近百倍躍升,供配電體系從 400V 升級至 800VDC
  • 模型榜單:GPT 5.5 三榜榜首,Claude Opus 4.7 第二,Qwen 3.7 Max 智力榜第五 / 編程榜第七 / Agent 榜第八,MIMO V2.5 Pro Agent 榜升至第五,DeepSeek V4 Pro 編程與 Agent 榜均入 Top 10
  • GPT 5.2 Codex:6 月 2 日下線,推動用戶遷移至新版

結論

結論

AI 產業正同步在工具體驗、安全基礎設施與商業模式三個層面加速成熟,Agent 從「能用」走向「可信賴地自主執行高價值任務」是本期最核心的主旋律。

完整解析

詳細

本期 AI 風向標從工具層、平台層、基礎設施層到商業化層全面掃描,呈現出 AI 產業在 2026 年中正在同步發生的多條演進主線。

在工具與開發者生態方面,Claude Code 本次更新著重改善開發者體驗,修復了閃屏渲染問題並實現思考流程與工具調用的流式輸出,另對 MCP 連線加入自修復能力。阿里雲則從兩個方向同步發力:一是針對作業系統層推出 Linux 4 智能體版,透過內建 Skills 模組讓 Agent 呼叫更有效率,可節省 30% Token 成本;二是在平台層推出 Cloud Agents 全託管服務,讓企業無需自建基礎設施即可快速部署自訂 Agent。Copilot Shell 則更進一步,設計為人類與 Agent 雙模式共用的操作系統層控制介面,顯示 Agent 的操作邊界正在向系統底層延伸。NVIDIA 開源的 Polar 框架同樣值得關注,它在不改變現有工具調用與補丁提交方式的前提下,讓 Codex 在 SWE-bench 的通過率從 3.8% 大幅提升至 26.4%,提升幅度達 594%,說明系統層的最佳化可在不更換模型的條件下帶來顯著效益。

安全議題在本期佔據重要位置。OpenAI 推出 Secure MCP Tunnel 與 Worker Identity Federation,並擴展 Admin API,直接回應了企業在大規模使用 AI Agent 時最擔心的兩個問題:連線通道的安全性,以及不同服務之間的身份驗證與授權管理。這也間接說明 MCP(Model Context Protocol)作為 Agent 互操作標準的地位正在鞏固,安全層的配套設施開始跟進。

商業化方面,Meta 首次向 C 端消費者推出 AI 訂閱服務,覆蓋旗下三大社群平台,月費從 2.99 美元到 49.99 美元,並同步測試 Meta One 統一訂閱方案,顯示社群平台正將 AI 能力轉化為直接的訂閱收益。更具突破性的案例來自 Robinhood:這家美國券商允許第三方 AI Agent 透過 API 自主執行股票交易,開創了 AI Agent 在金融領域自主操作的先例,同時也對監管與風控提出新挑戰。

基礎設施層面,算力密度的指數增長正在倒逼資料中心進行系統性重構。機架功率需求在過去十年近百倍躍升,現有的 400V 供配電體系已難以支撐,全面升級至 800VDC 成為必然方向。NVIDIA 的 Dynamo Snapshot 技術則從另一端切入,透過快照技術大幅縮短模型加載時間,降低推理延遲,提升大規模部署效率。晶片層面,韓國 Furious AI 與博通合作的第三代 AI 推理加速器採用 2nm 製程,預計 2027 年量產,是新興 AI 晶片玩家試圖切入高端推理市場的代表性案例。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕