KeyFrame
AI 技術編輯精選

China's New Open Source Model Beats Claude Opus 4.8 🤯

Bad Decisions Studio·6月19日週五·56 min英文

三句話摘要

一期科技播客深度討論 Midjourney Medical 全身掃描儀、ChatGPT Codex 錄製重播功能、開源中國 AI 模型 GLM 5.2,以及未來 AI 定價模式的轉變。 --- Midjourney Medical 的全身超聲波掃描技術若能突破精度與 FDA 認證門檻,將從根本上改變醫療預防的可及性;而 GLM 5.2 等高性能開源模型的崛起,正在同步重塑 AI 工具的使用成本結構。 Midjourney Medical 顛覆醫療影像

重點整理

重點
  • 1

    Midjourney Medical 顛覆醫療影像

  • 2

    Midjourney 創辦人 David Hull 親自製作示範影片,展示以超聲波技術取代 MRI 的全身掃描裝置。傳統 MRI 昂貴、不舒適且需使用造影劑,而該設備目標是讓掃描變得便宜、快速、無創,進而使人們能夠定期進行預防性全身檢查,在問題發生前即早發現。

  • 3

    ChatGPT Codex 「錄製與重播」降低自動化門檻

  • 4

    過去建立 AI 自動化流程需要文字描述或撰寫 prompt,而 Codex 新功能讓 AI 直接觀看使用者的操作過程並加以複製,甚至可控制電腦上任何軟體(包括無 API 的程式),大幅降低非技術人員部署自動化的障礙。

  • 5

    開源中國模型正在追平前沿模型

  • 6

    GLM 5.2 在多項基準上表現接近 Claude Opus 4.8 與 GPT,但完全免費且可本地部署。每次有西方前沿模型推出,幾乎隨即就有中國開源版本跟進,主機認為這個速度已令人感到緊迫。

  • 7

    AI 定價模式轉變帶來成本風險

  • 8

    主機預測 OpenAI 等廠商將從月費訂閱制轉向按 token 使用量計費,這對大量使用 AI 的企業而言成本可能大幅攀升,並建議以本地高端開源模型處理日常任務、僅以前沿模型負責高層規劃決策,藉此控制費用。

  • 9

    --

實用技巧與重點

乾貨
  • 具體數字與規格
  • Midjourney Medical 掃描設備:40 個面板,每個面板 8,960 個換能器
  • 超聲波發射頻率:每秒 1,000 次
  • 每次掃描原始資料量:806TB
  • 目標掃描時間:60 秒;目前測試實際時間:20 分鐘
  • GLM 5.2 本地運行所需模型大小:約 250-260GB
  • GLM 5.2 API 定價:約為 Claude Opus 4.8 的 1/8
  • 該節目每月 Claude 費用已達 $200 USD
  • 工具與模型名稱
  • Midjourney Medical(全身超聲波掃描設備)
  • ChatGPT Codex(Record & Replay 功能)
  • GLM 5.2(Z.AI,中國開源模型)
  • Claude Opus 4.8
  • Unreal Engine / UEFN + MCP 整合
  • Dell T3 工作站(建議本地 AI 部署硬體)
  • 流程與方法
  • Codex Record & Replay 使用流程:開啟功能 → 執行一次操作 → AI 學習 → 建立可重用技能 → 後續自動執行
  • 建議 AI 部署架構:本地高效能硬體跑開源模型處理日常任務 + 前沿雲端模型(Claude/GPT)僅負責規劃與重要決策
  • Midjourney Medical 掃描流程:坐進艙體 → 金屬碟圍繞身體滑動 → 超聲波穿透組織 → 百萬個感測器收集回傳波動 → AI 重建 3D 影像
  • 關鍵預測
  • Elon Musk:中國達到前沿 AGI 水平的時間點為 2027 年 Q1
  • Z.AI 副總裁:認為時間會更早
  • --

結論

結論

Midjourney Medical 的全身超聲波掃描技術若能突破精度與 FDA 認證門檻,將從根本上改變醫療預防的可及性;而 GLM 5.2 等高性能開源模型的崛起,正在同步重塑 AI 工具的使用成本結構。

完整解析

詳細

本期節目圍繞三個核心科技議題展開,其中 Midjourney Medical 佔據最大篇幅。主機指出,傳統 MRI 檢查有三個根本障礙:昂貴、耗時且對人體有一定風險(部分檢查需使用對比劑)。正因如此,人們只有在醫生明確要求時才會進行 MRI,等到確診時往往已是疾病晚期。Midjourney 創辦人 David Hull 親自拍攝並剪輯的示範影片,展示了一套以超聲波為核心的全身掃描裝置,設備內建 40 個面板、總計數百萬個換能器,以每秒 1,000 次的頻率發射超聲波穿透人體,另一側的感測器接收回傳訊號,再由 AI 將 806TB 的原始數據重建為高精度 3D 影像。目標是讓整個掃描過程壓縮至 60 秒,且費用僅需數百美元,使預防性全身健康檢查成為日常可及的選項。

然而主機也誠實地呈現了現實面。目前該設備尚處測試階段,實際掃描時間仍需 20 分鐘,且尚未取得 FDA 認證。一位醫療影像領域的業內人士在留言中指出,診斷癌症等疾病時,0.1 公分的誤差可能足以改變治療方向,因此精確度是這類系統能否真正進入臨床的關鍵門檻。儘管如此,David Hull 在其發表的文章中表示,物理與工程層面的可行性已獲驗證,問題不再是「是否可能」,而是「多快能達到臨床精度」。他認為,若 AI 的診斷可靠性獲得驗證,這將是過去 50 年醫療影像領域最重要的模式轉變。

第二個議題是 ChatGPT Codex 推出的「錄製與重播」(Record & Replay)功能。主機以自身公司的內容發布流程為例說明:過去將一段影片同步上傳至 YouTube、TikTok、Instagram Shorts 等平台需耗費約一小時人工操作;導入程式自動化後縮短至三分鐘;而 Codex 的新功能讓 AI 直接觀看操作過程並學習複製,理論上可將這個流程壓縮至近乎零人工介入。尤其重要的是,這個功能不依賴 API 連接器,可控制電腦上任何軟體介面,包括使用者自行開發的系統或純 Excel 文件,大幅降低了中小企業實現自動化的技術門檻。

第三個議題聚焦在中國開源模型 GLM 5.2 與 AI 定價趨勢。GLM 5.2 在多項基準測試上接近 Claude Opus 4.8,但可免費本地部署,API 費用約為 Opus 4.8 的八分之一。主機觀察到,每當西方主流廠商推出前沿模型,幾乎同步就有中國開源版本跟進,且差距越來越小。在定價趨勢上,主機根據已知資訊推測,未來 AI 廠商(尤其是 OpenAI)可能將月費訂閱制改為按 token 使用量計費,這對大量依賴 AI 的企業意味著成本難以預測。對此,主機提出一套混合架構因應策略:購置高端本地伺服器(如 Dell T3)運行開源模型處理日常任務,僅在需要最高層次規劃與決策時呼叫雲端前沿模型,以此在效能與成本之間取得平衡。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕