China's New Open Source Model Beats Claude Opus 4.8 🤯
三句話摘要
一期科技播客深度討論 Midjourney Medical 全身掃描儀、ChatGPT Codex 錄製重播功能、開源中國 AI 模型 GLM 5.2,以及未來 AI 定價模式的轉變。 --- Midjourney Medical 的全身超聲波掃描技術若能突破精度與 FDA 認證門檻,將從根本上改變醫療預防的可及性;而 GLM 5.2 等高性能開源模型的崛起,正在同步重塑 AI 工具的使用成本結構。 Midjourney Medical 顛覆醫療影像
重點整理
重點- 1
Midjourney Medical 顛覆醫療影像
- 2
Midjourney 創辦人 David Hull 親自製作示範影片,展示以超聲波技術取代 MRI 的全身掃描裝置。傳統 MRI 昂貴、不舒適且需使用造影劑,而該設備目標是讓掃描變得便宜、快速、無創,進而使人們能夠定期進行預防性全身檢查,在問題發生前即早發現。
- 3
ChatGPT Codex 「錄製與重播」降低自動化門檻
- 4
過去建立 AI 自動化流程需要文字描述或撰寫 prompt,而 Codex 新功能讓 AI 直接觀看使用者的操作過程並加以複製,甚至可控制電腦上任何軟體(包括無 API 的程式),大幅降低非技術人員部署自動化的障礙。
- 5
開源中國模型正在追平前沿模型
- 6
GLM 5.2 在多項基準上表現接近 Claude Opus 4.8 與 GPT,但完全免費且可本地部署。每次有西方前沿模型推出,幾乎隨即就有中國開源版本跟進,主機認為這個速度已令人感到緊迫。
- 7
AI 定價模式轉變帶來成本風險
- 8
主機預測 OpenAI 等廠商將從月費訂閱制轉向按 token 使用量計費,這對大量使用 AI 的企業而言成本可能大幅攀升,並建議以本地高端開源模型處理日常任務、僅以前沿模型負責高層規劃決策,藉此控制費用。
- 9
--
實用技巧與重點
乾貨- 具體數字與規格
- Midjourney Medical 掃描設備:40 個面板,每個面板 8,960 個換能器
- 超聲波發射頻率:每秒 1,000 次
- 每次掃描原始資料量:806TB
- 目標掃描時間:60 秒;目前測試實際時間:20 分鐘
- GLM 5.2 本地運行所需模型大小:約 250-260GB
- GLM 5.2 API 定價:約為 Claude Opus 4.8 的 1/8
- 該節目每月 Claude 費用已達 $200 USD
- 工具與模型名稱
- Midjourney Medical(全身超聲波掃描設備)
- ChatGPT Codex(Record & Replay 功能)
- GLM 5.2(Z.AI,中國開源模型)
- Claude Opus 4.8
- Unreal Engine / UEFN + MCP 整合
- Dell T3 工作站(建議本地 AI 部署硬體)
- 流程與方法
- Codex Record & Replay 使用流程:開啟功能 → 執行一次操作 → AI 學習 → 建立可重用技能 → 後續自動執行
- 建議 AI 部署架構:本地高效能硬體跑開源模型處理日常任務 + 前沿雲端模型(Claude/GPT)僅負責規劃與重要決策
- Midjourney Medical 掃描流程:坐進艙體 → 金屬碟圍繞身體滑動 → 超聲波穿透組織 → 百萬個感測器收集回傳波動 → AI 重建 3D 影像
- 關鍵預測
- Elon Musk:中國達到前沿 AGI 水平的時間點為 2027 年 Q1
- Z.AI 副總裁:認為時間會更早
- --
結論
結論“Midjourney Medical 的全身超聲波掃描技術若能突破精度與 FDA 認證門檻,將從根本上改變醫療預防的可及性;而 GLM 5.2 等高性能開源模型的崛起,正在同步重塑 AI 工具的使用成本結構。”
完整解析
詳細本期節目圍繞三個核心科技議題展開,其中 Midjourney Medical 佔據最大篇幅。主機指出,傳統 MRI 檢查有三個根本障礙:昂貴、耗時且對人體有一定風險(部分檢查需使用對比劑)。正因如此,人們只有在醫生明確要求時才會進行 MRI,等到確診時往往已是疾病晚期。Midjourney 創辦人 David Hull 親自拍攝並剪輯的示範影片,展示了一套以超聲波為核心的全身掃描裝置,設備內建 40 個面板、總計數百萬個換能器,以每秒 1,000 次的頻率發射超聲波穿透人體,另一側的感測器接收回傳訊號,再由 AI 將 806TB 的原始數據重建為高精度 3D 影像。目標是讓整個掃描過程壓縮至 60 秒,且費用僅需數百美元,使預防性全身健康檢查成為日常可及的選項。
然而主機也誠實地呈現了現實面。目前該設備尚處測試階段,實際掃描時間仍需 20 分鐘,且尚未取得 FDA 認證。一位醫療影像領域的業內人士在留言中指出,診斷癌症等疾病時,0.1 公分的誤差可能足以改變治療方向,因此精確度是這類系統能否真正進入臨床的關鍵門檻。儘管如此,David Hull 在其發表的文章中表示,物理與工程層面的可行性已獲驗證,問題不再是「是否可能」,而是「多快能達到臨床精度」。他認為,若 AI 的診斷可靠性獲得驗證,這將是過去 50 年醫療影像領域最重要的模式轉變。
第二個議題是 ChatGPT Codex 推出的「錄製與重播」(Record & Replay)功能。主機以自身公司的內容發布流程為例說明:過去將一段影片同步上傳至 YouTube、TikTok、Instagram Shorts 等平台需耗費約一小時人工操作;導入程式自動化後縮短至三分鐘;而 Codex 的新功能讓 AI 直接觀看操作過程並學習複製,理論上可將這個流程壓縮至近乎零人工介入。尤其重要的是,這個功能不依賴 API 連接器,可控制電腦上任何軟體介面,包括使用者自行開發的系統或純 Excel 文件,大幅降低了中小企業實現自動化的技術門檻。
第三個議題聚焦在中國開源模型 GLM 5.2 與 AI 定價趨勢。GLM 5.2 在多項基準測試上接近 Claude Opus 4.8,但可免費本地部署,API 費用約為 Opus 4.8 的八分之一。主機觀察到,每當西方主流廠商推出前沿模型,幾乎同步就有中國開源版本跟進,且差距越來越小。在定價趨勢上,主機根據已知資訊推測,未來 AI 廠商(尤其是 OpenAI)可能將月費訂閱制改為按 token 使用量計費,這對大量依賴 AI 的企業意味著成本難以預測。對此,主機提出一套混合架構因應策略:購置高端本地伺服器(如 Dell T3)運行開源模型處理日常任務,僅在需要最高層次規劃與決策時呼叫雲端前沿模型,以此在效能與成本之間取得平衡。
---
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


