Anthropic为何如此矛盾 | Bloomberg专访 | Dario Amodei | 平滑指数曲线 | 创立根源 | 宪法式AI | SaaS末日 | 国防AI | Mythos | AI治理
三句話摘要
Anthropic 如何在「最理解 AI 風險」與「最快速建造 AI」的雙重角色之間自我辯護,以及這個矛盾所折射出的 AI 時代結構性治理困境。 AI 時代最有權力的安全派同樣需要被安全地約束——我們需要的從來不是信任某個創辦人的良心,而是建立一套哪怕再有良心的人也無法單方面決定世界走向的制度性制衡機制。 Anthropic 的創立根源不只是技術路線分歧,而是信任的崩塌。達里奧團隊比多數人更早相信 scaling laws,也正因此比多數人更早感到恐懼——建造者的價值觀與治理結構,在指數曲線面前是文明級的變數,而非單純的公司文化問題。
重點整理
重點- 1
Anthropic 的創立根源不只是技術路線分歧,而是信任的崩塌。達里奧團隊比多數人更早相信 scaling laws,也正因此比多數人更早感到恐懼——建造者的價值觀與治理結構,在指數曲線面前是文明級的變數,而非單純的公司文化問題。
- 2
Claude 的人格定位「專業的溫暖」本質上是一種治理選擇,而非產品語氣。若設計成「朋友」會走向情感依附與注意力最大化,若設計成純工具又缺乏協作彈性;Constitutional AI 讓模型依據公開原則自我約束,是介於這兩個極端之間的中間路線。
- 3
Claude Code 徹底翻轉了工程工作的定義。工程師從「把需求翻譯成程式碼的人」,轉型為任務拆解者、審核者、多個 AI coding agent 的指揮者;API 調用量年增長近十七倍、單季年化增長率達八十倍,Claude Code 已成為高頻擴張的工作基礎設施。
- 4
Anthropic 在商業、軍事與超強模型三條線上各有紅線,但紅線之外仍存在無法完全回答的灰色地帶——人在回路(human-in-the-loop)並不等同於審慎判斷,當 AI 把決策節奏推得飛快,人類按下確認鍵究竟是在判斷還是在替系統完成責任閉環,這個問題尚無定論。
實用技巧與重點
乾貨- 數字:Anthropic 估值近萬億美元;API 調用量年增長接近 17 倍;過去 12 個月推出 8 個前沿模型;單季年化增長率 80 倍;Claude Cowork 發布後軟體股單日蒸發 2850 億美元市值;大語言模型讓美軍每日可處理目標從 1000 個提升到 5000 個;70% 美國人認為 AI 會消滅工作;達里奧估計 AI 文明崩潰風險機率為 10%–25%;達里奧曾警告 AI 可能在 1–5 年內消除一半入門白領職位
- 模型 / 工具 / 平台:Claude Code、Claude Cowork、Mythos(新模型,可找出數千個網路安全漏洞)、Palantir Maven 智慧系統、Constitutional AI(宪法式 AI)、玻璃翼計畫(Project Glasswing)
- 概念 / 方法:平滑指數曲線(smooth exponential)、人在回路(human-in-the-loop)、AI 輔助目標鎖定(AI-assisted targeting)、發布前測試與審計(pre-release testing and auditing)、全民基本收入 UBI、對 AI 公司累進徵稅
- 合作 / 合約:2024 年與 Palantir 合作;2025 年與 OpenAI、xAI、Google 等共同獲得 2 億美元國防部合約
- 紅線:不與 ICE(移民與海關執法局)、CBP 合作;不認為 Claude 用於加薩行動;禁止大規模監控(mass surveillance)與自主武器(autonomous weapons)
- Mythos 限制:採玻璃翼計畫有限釋放,僅提供特定組織與政府機構,包含 NSA 等聯邦機構
- 參考書目:《原子弹秘史》;達里奧自比利奧·齊拉特(Leo Szilard),而非奥本海默
- 商業模式批評對象:廣告驅動 / 社群媒體模式(注意力最大化)
- Boris Cherny:2024 年加入 Anthropic,負責打造 Claude Code 與 Claude Cowork;個人過去至少六個月 100% 程式碼由 Claude 撰寫
結論
結論“AI 時代最有權力的安全派同樣需要被安全地約束——我們需要的從來不是信任某個創辦人的良心,而是建立一套哪怕再有良心的人也無法單方面決定世界走向的制度性制衡機制。”
完整解析
詳細Anthropic 的故事從一個信任破裂的時刻開始。達里奧在受訪時說明,當年從 OpenAI 出走,技術路線上的分歧並非決定性因素,真正讓合作無以為繼的,是他感受到對方的價值觀與對外宣稱的不一致。這個出發點至關重要,因為達里奧正是 scaling laws 的早期倡導者之一——他比多數人更早相信模型能力會沿著「平滑指數曲線」快速攀升,也正因此比多數人更早感到恐懼。在他的框架裡,當 AI 能力已進入指數增長的軌道,建造者的誠實度、治理結構與商業動機,就不再是軟性的企業文化問題,而是足以影響文明走向的核心變數。
在產品層面,丹妮拉將 Claude 的目標人格定義為「專業的溫暖」——不是情感依附型的虛擬朋友,也不是冷冰冰的計算器,而是可親但有邊界的專業夥伴。這個定位的背後是一套稱為 Constitutional AI 的訓練框架:Claude 不完全依賴人工逐條標注,而是依照一組公開的原則進行自我訓練與約束,這些原則的來源涵蓋《世界人權宣言》以及跨宗教的核心共識。丹妮拉回憶 Claude 2 早期曾過度謹慎到「連問天氣都要附帶一堆過度提醒」,正好說明安全調校的難度:尺度太鬆有風險,尺度太緊則讓模型變得荒謬且難以使用。
在商業走向上,Anthropic 刻意迴避廣告驅動與社群媒體式的注意力最大化商業模式,主押 Claude Code、Claude Cowork 等高附加價值的企業工具,以及生物技術、製藥、學術研究、能源等領域。Claude Code 的發布成為標誌性轉折點:Boris Cherny 描述,工程工作的定義已徹底改變——工程師不再只是將需求翻譯為程式碼,而是多個 AI coding agent 的指揮者、系統整合者與產品方向判斷者。他本人與整個團隊幾乎所有程式碼都由 Claude 完成。Claude Cowork 發布後,市場單日蒸發 2850 億美元軟體股市值,交易員稱之為「SaaS 末日」,反映出市場對傳統 SaaS 估值邏輯被重新計算的恐慌。
然而,商業成功帶來的不只是產業重構,還有更難回答的問題。在就業衝擊上,達里奧並未收回「AI 可能在一到五年內消除一半入門白領職位」的判斷,並指出問題的核心從「任務會不會被自動化」轉向了「整份工作還剩下多少不可替代的經濟價值」。在國防合作上,Anthropic 與 Palantir 合作,Claude 被用於 Maven 智慧系統的 AI 輔助目標鎖定,美軍每日可處理目標從 1000 個提升至 5000 個。達里奧以「人在回路」作為核心防線,強調最終決策是人類做出的,並援引《奇愛博士》的邏輯說明全自動系統的災難性風險;但主持人追問,當 AI 把決策節奏加速五倍、將海量資訊壓縮成幾個建議,人類按下確認鍵究竟是在審慎判斷,還是在替系統完成責任的閉環?這個問題沒有被真正回答。而在最新模型 Mythos 上,公司內部人員的評語是「這是超級武器,使用應該需要持槍證」——Anthropic 的回應是採取玻璃翼計畫,限制性地提供給特定政府機構,並主張推動發布前的測試與審計,達里奧甚至明言不發布 Mythos 對公司的商業傷害極大,藉此證明這不只是口號。
達里奧在受訪最後坦承,如果外界不了解 Anthropic,從不信任開始是理性的,硅谷必須靠實際行動而非口號重建信任。他以利奧·齊拉特而非奧本海默自比,強調我們需要的不是英雄式核心人物,而是多個強大主體之間的制衡機制。他既不認為政府應直接接管,也承認 AI 是歷史上第一個主要由私人部門先建成、政府很晚才介入的強大技術,並稱這是「危險且不穩定的狀態」。
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


