KeyFrame
AI 技術編輯精選

Agentic AI Explained: The Complete 2026 Guide

Aishwarya Srinivasan·6月19日週五·30 min英文

三句話摘要

從 LLM 到 AI Agent 的完整技術架構拆解:理解語言模型、上下文工程、RAG 與代理系統的核心原理。 --- 理解 AI 系統的核心框架只需一條梯子:模型是大腦、Context 是它的知識輸入、工具把思考變成行動、Evals 確保整個系統真的有在正常運作。 1. 不可預測性來自機率採樣,溫度(Temperature)是控制旋鈕

重點整理

重點
  • 1

    1. 不可預測性來自機率採樣,溫度(Temperature)是控制旋鈕

  • 2

    LLM 每次生成時對所有可能的 token 計算機率分布,再依機率採樣而非直接選最高分,這就是為何同一問題會得到不同回答。Temperature 越低輸出越穩定,越高則越發散,這是設計特性而非缺陷。

  • 3

    2. Decoder-only 架構統一了理解與生成

  • 4

    原始 Transformer 分 Encoder(理解)與 Decoder(生成)兩段,但實驗發現 Decoder 本身就能同時做理解與生成,去掉 Encoder 反而在大規模訓練下效果更好,因此 GPT、Claude 等全採 Decoder-only,用「持續預測下一個 token」這個極簡目標,在萬億詞的規模下湧現出推理、摘要、寫程式等能力。

  • 5

    3. Context Engineering 取代了 Prompt Engineering

  • 6

    模型只能看到它的上下文視窗(context window)裡的內容,對話歷史、外部文件、工具定義、長期記憶都必須被正確地組裝進去。真正的技術門檻已從「怎麼寫一句巧妙的提示詞」升級為「怎麼精準決定放什麼進 context、順序如何、比例多少」。

  • 7

    4. Agent = 模型 + 工具 + ReAct 循環

  • 8

    單純的模型只能回應,無法主動行動。把工具(搜尋網路、執行程式碼、查資料庫、寄信)賦予模型後,模型就成為 Agent。最核心的運作模式是 ReAct 循環:推理 → 呼叫工具 → 觀察結果 → 再推理,直到任務完成。Reasoning model(如 OpenAI o 系列、DeepSeek R1)在行動前先用隱藏的 chain-of-thought 推演,讓複雜任務的準確率大幅提升。

  • 9

    --

實用技巧與重點

乾貨
  • 模型與架構
  • 2017 年 Google 論文《Attention Is All You Need》提出 Transformer
  • BERT(2018,Google):Encoder-only,擅長分類、搜尋、情感分析,訓練方式為填空
  • GPT 系列、Claude、Gemini、Llama:全為 Decoder-only,訓練方式為「預測下一個 token」
  • 推理模型代表:OpenAI o 系列、DeepSeek R1(先生成 chain-of-thought 再輸出答案)
  • 模態類型
  • LLM:文字輸入 → 文字輸出
  • VLM(Vision Language Model):文字 + 圖片/影片輸入 → 文字輸出
  • 圖片生成模型:Midjourney、DALL-E、ChatGPT Image 2.0
  • 影片生成模型:VEO、OMNI
  • Context Window 組成元件
  • System Prompt(持久指令,等同職位描述)
  • User Prompt(當前請求)
  • Conversation History(對話歷史)
  • Retrieved Knowledge(RAG 取回的文件)
  • Tool Definitions(工具定義清單)
  • Memory(長期使用者/任務記憶)
  • RAG 三步驟
  • Retrieval:從 Vector Database 以語意搜尋取出最相關文件片段
  • Augmentation:對取回文件重新排序(re-rank)、裁剪、格式化後放入 context
  • Generation:模型根據問題 + 整理後的文件生成有根據的答案
  • Vector Database 原理
  • 將文字/圖片/PDF 轉為向量嵌入(embeddings)
  • 儲存原始文字 + 向量 + metadata
  • 支援語意搜尋而非關鍵字搜尋
  • Agentic Design Patterns(Andrew Ng 分類)
  • Reflection:Agent 自我批評並迭代改善輸出
  • Tool Use:賦予模型呼叫外部工具的能力
  • Planning:將大目標拆解為執行步驟序列
  • Multi-Agent Collaboration:多個 Agent 分工協作(如研究員 + 寫手 + 審稿人)
  • ReAct 循環
  • Reason(推理)→ Act(呼叫工具)→ Observe(觀察結果)→ Reason(再推理)→ ...
  • AI Evals 重點
  • 解決問題:Agent 是非決定性的,同一任務可能有不同結果
  • 每個系統(醫療、客服、程式碼)的「好」標準完全不同
  • 核心工作:將模糊的質性標準轉化為可量化的具體指標
  • 課程資訊(Gen Academy)
  • 六週認證課程,涵蓋 LLM 基礎、RAG、Context Engineering、Agentic Design Patterns、AI Evals、Fine-tuning、AI 安全
  • 每週兩次直播課 + 每週直播答疑
  • 超過 35% 學員為非工程師(PM、行銷、創業者)
  • 開發者:程式碼實作路線;非開發者:Low-code/No-code 路線
  • 合作夥伴:NVDR、OpenAI、LlamaIndex、LangChain、Pinecone
  • --

結論

結論

理解 AI 系統的核心框架只需一條梯子:模型是大腦、Context 是它的知識輸入、工具把思考變成行動、Evals 確保整個系統真的有在正常運作。

完整解析

詳細

一切 AI 系統的底層,都是一台精密的預測機。大型語言模型(LLM)的運作方式出乎大多數人意料地簡單:給定輸入文字,模型針對所有可能的下一個 token 計算機率分布,再依機率採樣輸出,如此循環直到回答完成。ChatGPT「像是在即時打字」的視覺效果,本質上就是這個 token-by-token 輸出的過程。這種機率採樣也解釋了 LLM 的「不可預測性」——它不是 bug,而是透過 Temperature 參數刻意調控的設計,低溫輸出保守穩定,高溫輸出發散創意。

讓 LLM 從玩具變成強大工具的關鍵,是 2017 年 Google 提出的 Transformer 架構,核心是「注意力機制(Attention)」,讓模型能同時審視整段輸入並判斷各詞之間的相關性,而非像早期模型只能線性閱讀。原始 Transformer 分為 Encoder(理解)和 Decoder(生成)兩個半部,前者像是聆聽者、後者像是發言者。但後來研究發現,對開放式生成任務而言,Decoder 本身就能兼顧理解與生成,不需要 Encoder;將此架構在萬億詞規模上訓練,「預測下一個 token」這個極度簡單的目標竟然湧現出推理、翻譯、寫程式等複雜能力。這就是為什麼今天所有主流模型——GPT、Claude、Gemini、Llama——全部採用 Decoder-only 架構,簡單性反而是最強的武器。

然而,模型再強大,也只能看到它「上下文視窗(context window)」裡的內容。這個洞察推動了整個業界從 Prompt Engineering 演進到 Context Engineering。使用者輸入的訊息其實只是最終進入模型的整體 context 的一小部分;在現代 AI 系統中,這個 context 還包含 System Prompt(定義模型角色與行為邊界的持久指令)、對話歷史、透過 RAG 動態取回的外部文件、可呼叫的工具定義,以及長期記憶。真正的技術能力,在於精準決定什麼資訊該放進去、以什麼順序放、放多少——這就是 Context Engineering 的本質,也是把「交給顧問一頁乾淨的簡報」和「把十年積壓的亂檔案全倒在桌上」區分開來的關鍵。其中 RAG(Retrieval-Augmented Generation)尤為重要:它把訓練時的「閉卷考試」變成「開卷考試」,先從 Vector Database 以語意搜尋取出最相關的文件片段,經過重排序與清理後注入 context,讓模型能針對公司內部文件或最新時事給出有根據的回答,而不是憑凍結的訓練記憶猜測。

當模型被賦予工具——搜尋網路、執行程式碼、呼叫 API、寄送電子郵件——就從「腦子」升格為「Agent」。這個比喻非常精準:大腦本身再聰明,漂浮在罐子裡也無法訂機票;給它手腳與工具,它才能在真實世界採取行動。Agent 的核心運作模式是 ReAct 循環:推理下一步、呼叫工具、觀察結果、再推理,直到任務完成,就像偵探辦案一樣不斷提出假設、蒐集線索、更新判斷。Reasoning model(如 OpenAI o 系列、DeepSeek R1)在這個基礎上更進一步,在給出最終答案前先生成隱藏的思考鏈(chain-of-thought),在數學、邏輯、複雜程式設計等任務上帶來顯著的準確率提升。但 Agent 有一個根本挑戰:它是非決定性的,同樣的任務每次可能有不同結果。這就是 AI Evals(評估系統)的價值所在——將「回答是否有幫助、是否有根據、語氣是否適當、是否安全」這些模糊的質性標準,轉化為可持續追蹤的量化指標,因為你無法改善你無法衡量的東西。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕