Agentic AI Explained: The Complete 2026 Guide
三句話摘要
從 LLM 到 AI Agent 的完整技術架構拆解:理解語言模型、上下文工程、RAG 與代理系統的核心原理。 --- 理解 AI 系統的核心框架只需一條梯子:模型是大腦、Context 是它的知識輸入、工具把思考變成行動、Evals 確保整個系統真的有在正常運作。 1. 不可預測性來自機率採樣,溫度(Temperature)是控制旋鈕
重點整理
重點- 1
1. 不可預測性來自機率採樣,溫度(Temperature)是控制旋鈕
- 2
LLM 每次生成時對所有可能的 token 計算機率分布,再依機率採樣而非直接選最高分,這就是為何同一問題會得到不同回答。Temperature 越低輸出越穩定,越高則越發散,這是設計特性而非缺陷。
- 3
2. Decoder-only 架構統一了理解與生成
- 4
原始 Transformer 分 Encoder(理解)與 Decoder(生成)兩段,但實驗發現 Decoder 本身就能同時做理解與生成,去掉 Encoder 反而在大規模訓練下效果更好,因此 GPT、Claude 等全採 Decoder-only,用「持續預測下一個 token」這個極簡目標,在萬億詞的規模下湧現出推理、摘要、寫程式等能力。
- 5
3. Context Engineering 取代了 Prompt Engineering
- 6
模型只能看到它的上下文視窗(context window)裡的內容,對話歷史、外部文件、工具定義、長期記憶都必須被正確地組裝進去。真正的技術門檻已從「怎麼寫一句巧妙的提示詞」升級為「怎麼精準決定放什麼進 context、順序如何、比例多少」。
- 7
4. Agent = 模型 + 工具 + ReAct 循環
- 8
單純的模型只能回應,無法主動行動。把工具(搜尋網路、執行程式碼、查資料庫、寄信)賦予模型後,模型就成為 Agent。最核心的運作模式是 ReAct 循環:推理 → 呼叫工具 → 觀察結果 → 再推理,直到任務完成。Reasoning model(如 OpenAI o 系列、DeepSeek R1)在行動前先用隱藏的 chain-of-thought 推演,讓複雜任務的準確率大幅提升。
- 9
--
實用技巧與重點
乾貨- 模型與架構
- 2017 年 Google 論文《Attention Is All You Need》提出 Transformer
- BERT(2018,Google):Encoder-only,擅長分類、搜尋、情感分析,訓練方式為填空
- GPT 系列、Claude、Gemini、Llama:全為 Decoder-only,訓練方式為「預測下一個 token」
- 推理模型代表:OpenAI o 系列、DeepSeek R1(先生成 chain-of-thought 再輸出答案)
- 模態類型
- LLM:文字輸入 → 文字輸出
- VLM(Vision Language Model):文字 + 圖片/影片輸入 → 文字輸出
- 圖片生成模型:Midjourney、DALL-E、ChatGPT Image 2.0
- 影片生成模型:VEO、OMNI
- Context Window 組成元件
- System Prompt(持久指令,等同職位描述)
- User Prompt(當前請求)
- Conversation History(對話歷史)
- Retrieved Knowledge(RAG 取回的文件)
- Tool Definitions(工具定義清單)
- Memory(長期使用者/任務記憶)
- RAG 三步驟
- Retrieval:從 Vector Database 以語意搜尋取出最相關文件片段
- Augmentation:對取回文件重新排序(re-rank)、裁剪、格式化後放入 context
- Generation:模型根據問題 + 整理後的文件生成有根據的答案
- Vector Database 原理
- 將文字/圖片/PDF 轉為向量嵌入(embeddings)
- 儲存原始文字 + 向量 + metadata
- 支援語意搜尋而非關鍵字搜尋
- Agentic Design Patterns(Andrew Ng 分類)
- Reflection:Agent 自我批評並迭代改善輸出
- Tool Use:賦予模型呼叫外部工具的能力
- Planning:將大目標拆解為執行步驟序列
- Multi-Agent Collaboration:多個 Agent 分工協作(如研究員 + 寫手 + 審稿人)
- ReAct 循環
- Reason(推理)→ Act(呼叫工具)→ Observe(觀察結果)→ Reason(再推理)→ ...
- AI Evals 重點
- 解決問題:Agent 是非決定性的,同一任務可能有不同結果
- 每個系統(醫療、客服、程式碼)的「好」標準完全不同
- 核心工作:將模糊的質性標準轉化為可量化的具體指標
- 課程資訊(Gen Academy)
- 六週認證課程,涵蓋 LLM 基礎、RAG、Context Engineering、Agentic Design Patterns、AI Evals、Fine-tuning、AI 安全
- 每週兩次直播課 + 每週直播答疑
- 超過 35% 學員為非工程師(PM、行銷、創業者)
- 開發者:程式碼實作路線;非開發者:Low-code/No-code 路線
- 合作夥伴:NVDR、OpenAI、LlamaIndex、LangChain、Pinecone
- --
結論
結論“理解 AI 系統的核心框架只需一條梯子:模型是大腦、Context 是它的知識輸入、工具把思考變成行動、Evals 確保整個系統真的有在正常運作。”
完整解析
詳細一切 AI 系統的底層,都是一台精密的預測機。大型語言模型(LLM)的運作方式出乎大多數人意料地簡單:給定輸入文字,模型針對所有可能的下一個 token 計算機率分布,再依機率採樣輸出,如此循環直到回答完成。ChatGPT「像是在即時打字」的視覺效果,本質上就是這個 token-by-token 輸出的過程。這種機率採樣也解釋了 LLM 的「不可預測性」——它不是 bug,而是透過 Temperature 參數刻意調控的設計,低溫輸出保守穩定,高溫輸出發散創意。
讓 LLM 從玩具變成強大工具的關鍵,是 2017 年 Google 提出的 Transformer 架構,核心是「注意力機制(Attention)」,讓模型能同時審視整段輸入並判斷各詞之間的相關性,而非像早期模型只能線性閱讀。原始 Transformer 分為 Encoder(理解)和 Decoder(生成)兩個半部,前者像是聆聽者、後者像是發言者。但後來研究發現,對開放式生成任務而言,Decoder 本身就能兼顧理解與生成,不需要 Encoder;將此架構在萬億詞規模上訓練,「預測下一個 token」這個極度簡單的目標竟然湧現出推理、翻譯、寫程式等複雜能力。這就是為什麼今天所有主流模型——GPT、Claude、Gemini、Llama——全部採用 Decoder-only 架構,簡單性反而是最強的武器。
然而,模型再強大,也只能看到它「上下文視窗(context window)」裡的內容。這個洞察推動了整個業界從 Prompt Engineering 演進到 Context Engineering。使用者輸入的訊息其實只是最終進入模型的整體 context 的一小部分;在現代 AI 系統中,這個 context 還包含 System Prompt(定義模型角色與行為邊界的持久指令)、對話歷史、透過 RAG 動態取回的外部文件、可呼叫的工具定義,以及長期記憶。真正的技術能力,在於精準決定什麼資訊該放進去、以什麼順序放、放多少——這就是 Context Engineering 的本質,也是把「交給顧問一頁乾淨的簡報」和「把十年積壓的亂檔案全倒在桌上」區分開來的關鍵。其中 RAG(Retrieval-Augmented Generation)尤為重要:它把訓練時的「閉卷考試」變成「開卷考試」,先從 Vector Database 以語意搜尋取出最相關的文件片段,經過重排序與清理後注入 context,讓模型能針對公司內部文件或最新時事給出有根據的回答,而不是憑凍結的訓練記憶猜測。
當模型被賦予工具——搜尋網路、執行程式碼、呼叫 API、寄送電子郵件——就從「腦子」升格為「Agent」。這個比喻非常精準:大腦本身再聰明,漂浮在罐子裡也無法訂機票;給它手腳與工具,它才能在真實世界採取行動。Agent 的核心運作模式是 ReAct 循環:推理下一步、呼叫工具、觀察結果、再推理,直到任務完成,就像偵探辦案一樣不斷提出假設、蒐集線索、更新判斷。Reasoning model(如 OpenAI o 系列、DeepSeek R1)在這個基礎上更進一步,在給出最終答案前先生成隱藏的思考鏈(chain-of-thought),在數學、邏輯、複雜程式設計等任務上帶來顯著的準確率提升。但 Agent 有一個根本挑戰:它是非決定性的,同樣的任務每次可能有不同結果。這就是 AI Evals(評估系統)的價值所在——將「回答是否有幫助、是否有根據、語氣是否適當、是否安全」這些模糊的質性標準,轉化為可持續追蹤的量化指標,因為你無法改善你無法衡量的東西。
---
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


