KeyFrame

Open Source AI

Kiraa·6月19日週五·3 min英文

三句話摘要

Kira 引擎團隊透過 Apple Silicon 原生開發,將地端 AI 推論效能大幅提升,並以 Swift Pandas 與 Project Onyx 兩個開源示範專案吸引開發者棄雲端、就本地運算。 把 Python Pandas 工作負載移植至 Swift 並跑在 Apple Silicon 上,可獲得 80 倍效能提升,是將雲端 AI 依賴轉為本地安全推論的最具體入口。 Apple Silicon 擁有業界頂尖的硬體整合架構,但原生軟體生態系不足,Kira 團隊選擇以 Swift 直接開發以填補這個缺口,充分發揮統一記憶體的優勢。

重點整理

重點
  • 1

    Apple Silicon 擁有業界頂尖的硬體整合架構,但原生軟體生態系不足,Kira 團隊選擇以 Swift 直接開發以填補這個缺口,充分發揮統一記憶體的優勢。

  • 2

    NVIDIA 的 GPU 運算模型建立在 CPU 與 GPU 分離的舊概念之上,這在 Apple 的統一晶片架構下是根本性的設計劣勢,因此需要全新的軟體堆疊。

  • 3

    Swift Pandas 能以傳統 Python Pandas 的 80 倍效能執行資料運算,使原本需要數天完成的工作縮短為數小時,直接改變了資料工作流程的可行性。

  • 4

    讓更多開發者在本地裝置上建構 AI 應用,是推動社會從「便宜但危險的雲端模型」轉向「快速、便宜且安全的端側模型」的關鍵策略。

實用技巧與重點

乾貨
  • 效能提升:Swift Pandas 達到傳統 Python Pandas 的 80 倍運算速度
  • 實際案例:某專案的報告流程從 10 天壓縮至 1 小時
  • 講者個人積累:超過 25,000 小時花費在等待月底批次運算作業
  • 工具/平台名稱:Apple SiliconSwiftPython Pandas
  • 專案名稱:Swift Pandas(Python Pandas 的 Swift 替代方案)、Project Onyx(本地端 LLM 推論軟體,支援 Mac 及 iPad)
  • 應用形式:Project Onyx 可在個人電腦與 iPad 上本地執行大型語言模型,並取得良好回應時間
  • 合作對象:已開始與大學合作,讓學生參與設計與測試
  • 講者身份:Dr. Errol Brandt,Kira 副總裁(VP)

結論

結論

把 Python Pandas 工作負載移植至 Swift 並跑在 Apple Silicon 上,可獲得 80 倍效能提升,是將雲端 AI 依賴轉為本地安全推論的最具體入口。

完整解析

詳細

Kira 團隊在過去數個月中持續推進一個核心目標:讓 Apple Silicon 硬體的 AI 潛力真正被軟體開發者所用。Dr. Errol Brandt 指出,Apple 已擁有業界頂尖的硬體整合設計,但對應的原生開發生態系嚴重不足,導致這塊硬體的實際使用者相對稀少。因此,團隊選擇以 Swift 語言直接撰寫底層功能,目標是最大化 Apple 硬體的用戶觸及率。

Brandt 點出了目前主流 AI 加速硬體的一個根本性問題:NVIDIA 最初以遊戲顯示卡起家,後來延伸至加密貨幣與深度學習運算,但其整個軟體架構仍建立在 CPU 與 GPU 實體分離的舊有概念上。相較之下,Apple Silicon 採用統一記憶體架構,CPU 與 GPU 共享同一記憶體池,這在理論上能大幅降低資料搬移的延遲與能耗。他坦言,要讓人們憑空想像這個差異並不容易,因此決定用實際專案來說話。

為了讓這個論點具備說服力,團隊推出了兩個示範專案。第一個是 Swift Pandas,這是 Python 生態系中廣泛使用的 Pandas 資料分析函式庫的 Swift 重寫版本,在實測中達到傳統 Python 版本 80 倍的運算速度,原本需要數天才能完成的資料工作,現在可以在數小時內完成。第二個是 Project Onyx,一套可以在個人電腦與 iPad 上本地執行大型語言模型(LLM)的軟體,使用者能在自己的裝置上運行並獲得良好的推論回應時間,完全不依賴雲端服務。

Brandt 強調,發布這兩個專案的動機,是希望吸引更多開發者投入 Swift 與 Apple 系統的開發。他的邏輯是:只要有足夠多的開發者在本地端建構 AI 應用,社會就會逐漸意識到雲端 AI 模型的潛在問題,進而推動從「便宜卻危險的雲端模型」向「快速、便宜且安全的端側模型」轉型。團隊目前已與大學展開合作,讓學生參與這些技術的實驗與設計,並邀請社群中正在使用這兩個專案建構應用的開發者直接與他聯繫,以便在頻道上分享社群的成果。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「GitHub 熱點」的內容

基于 OpenZeppelin 保密库的保密型 Solidity 合约  Zama 开发者专区・第九届以太坊开发者大会(EthCC 9)
16 min
GitHub 熱點中文6月19日

基于 OpenZeppelin 保密库的保密型 Solidity 合约 Zama 开发者专区・第九届以太坊开发者大会(EthCC 9)

Zama中文

  • 1. 機密 Solidity 的根本差異在於「沒有明文、沒有分支、沒有 revert」
  • 所有變數返回的都是密文句柄,需在鏈下解密;無法用 if 分支,必須用 FHESELECT 選擇路徑;函數不能 revert,不足餘額時只能返回加密零值,呼叫者自行判斷結果。
  • 2. 機密代幣(EC-7984)是 ERC-20 的隱私版本,介面設計全面加密化
5個GitHub工具大觀:AI、OCR與生產力工具
9 min
GitHub 熱點中文6月19日

5個GitHub工具大觀:AI、OCR與生產力工具

Jerry's Productivity Tech Channel

  • Beetroot 提供最完整的剪貼板體驗,但穩定性仍有待改善。 相較於 Ditto 或 CopyQ,Beetroot 額外記錄剪貼內容來源應用程式、支援圖片獨立列表,並整合多個 AI 供應商,但 OCR 目前無法辨識中文與數學公式,且方向鍵操作偶爾失靈。
  • Tolaria 以執行效能換取快速開啟,並以 Git 取代雲端同步需求。 以 Rust 撰寫使其啟動速度遠快於 Obsidian,編輯體驗接近 Notion(斜線選單),並原生整合 Git,無需額外設定檔案同步方案。
  • Snippai 以 LLM 彌補傳統 OCR 對複雜內容的識別盲區。 傳統 OCR 對數學公式與表格結構常出錯,Snippai 改以語言模型理解圖像語意,輸出 LaTeX 格式公式或結構化表格,適合學術或技術內容截圖。
GitHub Trending Today - astrid, mcp-server-cloudflare, ai & More | #90
編輯精選
16 min
GitHub 熱點英文6月19日

GitHub Trending Today - astrid, mcp-server-cloudflare, ai & More | #90

GitHub Trending Digest

  • AI 框架走向 microkernel 設計:Astrid 採用類 Linux 的微核心架構,核心固定、外部模組可替換,讓開發者能混搭不同 AI 供應商與工具,避免整個專案被單一平台綁死。
  • MCP 成為 AI 與基礎設施的橋樑:Cloudflare MCP Transporter 將 Model Context Protocol 落地,讓 Cursor 或 Claude 等 AI 客戶端直接操作 Cloudflare 帳戶,實現自然語言管理雲端資源的工作流。
  • 供應商無關的 AI SDK 是前端整合的關鍵:Sandstack AI 提供統一 API,讓同一套邏輯能切換 OpenAI、Anthropic、Gemini 等供應商,並原生支援 React、Vue、Svelte、Solid,降低多平台適配成本。