KeyFrame

5個GitHub工具大觀:AI、OCR與生產力工具

Jerry's Productivity Tech Channel·6月19日週五·9 min中文

三句話摘要

介紹五款 GitHub 上可免費使用的開源工具,涵蓋剪貼板管理、Markdown 編輯、AI OCR、離線 OCR 與視窗標籤頁功能。 五款工具各攻一個痛點,且全部免費開源,其中 Snippai 的 LLM 驅動 OCR 與 Window Tabs 的免費標籤頁功能最具即時替換現有付費工具的實用價值。 Beetroot 提供最完整的剪貼板體驗,但穩定性仍有待改善。 相較於 Ditto 或 CopyQ,Beetroot 額外記錄剪貼內容來源應用程式、支援圖片獨立列表,並整合多個 AI 供應商,但 OCR 目前無法辨識中文與數學公式,且方向鍵操作偶爾失靈。

重點整理

重點
  • 1

    Beetroot 提供最完整的剪貼板體驗,但穩定性仍有待改善。 相較於 Ditto 或 CopyQ,Beetroot 額外記錄剪貼內容來源應用程式、支援圖片獨立列表,並整合多個 AI 供應商,但 OCR 目前無法辨識中文與數學公式,且方向鍵操作偶爾失靈。

  • 2

    Tolaria 以執行效能換取快速開啟,並以 Git 取代雲端同步需求。 以 Rust 撰寫使其啟動速度遠快於 Obsidian,編輯體驗接近 Notion(斜線選單),並原生整合 Git,無需額外設定檔案同步方案。

  • 3

    Snippai 以 LLM 彌補傳統 OCR 對複雜內容的識別盲區。 傳統 OCR 對數學公式與表格結構常出錯,Snippai 改以語言模型理解圖像語意,輸出 LaTeX 格式公式或結構化表格,適合學術或技術內容截圖。

  • 4

    Window Tabs 以免費方式實現 Groupy 的付費功能。 透過群組分類設定,可將不同類型應用程式強制組成標籤頁,支援拖曳合併與 Detach 分離,大幅改善多視窗管理效率。

實用技巧與重點

乾貨
  • Beetroot
  • 平台:僅 Windows,無 Linux / macOS
  • 提供 9 個主題
  • 介面語言:簡體中文
  • OCR 支援:英文、數字,不支援中文與數學公式
  • AI 整合:支援 OpenAI、Anthropic 等主流供應商 + 自訂本地 LLM(需手動輸入 URL)
  • 已知問題:上下鍵移動、Enter 帶出內容偶爾失效
  • 無原始碼,僅提供可執行檔
  • Tolaria
  • 開發語言:Rust
  • 定位:輕量 Obsidian 替代品
  • 支援多 Vault 同時開啟
  • 範例:同時開啟兩個 Vault 共顯示 3500+ 檔案;單一 Vault 為 210 個 MD 檔
  • 支援中文介面
  • 內建 Git 整合(不需第三方同步工具)
  • 操作熱鍵:`/` 或 `+` 開啟內容選單(類 Notion)
  • Snippai
  • 截圖熱鍵:`Ctrl+Shift+A`
  • 截圖方式:透過 Windows 內建截圖工具
  • 輸出格式:LaTeX 數學公式、結構化表格
  • 適用場景:數學公式辨識、中文表格辨識
  • Umi-OCR
  • 類型:完全離線,無需網路
  • 熱鍵:`Win+Alt+C`
  • 特點:中文辨識率高,環境全打包,免安裝配置
  • Window Tabs
  • 功能:為任意應用程式添加標籤頁
  • 群組分類:可自訂不同應用程式合併為同一群組(如 ShareX + 檔案總管)
  • 操作:拖曳標籤至視窗上方合併,右鍵 Detach 或向外拖曳分離
  • 費用:免費(付費替代品 Groupy 需授權費)

結論

結論

五款工具各攻一個痛點,且全部免費開源,其中 Snippai 的 LLM 驅動 OCR 與 Window Tabs 的免費標籤頁功能最具即時替換現有付費工具的實用價值。

完整解析

詳細

本影片介紹五款托管於 GitHub 的免費開源工具,目標是提升 Windows 使用者的日常生產力,涵蓋剪貼板管理、文字編輯、圖像文字辨識與視窗管理四大場景。

第一款 Beetroot 是一個功能整合度較高的剪貼板管理工具。與傳統的 Ditto 或 CopyQ 相比,它在外觀設計上更現代,提供 9 個可切換主題,並額外記錄每筆剪貼內容的來源應用程式,方便追溯。圖片內容有獨立列表可快速篩選,同時整合了 OpenAI、Anthropic 等主流 AI 供應商,也支援自訂本地 LLM。其離線 OCR 功能可辨識英文與數字,但目前無法處理中文與數學公式。值得注意的是,Beetroot 雖開放於 GitHub,但僅提供可執行檔而無原始碼,且只有 Windows 版本。目前已知的穩定性問題包括:上下鍵偶爾無法移動選項、Enter 鍵有時無法帶出內容。

第二款 Tolaria 是以 Rust 撰寫的 Markdown 編輯器,定位為 Obsidian 的輕量替代品。由於採用 Rust,啟動速度明顯優於 Obsidian,適合需要快速開啟並編輯 Markdown 檔案的場景。介面左側類似 Evernote 的瀏覽面板,右側編輯區則採用類 Notion 的斜線指令與 `+` 選單操作。Tolaria 支援同時開啟多個 Vault,並原生整合 Git,讓檔案同步不需另尋解決方案,對習慣 Git 工作流的開發者而言極為便利。

第三款 Snippai 解決了傳統 OCR 工具對複雜內容辨識能力不足的問題。它透過大語言模型來理解截圖內容,因此在數學公式與中文表格的辨識上表現突出。操作流程為:按下 `Ctrl+Shift+A` 呼叫 Windows 內建截圖工具截圖後,Snippai 自動將圖像送往 LLM 辨識,結果可直接以 LaTeX 格式複製貼入 Obsidian 等工具使用。第四款 Umi-OCR 則走離線路線,無需網路即可辨識,熱鍵 `Win+Alt+C` 截圖後立即呈現結果,中文辨識率高,且整個執行環境均已打包,無需複雜配置。

第五款 Window Tabs 讓任何 Windows 應用程式都能獲得標籤頁功能。使用者可在設定中為不同應用程式指定群組分類,開啟後同群組的視窗會自動合併為標籤列;拖曳標籤至目標視窗上方可手動合併,右鍵 Detach 或向外拖曳則可分離。這個功能過去需要購買 Groupy 才能實現,Window Tabs 以免費開源的形式提供了相同體驗。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「GitHub 熱點」的內容

Open Source AI
3 min
GitHub 熱點英文6月19日

Open Source AI

Kiraa

  • Apple Silicon 擁有業界頂尖的硬體整合架構,但原生軟體生態系不足,Kira 團隊選擇以 Swift 直接開發以填補這個缺口,充分發揮統一記憶體的優勢。
  • NVIDIA 的 GPU 運算模型建立在 CPU 與 GPU 分離的舊概念之上,這在 Apple 的統一晶片架構下是根本性的設計劣勢,因此需要全新的軟體堆疊。
  • Swift Pandas 能以傳統 Python Pandas 的 80 倍效能執行資料運算,使原本需要數天完成的工作縮短為數小時,直接改變了資料工作流程的可行性。
基于 OpenZeppelin 保密库的保密型 Solidity 合约  Zama 开发者专区・第九届以太坊开发者大会(EthCC 9)
16 min
GitHub 熱點中文6月19日

基于 OpenZeppelin 保密库的保密型 Solidity 合约 Zama 开发者专区・第九届以太坊开发者大会(EthCC 9)

Zama中文

  • 1. 機密 Solidity 的根本差異在於「沒有明文、沒有分支、沒有 revert」
  • 所有變數返回的都是密文句柄,需在鏈下解密;無法用 if 分支,必須用 FHESELECT 選擇路徑;函數不能 revert,不足餘額時只能返回加密零值,呼叫者自行判斷結果。
  • 2. 機密代幣(EC-7984)是 ERC-20 的隱私版本,介面設計全面加密化
GitHub Trending Today - astrid, mcp-server-cloudflare, ai & More | #90
編輯精選
16 min
GitHub 熱點英文6月19日

GitHub Trending Today - astrid, mcp-server-cloudflare, ai & More | #90

GitHub Trending Digest

  • AI 框架走向 microkernel 設計:Astrid 採用類 Linux 的微核心架構,核心固定、外部模組可替換,讓開發者能混搭不同 AI 供應商與工具,避免整個專案被單一平台綁死。
  • MCP 成為 AI 與基礎設施的橋樑:Cloudflare MCP Transporter 將 Model Context Protocol 落地,讓 Cursor 或 Claude 等 AI 客戶端直接操作 Cloudflare 帳戶,實現自然語言管理雲端資源的工作流。
  • 供應商無關的 AI SDK 是前端整合的關鍵:Sandstack AI 提供統一 API,讓同一套邏輯能切換 OpenAI、Anthropic、Gemini 等供應商,並原生支援 React、Vue、Svelte、Solid,降低多平台適配成本。