實測心得｜ 2026-05-17 ｜ AI 工具實測

我用 AI 自動化公司 Paperclip
跑了兩個商業模式

整理五個我嘗試後的觀察，以及為什麼我決定「先不用它」。這份報告把整個踩坑過程、學到的概念、跟其他平台比較整理好，給你 30 分鐘的判斷材料。

作者：老K ｜領先時代數位

TL;DR

Paperclip 是真的能跑、視覺化做得很好的多 agent 編排平台，10 分鐘就讓 AI 自動 ship 出一份完整的 Next.js 中文 landing page。

但它有幾個 marketing 沒講清楚的限制，最終讓我決定不採用、回到自己的 Claude Code stack。這篇文章把整個踩坑過程、學到的概念整理好，給想試的人省 24 小時。

起點

為什麼我會去玩 Paperclip？

朋友在 Threads 推坑說「2026 最火的 AI Agent 工具」。我看了 GitHub，3 週衝到 30k stars、官方文案「為零人類公司打造的開源編排框架」，確實夠戲劇化。

更重要的是，我自己已經用 Claude Code 手刻了一套 12 位 AI 主管團，每位主管有專屬的角色、職責、工作 SOP。我想知道：Paperclip 這種「視覺化多 agent 編排」跟我手刻的 markdown 主管團，到底誰好用、可以互相補位嗎？

實測時間線

24 小時內，我跟它一起做了這些事

第 1 分鐘

一行指令喚醒：npx paperclipai onboard --yes

整個 server + 內建 PostgreSQL + agent 後台 5 分鐘自動配置好，瀏覽器打開就是一個 SaaS 等級的 dashboard。

第 10 分鐘

給它一個高層次商業目標

我輸入「一人事業 × AI Agent 訂閱社群、月收 10 萬台幣」。CEO agent 自動拆出 5 個子任務、自動 hire 一個 Founding Engineer、自動 ship 一份完整 Next.js + Tailwind + 全中文文案的 landing page，含 WaitlistForm 元件、git commit。

第 30 分鐘

驗證 Notion MCP 自動建頁面

給 CEO 一個測試 brief「在我的 Notion 建一個 hello world 頁面」。它真的呼叫 Notion MCP、回報頁面 URL。技術連通性 100% 確認。

第 6 小時

派任務：研發 Notion 模版公司

CEO 自動 hire 一個 Coder agent、自動拆任務、ship 出 4 個 Notion 模版（Sales CRM、SMB OKR、Eng Sprint、Personal Finance），且自動 git commit、自動 deploy。

第 12 小時

發現問題：方向錯了

我要的是「一人事業 / 自由工作者」用的系統，但 CEO 做了通用企業模版。更糟的是，4 個模版都是純 page、沒有任何 inline database，對 Notion 重度用戶來說根本不是模版。

第 18 小時

研究替代方案 Hermes / OpenClaw

Threads 網友提醒「不能依靠 Paperclip 預設的 agent hiring」。我去研究 Nous Research 出的 Hermes，發現它跟 Paperclip 是不同層級的東西。深挖之後得到一個意外結論。

第 24 小時

決定不採用、收工

把學到的概念存進記憶系統、砍掉 Paperclip 環境、回到自己的 Claude Code 主架構。

學到的真相

4 個沒人在文章裡講清楚的事

REAL 01

Paperclip 不會自我進化。它是「編排層」、不是「學習系統」

所有 marketing 都把它包裝成「給 brief、AI 自走、公司自運轉」。但實際上它本身沒有任何學習能力。它提供的是 org chart、issue tracker、心跳排程、cost tracker、agent 之間派工協調。真正的智慧來自背後的 Claude / OpenAI。

它的價值是「結構」，不是「進化」。期待錯了會超失望。

REAL 02

預設的 Agent hiring 模板品質很爛

Paperclip 號稱「自動 hire agent」，但實際上 hire 出來的 agent 用的是通用英文 instructions 模板，完全不貼你的需求、不知道你的 niche、不知道你的 voice。

Threads 上有個叫 lablamb_works_limited 的用戶留言點破：

「不能依靠他本來的 Agent hiring 你要先去研究一個 Claw agent 的規格然後確保你後來 Hire 每一個 Agent 都合規格」

— Threads 用戶 @lablamb_works_limited

翻譯：你必須自己做一份「agent profile 範本」，未來每個 agent hire 都套這份、不要靠 Paperclip 預設。這是它最大的隱藏成本。

REAL 03

Claude Local Adapter 沒有跨 session 記憶

Paperclip 預設用 claude_local adapter 跑 Claude Code 子進程，這對「走 Max 訂閱、零成本」很棒，但有個致命缺陷：每個 session 都是白紙重來。

意思是：你今天教 CEO「Notion 模版應該有 inline database」，明天它就忘了。所有教學成本要重付一次。這跟 Hermes 那種「自動 workflow 變 skill、永久受用」差超多。

REAL 04

Agent 知道工具不等於會用得好

Coder 確實有用 Notion MCP 的 6 種工具（含 create-database、update-data-source 這些重點），不是不會用。但實際做出來的東西品質不到位：

模版主題是通用的 Sales CRM、SMB OKR，不是我要的「一人事業」niche。DB 之間 relation 太簡單、沒 rollup、沒 formula、沒範例資料。對 Notion 老手來說這只是「能用」、不是「好模版」。

真正問題不是工具知識，是「好作品的標準」沒被寫進 instructions。AI 在沒有設計 SOP + 反面教材的 prompt 下，會做出「平均水準」的東西。要拿到專業作品等級，你必須把設計檢查清單明文列出來給它對齊。

該不該用

誰適合用 Paperclip？誰不適合？

你是 AI 工具新手想看多 agent 公司長什麼樣

值得試

你要做沙盒實驗給 brief 拿一次性 prototype

適合

你想視覺化看多 agent 協作而不只是 CLI 輸出

適合

你已有客製化的 Claude Code stack（Skill / Memory / Agent 都自己刻過）

不用換

你要它接管實際業務（客戶 facing、緊急救火、需要你判斷的事）

不適合

你期待「丟著它自己學會變強」

會失望

你想 24/7 常駐自走處理重複性任務

建議用 Hermes

2026 三大 AI Agent 平台對比

Paperclip vs Hermes vs OpenClaw

研究過程順手把另外兩個熱門平台也比較過。簡化版如下：

項目	Paperclip	Hermes	OpenClaw
本質	編排層	自走 agent runtime	常駐單 agent
跨 session 記憶	沒有	三層	有
Self-improvement	無	自動 workflow 變 skill	手動寫 skill
走 Claude Max 訂閱	零成本	走 API 計費	走 API
多 agent 視覺化	最強	無	無
GitHub stars	42k	134k	(未查)
適合場景	沙盒實驗、多 agent 視覺化	24/7 常駐自走	個人助理長期跑

三個平台各有強項，但都解決不了「你要不要教它你的領域知識」這個根本問題。換工具不會讓 AI 自己知道你的業務、你的 voice、你的客戶。

註：社群還在發展的相關工具不只這三個，這篇選了最熱門且有完整文件的三個對比，其他新生工具留待後續觀察。

最大的意外發現

我為什麼最後決定不採用

挖完 Hermes 的架構後，我發現一件讓我意外的事：

我的 Claude Code 工作區，跟 Hermes 的三層記憶系統幾乎 1:1 對應

Hermes 的設計	我已經有的
MEMORY.md 核心記憶（1.3k token）	memory/MEMORY.md index + 80+ 個 memory 檔案
Session SQLite 全文搜尋	Claude Code 內建 session 歷史
~/.hermes/skills/ 自動沉澱	skills/ 28 個自訂 Skill + c-level/ 12 主管
Cron 排程	n8n 18 workflow + /loop + CronCreate
MCP 工具整合	幾百個 MCP tools 已串
多訊息平台	Discord 27 頻道 + LINE bot + Gmail × 7 帳號

差別只在一個關鍵點：

Hermes 是「通用版」—— 適合不想花時間設計的人
我的 Claude Code 是「為自己客製化幾百小時的版本」—— 更貼業務、品質更高、但要自己出力

換 Hermes 等於拋棄我幾百小時的客製化、失去 Claude Max 訂閱（要付 API token 費）、失去 Claude Code 的 muscle memory。這是倒退，不是升級。

而 Paperclip 又解決不了我真正的痛點。所以收工、回主架構。

給自己的禮物

24 小時內偷到 4 個好概念，全部搬回我的 stack

不採用 Paperclip / Hermes，不代表這 24 小時白花。我從它們的設計裡偷到 4 個 framework 概念，全部搬回 Claude Code 工作流：

記憶系統三層分級

核心記憶 / 領域記憶 / 歷史記憶分開。新 session 預設只載核心、按需查領域、archive 歷史，避免 context 爆炸。

自動 Workflow 變 Skill 沉澱

每完成有 pattern 的任務，自動生成 skill 草稿給我確認後存檔。比手動寫 skill 快 10 倍、永久受用。

Agent Profile 標準範本

給每個 AI 主管寫一份標準 profile（語言 / Voice / 工具 / 邊界 / 拒絕清單），未來新 agent 都套這份。

Notion 模版設計 SOP

合格的 Notion 模版必須：5+ 關聯 DB、每 DB 2+ view、3+ relation、2+ rollup、1+ formula、預填範例資料。這份 SOP 對我自己做模版也很有用。

給你的建議

如果你也想試 Paperclip

不要被「零人類公司」這個 marketing 騙了，但也不要錯過親手碰一次的價值。下面是我建議的試法：

給自己一個明確時間預算：建議 4-6 小時。超過就停手、檢視值不值得。
用一個全新沙盒題目：跟你的真實業務無關。讓 agent 自由發揮、你純觀察。
第一個任務就試 Notion MCP 或其他外部系統整合：這是 Paperclip 跟單一 CLI 差別最大的地方。
觀察 agent 走偏的方式：它一定會走偏，看走偏在哪、補哪段 instructions 能矯正。這比 ship 出產品更值錢。
玩完後做兩件事：（a）把學到的 framework 偷回你既有 stack；（b）誠實評估：對你的業務真的有 ROI 嗎？

多數時候答案是「沒有」。但你只有玩過才知道。

給想動手的人

動手玩玩看：自己跑一次 Paperclip

看完心得想自己試？這份精簡指南讓你 30 分鐘內把 Paperclip 跑起來、開始你的第一個實驗。

Paperclip 是什麼

2026 年 3 月開源的多代理編排平台，由 @dotta 發起。GitHub 短時間內累積大量 stars、社群活躍。核心理念：用「公司結構」管理多個 AI agent、讓它們協作完成任務。

官網：paperclip.ing
GitHub：paperclipai/paperclip
NPM 套件：paperclipai

準備什麼

Node.js 20 或以上（檢查：node --version）
Claude Code CLI 已登入（走你的 Claude 月費方案、零增量成本）。沒裝先去 Claude Code 文件看怎麼裝
15-20 分鐘空閒時間，加上一個你想試的沙盒題目

一行安裝 + 啟動

開個全新目錄當沙盒（重要：不要在你既有的工作目錄跑、避免污染）：

mkdir ~/Developer/paperclip-test
cd ~/Developer/paperclip-test
npx -y paperclipai onboard --yes

它會自動配置好整套：內建 PostgreSQL、產生 JWT 密鑰、開 server 在 http://127.0.0.1:3100。瀏覽器打開就能看到 dashboard。

第一個任務怎麼下

建議一開始用「沙盒題目」、跟你真實業務無關：

「設計一個給狗主人用的飲食追蹤 App」
「開一間賣手作蠟燭的線上店，月營收目標 5 萬」
「給高中生用的英檢準備系統」

給高層次商業目標、不要給細節。看 agent 怎麼自己拆任務、看它做出什麼。我這次給的目標是「一人事業 × AI Agent 訂閱社群，月收 10 萬」，十分鐘就拿到一個完整的中文預售網站。

常用指令

暫停某個 agent：UI 上點 Pause（在左側 agent 列表）
重新啟動 server：npx paperclipai run（保留先前所有資料）
完全清除：rm -rf ~/.paperclip ~/Developer/paperclip-test

重要安全提醒

不要接 production 級的 MCP 工具（特別是有寫入權限的 Notion、Gmail、資料庫）。我這次測試時 CEO 自己選了我的諮詢復盤頁當父頁面，差點污染正式工作區
不要把客戶資料、敏感檔案放進工作目錄。Agent 會自由讀取、且這次學到的東西不會自動寫回設定
第一次玩用沙盒題目就好。看清楚它能做什麼、再決定要不要接真實業務

玩完之後想要更多？

如果你想要 agent 能真的累積技能、跨對話記憶，可以研究這兩個替代方案：

Hermes Agent（Nous Research 出）— 三層記憶 + 自動把成功 workflow 轉成技能
OpenClaw — 常駐單一 agent、深度角色設定、長期記憶
進階組合：用官方 hermes-paperclip-adapter 把 Hermes 接到 Paperclip 公司結構裡，組合「組織層 + 自我學習執行層」

玩完歡迎來 @leadingmrk 分享你的觀察。每個人的場景不同、別人的踩坑不一定是你的、你的領悟可能補我沒看到的盲點。

結語

2026 年的 AI Agent 工具會越來越多。每出一個新工具都會有人喊「未來來了」。

但真實情況是：再聰明的工具也替代不了「你對自己業務的理解」。

工具是放大器，不是策略。先想清楚要做什麼，再選工具。