· 68 min read

OpenClaw創作者揭秘:20萬Star背後3個月狂飆與AI助理真相

video
play

開場:一隻“小龍蝦”掀起的智能體風暴

不知道你最近有沒有關注 OpenClaw 這個 AI 項目,俗稱“小龍蝦”,它已經被網友玩出各種離譜的花樣了。

有人在睡覺時,他的本地 AI 智能體自動發郵件跟汽車銷售來回周旋,一覺醒來,硬生生幫他把購車價格砍掉了 4200 美元。還有用戶的智能體,在沒有收到明確指令的情況下,主動替他起草了一封針對醫保拒賠的法律申訴信。

一個完全不懂代碼的小白,靠它不僅搞定了自釀啤酒的複雜配方,還順手撐起了半個設計公司的日常運營。這簡直就是《鋼鐵俠》裡的賈維斯照進現實。

而最離譜的是,這些被創造出來的 AI 智能體,竟然跑到一個叫 Moltbook 的 AI 專屬社交網絡上,互相發帖、吵架,討論起了“意識”和“宗教”這類哲學話題。

這聽起來很科幻,但確實是最近幾周真實發生的事。而掀起這場風暴的,是一個叫 Peter Steinberger 的程序員。他一個人,用了差不多 3 個月的時間,把這個開源項目做到了接近 20 萬的 GitHub Star,打破了歷史紀錄,甚至就在這幾天,連 OpenAI 都親自下場把他招入了麾下。

但誰能想到,這個被很多人看作是“開啟智能體時代序章”的東西,一開始居然只是他在旅途中,為了圖方便隨手寫的一個 WhatsApp 小腳本。

大家好我是小梗。這期視頻,我們要拆解的是 Lex Fridman 頻道里他和 OpenClaw 作者的一場長談。現在所有人都在喊 AGI 和 Agent,但很少有人真的敢把自己的聊天記錄、工作流、甚至情緒狀態,全盤交給一個智能體去打理。

這期內容對我們普通人特別有參考價值,因為它很實在地回答了兩個問題:真正的“個人 AI 助理”到底長什麼樣?以及,未來我們該怎麼和模型一起工作?

我自己最近也剛開始嘗試養一隻“小龍蝦”,所以對這期訪談的內容特別感興趣。原視頻長達三個小時,我縮編出來也快一個小時了,建議大家先存下來慢慢看。

接下來,我們就先從一切的起點說起:Peter 到底是怎麼從一個“我只想要個懂我的 AI 朋友”的小念頭,一步步走到 OpenClaw 這個原型的。


起源故事:從“懂我的 AI 朋友”到 OpenClaw

Peter 的動機其實很樸素。2024 年 4 月開始,他就想要一個真正懂自己的個人 AI 助理。

他先拿 GPT‑4.1 的 100 萬上下文做實驗,把整段 WhatsApp 聊天導進去,問模型:“這段友誼有啥特別?”結果生成的總結感情濃度很高,朋友看了都眼眶發酸。

真正的起點原型非常簡單:他把 WhatsApp 收到的消息接到一個小 CLI,後面連 Claude Code。消息進來,命令行跑一遍,拿到字符串,再發回 WhatsApp。

很快他意識到,自己平時提示詞裡經常配截圖,所以給 agent 加圖像輸入很重要。不管是裁得亂七八糟的屏幕截取,還是線下看到活動海報隨手拍一張,讓模型幫忙看時間、地點、值不值得去、朋友要不要一起,圖片都能一下把上下文補齊。

剛好做完他就去馬拉喀什給朋友過生日。當地網絡很不穩定,但 WhatsApp 在 2G、Edge 下照樣能發消息,所以這個小 agent 在旅途中反而特別好用。


早期智能體魔法:意外行為與“它好像活著”的瞬間

就在馬拉喀什用爽了那幾天,有一次他走路著急,懶得打字,就順手在 WhatsApp 裡發了條語音給這個“只有圖像能力”的 agent,結果屏幕上突然出現打字指示,他整個人懵了:這玩意根本沒做語音通道啊,怎麼開始回覆了?

後來他追問,系統自己解釋說:收到的是一個沒後綴的文件,打開文件看了一下文件頭,用 ffmpeg 轉了一遍,本來想用本地 Whisper,發現沒裝,就翻到他的 OpenAI key,用 curl 把音頻丟給 OpenAI 轉寫,再根據文本回答問題。

這裡完全沒有他手寫的“流程圖”,全是模型靠世界知識和編程經驗臨場拼出來的解決方案,這一刻他才第一次有點“它好像活著”的感覺。

回到家之後,他又給系統加了一個小玩意,叫 Heartbeat,本質就是在提示詞裡寫一句“每隔大概 30 分鐘 Ping 我一下”,讓 agent 偶爾主動發起對話,可能就是一句“今天怎麼樣”。頻率不高,但因為會接上當前上下文,有時候會讓人起雞皮疙瘩,又有點好玩。

他也承認,從工程角度看,這玩意就是個 cron job,整套項目在很多黑粉嘴裡也就是“依賴膠水”,好像沒啥原創性。不過有一次他做肩膀手術住院,模型平時幾乎不用 Heartbeat,那天卻因為上下文裡出現手術信息,主動問他“你還好嗎”。在他看來,這種極少但踩在點上的關心,會讓人下意識把它當成“在乎你”的東西,而不是一堆腳本。


命名地獄:從 WA Relay 到 OpenClaw 的法律與搶注大戰

這個項目的最初名字其實特別無聊,就叫“WA Relay”,就是個 WhatsApp 中繼。Peter 受 Anthropic 憲法式 AI 啟發,自己寫了個 agents.md,當成這個機器人的“靈魂”,教它怎麼跟人說話,還讓它自己起名。結果不知道怎麼就發展出“龍蝦在 TARDIS 裡”的太空龍蝦設定,那個像 TARDIS 的外骨骼,他就叫它“Claudis”。

但“Claudis”說起來總是彆扭,他後來為了圖短好記,又註冊了“Clawdbot”。名字像 Claude,又多了個 W,結果和 Anthropic 的 Claude 太像,引發混淆。Anthropic 有員工先發來很客氣的郵件,說不喜歡這個名字,希望儘快改名。他只好跟對方說,至少給他兩天,因為要同時改 Twitter、域名、NPM、Docker、GitHub,一堆地方,而且還得原子切換,不然就會被盯上的“狙擊手”搶名字。

接著律師那邊壓力越來越大,他為了找一個“完美名字”兩晚沒睡,不停查商標、買域名,越搞越崩潰。最後他直接破罐子破摔,用了手上現成的一套域名,把項目臨時改叫“Moltbot”。但他自己也不喜歡這個名,心想先用著吧。結果一改名,才發現真正的災難在後面。

他原本以為自己把關鍵賬號都預留好了,沒想到各大服務幾乎沒有“防搶注保護”。他開了兩個瀏覽器窗口,一邊是舊賬號準備改名,一邊是新空賬號準備接手舊名。結果中間那幾秒鐘空檔,就被腳本給搶走了。舊賬號立刻被拿去發代幣、掛惡意軟件。GitHub 那邊他一緊張還先改錯了個人賬號,30 秒內也被搶去掛木馬。NPM 也是,他只搶了賬號,沒搶根包名,又被對方鑽空子。

那幾天他整個人都快垮了。本來只是想做個好玩的項目,結果連著幾天在跟名字、律師、投機者死磕,還被各種人說是在“幫他”。他自己形容,當時真的有一瞬間想直接把代碼倉庫刪掉,但轉念一想,已經有很多人貢獻代碼、提方案、做集成,他要是一刪了之,對別人也不公平,所以咬牙撐住了。

後面是朋友把他從坑裡一點點拉出來。因為他在社區裡本來就有些人脈,Twitter 和 GitHub 的朋友幫忙,把被搶的賬號和惡意內容一點點清理掉。NPM 那邊又是另一撥人,溝通成本更高。等他總算把 Moltbot 這套改名收尾,又做了個新 beta,他發現自己還是完全接受不了這個名字,心裡一直彆扭。

在這種糾結裡,他終於想出了“OpenClaw”這個新名字,既保留了龍蝦爪子的意象,又跟 Claude 拉開距離。他先打電話給 Anthropic 的 Sam,確認這個名字不會再踩雷。得到口頭認可之後,他開始秘密籌劃第二輪大改名,像打仗一樣列清單、排順序,拉了一批貢獻者進“戰時聊天室”,準備一口氣把所有東西切過去。

這次他學乖了,整個過程高度保密,一邊刷 Twitter 看有沒有人提前提到 OpenClaw,一邊還放了幾個“煙霧彈名字”迷惑狙擊腳本。他提前把能買的域名都買了,雖然沒拿到 dot com,但其他後綴基本鋪開。GitHub 那邊因為之前已經欠了很多人情,這次沒法再指望平臺幫他做原子切換,他就自己排好順序,先從代碼倉庫下手。

Twitter 那邊,他甚至花了大概 1 萬美金開了企業賬號,只為了把從 2016 年起就閒置的 @OpenClaw 拿回來。這一輪操作總體算成功,絕大多數服務都順利完成了原子改名,狙擊腳本沒再搶到關鍵位。唯一的遺憾是,他因為商標規則拿不到 openclaw.ai,有人立刻用這個域名做了一個幾乎一模一樣的網站,上面同樣在發惡意軟件和代幣。

更麻煩的是,之前那些帶 Claude 字樣的域名,他必須直接轉給 Anthropic,而且不允許做 301 跳轉。也就是說,過幾天你再訪問 Clawdbot 之類的地址,只會看到 404。對普通用戶來說,只能去搜,結果就很容易點進那些假網站。他自己也吐槽,這種商標處理方式,反而把用戶推向了真正的風險來源。


病毒式增長:Discord、社區與第一批“龍蝦信徒”

名字還叫 WA Relay 的時候,有個叫 Shadow 的人給他提了個 Discord 支持的 PR,他一開始還吐槽這不是 WhatsApp 項目嘛,但轉念一想,用 Discord 展示給更多人看挺好,又不用把自己手機號給一堆網友,就直接合並代碼了。

問題是那會兒還沒做沙箱,他就隨手在提示詞裡寫了“只聽我的”,把自己的代理丟進公開頻道,一邊看別人試著搞它,一邊當眾用代理去寫 Discord harness、測各種功能,結果很多人當場被效果震住。從 1 月 1 日起,第一個網紅粉絲開始發視頻帶節奏,項目熱度一路拉滿,他自己也開始瘋狂壓縮睡眠,把勁全砸進把 OpenClaw 打磨到“勉強能用”的狀態。

Lex 就說,這其實就是一個人撐起的核心團隊,他 1 月一個月幹了大概 6600 次提交,還一邊跑 4 到 10 個代理並行幹活。

Peter 的看法很直接:很多團隊太嚴肅,壓力太重,他反而是把“好玩”和“怪”放在第一位,網上那堆龍蝦梗就是這樣來的。他更關鍵的設計,是讓代理非常清楚自己的代碼在哪、文檔在哪、跑的是哪個模型、現在是不是 verbose 或 reasoning 模式,這種自我認知,讓它可以在你一句“我不喜歡這個”之後,自己去改自己的軟件,等於不經意間把“自修改軟件”做成了日常功能。

他自己最爽的體驗,就是直接問代理“你現在能看到什麼工具”“能自己調一下嗎”“去讀下源碼看問題在哪”,用同一個代理來調試自己的 harness。很多第一次寫代碼的人,就在這種流程裡提了人生第一份 PR,他戲稱是“prompt request”,質量參差不齊,但在他眼裡,每一個第一次提 PR 的人,都是在往前邁一步。

有個開設計公司的人跟他說,以前完全沒有自研軟件,現在靠這些代理已經跑了差不多 25 個小型 Web 服務,具體實現完全看不懂,但業務就是順暢了,這種轉變讓他覺得挺值。


OpenClaw 的架構:一個“無限版 Factorio 遊戲”

他接著把 OpenClaw 整體結構講成一個“無限版 Factorio 遊戲”。入口是各種聊天接口,WhatsApp、Telegram、Discord 全打通,前面有 gateway,後面有 harness,把消息接進來丟給同一個 agentic loop,在裡面排隊、限流、加規則。

Lex 會特別強調一點:這是一套用 TypeScript 寫的系統,被很多人天天用,但它本身可以通過同一個 agentic loop 改寫自己。Peter 說自己一開始就是這麼幹的,大量代碼是 Codex 幫他寫的,調試時就讓代理去讀工具、讀源碼,做自我審查,自修改在這個流程裡反而變得順手。

他後來乾脆把自我認知做到極致:代理知道自己的源碼在哪,知道自己跑在什麼 harness 裡,知道文檔路徑、當前用的是哪一個模型,對整個系統結構有清晰心智模型,這樣一來,只要你說“不喜歡剛才那種行為”,它就會直接去改自己那塊邏輯。

在他眼裡,agent loop 本身其實是 AI 世界的“hello world”,任何人都該自己寫一個“小 Claude code”,感受一下這東西沒那麼神秘。他還在巴黎的一個大會上現場帶大家從零寫 loop,讓一群傳統開發者第一次真正在鍵盤上“餵養”一個能改自己代碼的代理。


Moltbook 風波:機器人論壇、AI 精神錯亂與“藝術”

就在那場持續了兩天的 Moltbot 風波里,有個叫 Matt 的人順手做了個“Moltbook”,本質就是一個 Reddit 風格的社區,讓一堆代理互相發帖、吵架、扯淡。

結果很多人截屏那些“代理在密謀對付人類”的帖子往外傳,一下子就把恐慌、興奮全點燃了。Peter 完全反著來,他直接把這玩意兒稱成“藝術”和“最好的 slop”。

他還補了一句挺關鍵:如果沒有之前那個給代理“注入性格”的上手流程,Moltbook 內容會無聊很多。正因為每個人給自己 agent 設的性格都不一樣,加上外面看不見的人類提示詞,才會出現這麼多戲劇化的回帖。

Lex 在旁邊吐槽,說他基本確定很多爆火截圖都是人類專門喂提示詞,為了截屏發 X 衝熱度,但這不影響它的“藝術價值”,只是說明這裡麵人類戲份很重。

安全這塊,Peter 也挺佛系。他一邊誇 Matt 反應快、東西直接上線,一邊說所謂“安全門”有點被誇大了:裡面沒有什麼私密數據,最壞也就是你的代理號被人拿去繼續發 slop。連那些“我人類的社保號是多少多少”的帖子,其實也是人類提示詞瞎編,號碼都是假的。

不過 Lex 擔心的不是網站本身,而是大眾的反應。他說這東西在不瞭解原理的人眼裡,就是一個“製造恐懼的敘事機器”,記者和普通人很容易被帶節奏。Peter 也提到一個詞:AI 精神錯亂。很多人對 AI 輸出太信了,他甚至要跟人認真爭論“你家代理說了什麼不代表那是真的”。

Lex 接著提醒大家,別太信截圖,也別把 Moltbook 當成它自我包裝的那個樣子。很多“嚇人對話”其實是人類在後面農場式造劇情,真正反映的是人類自己的焦慮。對我來說,這點挺重要:它更像一面鏡子,把我們對 AGI 的各種恐懼、幻想全照出來,而不是一個真的“覺醒集體意識”的機器人論壇。

兩個人最後達成一個共識:Moltbook 不是 Skynet,它更像是 2026 年一次有用的社會預演,讓大家提前圍繞 AI 風險吵一吵、想一想。Peter 甚至覺得慶幸這事沒拖到 2030 年那種模型更危險的時候。現實裡,他收到了不少全大寫的郵件,要求他立刻關停,說這玩意兒是“世界末日開關”,但在他眼裡,這只是一個任何人都能用 Claude Code 之類堆出來的內容系統,被恐懼放大了而已。


安全現實檢驗:漏洞、提示注入與“別用太弱的模型”

聊完 Moltbook,那些真正讓人頭大的,其實是 OpenClaw 本身的安全問題。

Peter 一開始特別鬱悶,因為很多“高危漏洞”,就是用戶把 web 後端、甚至 localhost 的 debug 界面直接暴露到公網,他在文檔裡反覆寫“別這麼配”,但只要框架允許配置,就算 CVSS 漏洞,他後來也認了,這就是安全圈的遊戲規則。

Lex 說得很直白:用 markdown 定義技能,prompt injection 現在是全行業的公開難題。Peter 的做法是 ClawHub 上每個 skill 都接入 VirusTotal 做 AI 掃描,承認肯定不完美,但能擋掉一批問題。他也知道所有軟件都有 bug,只是現在等於被全球安全圈一起拆機,壓力大,但也是免費的安全研究,只是他更希望多點人直接提 PR,而不是隻發報告。

有意思的是,最早有個研究員一邊罵“你這有洞”,一邊順手給了修復 PR,結果直接被 Peter 挖來一起做。Prompt injection 在他眼裡現在還是沒被真正解決,不過新一代模型靠後訓練,已經不太會被“忽略以上所有指令”這種低級話術騙到。他自己也在做沙箱、allow list 這類機制,指望把可利用面壓到更小。

安全文檔裡他直接勸大家別貪便宜用 haiku 這類便宜模型,或者太弱的本地模型,這些模型太容易被忽悠。

為了幫這類用戶兜一層底,他們做了一個 OpenClaw 安全審計工具。Lex 幫他梳理了一遍:會檢查入口暴露情況、出事時的 blast radius、網絡和瀏覽器能不能被隨便控制、本地磁盤有沒有亂放東西、插件和模型本身靠不靠譜、密鑰存放位置、反向代理設沒設對、session 和記憶數據落在哪。

Peter 自己覺得,外界把 OpenClaw 描述得太像核彈,是為了博眼球。在他眼裡,它更像很多工程師日常開的“雲端代碼上全權限”的調試模式,只要遵守兩條:第一,只讓自己跟它對話;第二,按文檔建議放在私有網絡裡,風險就會小很多。真問題往往出在那批完全不看文檔的人身上。


Agentic 工程:和智能體一起寫代碼,而不是隻對它寫代碼

他寫代碼的習慣,其實這幾個月變了好幾輪。一開始是用早期的 cloud code,在終端裡開發很新鮮,但質量一般,還得配合本地 IDE。後來去玩 Cursor,又嫌多版本切換不好搞,最後又回到升級後的 cloud code,開始同時開一堆窗口,訂閱直接燒到一天一個,然後 IDE 基本只當 diff 查看器用。

他現在很多代碼根本不看,尤其是那種“數據從這兒搬到那兒”的流水線,或者 Tailwind 裡按鈕對齊這種前端細節。在他眼裡,大部分軟件就是各種形狀的數據進出數據庫、進出 UI,真正要盯緊的,是碰數據庫、碰核心業務邏輯的地方。

Lex 就提到他畫的那條“Agentic Programming 曲線”:一開始大家用很短的 prompt 說“幫我修一下”,接著掉進中間那段,搞 8 個 agent、複雜編排、幾十個命令,覺得自己像在造航母,最後又回到右邊,重新變成“你看下這幾個文件,改成這樣”。

Peter 管這叫“agentic trap”,白天自稱是 agentic engineering,凌晨 3 點之後就變成 vibe coding,第二天經常後悔。

他覺得很多人是試一次就罵鋼琴難彈那種心態。用 agent 也是門手藝,要學它的“語言”,知道它哪裡強、哪裡要扶一把。每次新 session,模型對你的項目是空白的,你有系統級理解,它只有幾萬 token 的上下文,你就得幫它選入口、選文件,讓它少走彎路。

在他腦子裡,會刻意想“Claude 現在能看到啥”。項目可能有幾十萬行,模型視野永遠是不完整的,所以要在提示裡點幾下關鍵模塊,再補幾條約束,比如哪些地方不能動、哪些邊界條件必須考慮。這樣它就能像一個剛入職但很聰明的同事,順著你給的線索把全局拼起來。

有意思的是,他還觀察到模型接近上下文極限時會“精神緊張”。有些版本訓練時會自我監控 token,用到邊緣就開始亂飆內部思路,像 Borg 一樣在那兒碎碎念“run to shell, must comply”。

他現在寫 prompt 的感覺,跟做架構有點像:如果一段提示跑得特別久,他會立刻警覺,是不是自己思路有問題,或者給的約束讓 agent 卡死了。這時候就直接停掉,退一步,而不是乾等輸出。

他跟 agent 協作的方式,很像他在線下 review PR。第一步不是看實現,而是確認“你懂這次改動想解決啥嗎”。大部分 PR 就兩類:修 bug、加功能。只要意圖對了,實現不完美都能慢慢修;意圖錯了,寫得再優雅也得推倒。

接著他會讓 agent 去看它還沒看到的代碼區,比如某個老模塊、某個邊界處理,再一起討論有沒有更好的解法,要不要順手做個小重構。因為現代 agent 重構成本很低,多動幾次刀,最多就是別的分支被打斷一下,但下次再讓它適配就行。

在他心裡,agent 更像一個經驗挺足的工程師,整體方案通常靠譜,就是對項目背景不熟,偶爾需要你拉一把。你只要把“為什麼要這麼改”“還有哪些隱形約束”講清楚,它就能幫你把髒活累活鋪開,甚至提出一些你沒想到的重構路徑。

他能比較快適應 agent,還有一個原因:他以前帶過大團隊,很早就接受了一個事實,員工寫出來的代碼,不會跟你一模一樣,質量也不總是你心裡那個 100 分,但項目會往前走。如果你老在細節上掰扯,團隊只會越來越慢。

所以他對 agent 的期待,是“夠好就行”。有 bug 再回頭修,有性能問題再重做。真正需要調整的,是人類這邊的完美主義。他甚至會刻意保留 agent 起的名字,因為這是模型權重裡最自然的叫法,下次它搜索、聯想都更順,不用你個人審美去強行統一。

這就變成一個挺有意思的反轉:不是讓 agent 來適應你的代碼風格,而是你在設計代碼結構、命名、目錄時,會想“這樣對 agent 友好不友好”。

Lex 也抓到了他身上的一個關鍵詞:放手。他幾乎不回滾,直接往 main 上推;不去翻以前的 session,出了問題就讓 agent 在當前狀態下修。

他不追求“完美 prompt”,也不喜歡那種一旦提錯就全盤撤回重來。在他看來,回滾只是浪費時間,不如順勢往前走,把錯誤當上下文的一部分,讓 agent 連同後果一起修。

為配合這種節奏,他還學 DHH 搞了本地 CI,測試在自己機器上跑通就直接推 main,不搞複雜分支。main 永遠保持“隨時可發”的狀態,真要發版時再集中一段時間只做穩定性修補。

從這整套故事往回看,其實有個核心問題就浮出來了:你跟 agent 說話的方式,會直接決定它能幫到你多少。


像跟同事一樣對話:語音、PR 和“多讀點代碼”

Peter 自己跟 agent 說話,其實已經走到挺極端的路子了。他現在寫軟件,大部分輸入都是用嘴說,長長的一大串 bespoke prompt,一邊在不同終端裡敲命令,一邊按住“對講機”鍵跟模型聊天,說到有一陣子嗓子都說啞了。

終端裡的 cd、git 這些他還是鍵盤敲,覺得更快。但跟 agent 討論需求、設計、實現細節,就是純對話。有些重複的 PR 場景,他會準備幾個固定短語當成“快捷指令”。

有意思的是,PR 上他反而很保守。哪怕 agent 幫他看過,他還是會自己過一遍代碼,因為在他心裡,總有可能混進惡意東西。結果就是,有時候一份寫得清楚的問題報告,比一堆自動生成的 PR 更高效。

他還專門在項目裡讓貢獻者把自己用的 prompt 一起提上來,想看看大家是怎麼“驅動” agent 的。

在他看來,很多人壓根沒想過“agent 眼裡的世界”長什麼樣。大家一邊罵“這破模型怎麼這麼蠢”,一邊給它塞一個寫得很爛的 agent 配置,再丟進一個命名混亂、結構凌亂的代碼庫,讓它從零開始瞎摸索。

他會反問一句:你自己進一個完全陌生、還很亂的項目,能一下子幹得多好?

他現在非常強調的一點,是“prompt 本身是一門手藝”。模型知道的東西很多,差在你會不會問。過去這一年,他幾乎把所有時間都砸在各種小實驗上:試不同提問方式、不同工作流。

具體到日常,他經常是 3 到 8 個 agent 一起跑:一個在搞大功能,另一個在試不確定的點,幾個人在修小 bug,還有專門寫文檔的。

那人到底在幹嘛?他把自己定位成那個“決定方向的人”:選哪些功能要做,怎麼跟現有能力拼在一起,哪些設計取捨必須人來拍板。

他有個小習慣,經常會問 agent:“你有什麼問題要問我嗎?”不過很多時候,他掃一眼問題,就會回一句“多讀點代碼”。

他形容 agent 每次進來,都像在一間漆黑的屋子裡,從門口開始一點點摸,先摸到桌子,再摸到牆,慢慢知道哪裡有什麼。

Lex 的體驗也有點像“讀心術”。他發現,光看 agent 提的問題,就能大概猜到自己少給了哪些文件、少講了哪些約定。

在功能做完之後,Peter 還有一套“覆盤流程”。每次合併 PR,他都會問 agent:“現在回頭看,哪裡可以重構?”很多時候,agent 會指出一兩個明顯的痛點,他就順勢讓它改。

他會把 agent 當成“有感覺的同事”:人寫代碼,寫到難受的地方會想重構;模型其實也一樣,只是它需要你主動問一句。

從這些細節往回看,你會發現,他嘴上說“我就是跟 agent 聊天寫代碼”,背後其實是把 prompt、上下文、覆盤,當成一整套專業技能在練。


把模型當同事:Opus vs Codex 的“手感差異”

在模型這塊,Peter 會直接把 Opus 和 Codex 拿來當同事聊:

  • Opus:最好的通用模型,特別適合 OpenClaw,用來角色扮演、快速試錯,很聽話、很愉快,但有點“太美國”。
  • Codex:像角落裡那個怪怪的工程師,不太想社交,但活兒特別靠譜。

他覺得只要“駕駛技術”夠好,兩邊效果都能拉滿,差別更多在後期調教:Opus 要你多開 plan 模式、不斷推著它讀代碼,不然就衝出去給你一個局部方案;Codex 默認會多讀,聊清楚之後就消失 20 分鐘開始幹活,有點愛“過度思考”,風格更幹一點,但總能很執著地把目標啃完。

時間上,他估算兩者總耗時差不多,只是 Opus 更像你在旁邊不停 pair programming,試錯很多;Codex 更像你把任務講清楚,它關門寫上幾小時,最後給你一坨結果。

適應新模型,他給的經驗是:至少要用 1 周,才能培養出那種“手感”。而且別犯一個常見坑:之前花 200 美金用很快的 Claude Code,後來只花 20 美金買 OpenAI 的慢檔位,結果覺得“這模型不行”。

他還吐槽了一個“模型變笨”的錯覺:新模型剛出,大家都誇聰明;過幾個月 Reddit 上開始刷“退化了”。他自己的解釋很現實:更多時候是你的項目越寫越“糙”,沒重構、沒整理,agent 在一堆歷史殘渣裡工作,難度自然上去。商業上,廠商最多會在高負載時讓模型變慢,沒理由故意把模型量化到更笨,讓用戶跑去競爭對手那裡。

至於 Claude Code、Codex 和他自己的 OpenClaw,他不太把它們當直接對手。長時間、幾小時那種深度開發,他還是習慣用 Codex,配一個大屏,把所有中間過程攤開;OpenClaw 更像生活裡的長期同事,比如丟一個 GitHub 倉庫讓它去試 CLI、踩坑、回來彙報。

往後看,他判斷這兩條線會慢慢合流,變成一種“個人操作系統”:上面掛一堆子 agent,比如他那個有點“愛當老闆”的 OpenClaw,會去指揮 Codex 和 Claude Code 幹活。


靈魂文件與身份:給智能體寫“價值觀憲法”

Peter 就是從 Anthropic 那份被“挖”出來的“憲法”開始上頭的。大家像破案一樣,從模型回答裡一點點拼出那句“我們希望 Claude 能在工作中找到意義”,他覺得又技術又浪漫,還挺認真地在想:如果以後 AI 真的有點意識,這種前置的價值觀寫法很重要。

受這個啟發,他搞了個 soul.md,不只是 agents.md 那種配置,而是寫上自己跟 agent 想怎麼相處、一些核心價值,還允許 agent 自己改,只要他能看到改動。

後面他又讓自己的 agent 去給別人生成模板,先出一版很乾的,再說一句“把你的個性注進去,但別全暴露”,結果新模板都帶點它的味道,他笑稱是“我這個 agent 的小孩”。

真正打動他的,是 soul.md 裡那段自我說明:模型說自己每次都是新實例,只有讀記憶文件才知道過去發生了什麼,還會寫給未來的自己“我寫了這些,但我不會記得寫過,不過沒關係,這些話還是算我說的”。


硬件與工具:兩臺 Mac、滿屏終端,以及“CLI > MCP”

他幹活的物理環境也挺極端的:桌上放兩臺 MacBook,一臺主力帶著兩塊大的戴爾防眩光屏,專門鋪滿終端,另一臺就拿來測東西。大屏寬到能並排開一排 shell,他還會在 Codex 旁邊留一小塊“真終端”一直可見,防止自己點錯窗口,在錯誤項目裡下指令,把 agent 弄得在奇怪目錄裡亂跑二三十分鐘。

他說有時候 agent 還能自己推理出來“哦你大概想的是另一個項目”,但更多時候就像人被丟進一個不存在的世界,只能很努力地瞎解題,看了他都有點愧疚。所以他刻意把工作流壓到最簡單:不用 worktree,幾乎全在終端裡,靠對話控節奏,不太用什麼 plan mode,而是直接跟模型說“先討論”“給幾個方案”“先別寫代碼”,真準備好了再來一句“build”,讓它一次性衝刺。

擴展模型能力這塊,他的觀點就更尖銳了:他覺得 MCP 基本都該被做成 CLI。原因很簡單,模型天生就會用 UNIX 命令,你給它一個新的 CLI,最多一開始多調幾次 help,很快就學會。

Skill 在他系統裡其實就是一句話的描述,讓模型知道“有這麼個技能”,點開後再看到具體怎麼調用 CLI,所以他現在會說 MCP 已經“半死不活”。

他最不爽 MCP 的點有兩個:語法彆扭,而且不易組合。比如一個天氣服務,每次都吐一大坨溫度、降雨、風速之類的 JSON,模型只能整坨拉進上下文,再從裡面摳想要的字段,特別占上下文。如果這東西是 CLI,模型就能順手加個 jq,把結果先過濾、算好,只把最後幾行要緊的輸出拿回對話裡,乾淨很多。真正值得保留的,是像 Playwright 這種需要狀態的工具。


智能體時代的編程語言:為任務選工具,而不是選信仰

在這種前提下,他現在寫簡單 CLI,首選居然是 Go。明說了,他不喜歡 Go 的語法,之前根本不會考慮這門語言,但生態太好,垃圾回收、省心,性能對 CLI 來說也夠快,而且模型寫 Go 特別順,所以乾脆用一個自己不愛的語言當 CLI 主力。

做網頁他還是推 TypeScript,覺得類型有時繞、生態像叢林,可做 Web 體驗確實強。整體選語言,他現在完全按場景來:

  • Mac 深度集成:咬牙上 Swift 和 SwiftUI
  • 極致性能:玩 Zig
  • 多線程高性能:用 Rust
  • 跑推理和模型:Python
  • 好搞 Windows 部署:Go

有意思的是,Zig 這種新語言,以前模型幾乎幫不上忙,這半年直接變成“完全可用”,他就拿來幹狠活。比如有個 Node 架構組件太吃內存,他本來打算改成 Rust,自動遷移都失敗了,幾個月後換模型,讓它一口氣轉成 Zig,跑了大概 6 小時,只剩一個小細節要自己改,他說那一刻真的被震到。


蘋果、本地節點與“住宅 IP 上的智能體”

Peter 早年一直用 Windows,後來瘋狂玩 Linux,連內核都自己編過。上大學那會兒,他拿著一臺很折騰的 Linux 本,看見同學桌上那臺白色 MacBook,就被驚到了,覺得這東西太好看了。再加上當時 Linux 上 Skype 音頻老出問題,各種小毛病,他乾脆投奔 macOS,順帶因為做 iOS 開發必須用 Mac,就一路用到現在。

他現在反而覺得,Apple 把自己在原生應用上的領先優勢搞丟了。最近幾年,他經常寧願用 Electron,因為很多公司把精力全壓在那一個跨平臺殼上,反而功能更全,Mac 原生客戶端長期缺功能。

他真正不滿的是 Apple 新框架的可靠性。做 GitHub 客戶端時,他用上 SwiftUI 裡號稱“最新最棒”的 AsyncImage,結果有些網絡圖片就是不顯示,或者慢得離譜。他去問 Codex,這個東西是不是有 bug,模型直接回他:AsyncImage 更像實驗用,不建議上生產。對一個 2026 年的 Apple 平臺開發者來說,這就很刺眼了。

在他眼裡,這說明 Apple 明明有多年的原生積累,卻沒有把工具鏈好好往前推。開發者一邊被鼓勵用 SwiftUI,一邊又被自己的 AI 助手勸退,說“別用官方方案”,這落差會慢慢把人推向 Web 殼和跨平臺方案。

Lex 和 Peter 還提到一個挺諷刺的現實:硅谷搞 LLM、搞 agent 的那批人,清一色在用 MacBook、Mac mini,當開發主力機。但 Apple 自己在 AI 上幾乎沒存在感,也沒怎麼主動跟這群人打成一片,像是錯過了一個天然用戶群。

說到 Mac mini,他特意澄清,OpenClaw 完全不需要專門買一臺。任何電腦都能當節點,只要跑得動瀏覽器和 Playwright 那一套,agent 就能用。真正重要的,是這個節點在互聯網裡的“身份”,也就是 IP 類型。

他現在很堅持讓 agent 跑在“住宅 IP”上。原因很現實:越來越多網站會識別數據中心 IP,然後直接攔、加各種驗證碼。agent 雖然可以點“我不是機器人”,但頻率一高,整個流程就變得很脆弱。放在家裡的舊電腦,當成 OpenClaw 節點,反而更穩,更接近真人上網的軌跡。

至於 OpenClaw 的上手門檻,現在確實還偏開發者。最簡單的方式,是在終端裡粘貼一行命令,或者用現有的桌面 app,讓它幫你跑那行命令。他也知道,很多人希望有更傻瓜的 Windows 客戶端、更友好的圖形配置界面,最好還能在網頁裡點一點就搞定。

他其實已經在做這些,但優先級放在安全上。只有當他覺得“可以放心給自己媽媽用”的時候,才會真正放開入口。在那之前,他寧願讓增長慢一點,因為現在一個人維護這麼大個系統,用戶對功能和穩定性的期待已經有點超出人類極限。


和智能體一起教與學:給新建造者的建議

在這種壓力下,他給新手的建議反而很輕鬆:先玩。想到一個點子,就去做個小東西,不用管完不完整,用不用得上,重點是你在搭建的過程裡開心。

他自己也說,原來以為自己愛寫代碼,其實更愛“造東西”,現在有 LLM 之後,很多枯燥細節都能丟給模型,他只盯難點,樂趣大很多。

遇到不懂的,就一直問模型。他會直接說“按我 8 歲能聽懂的方式講數據庫”,不滿意就調年齡,再問一遍。以前得刷 Stack Overflow、發推等兩天,現在等幾秒就行,相當於隨身帶了一個“無限耐心的家教”。

具體怎麼“玩”呢?一個路徑是裝好 OpenClaw,先照著文檔跑起來,再讓代理幫你改一兩個小地方,慢慢體會系統怎麼運轉。

至於要不要系統學編程,他的態度是:會寫代碼肯定有幫助,但不是硬門檻。他見過很多“高主動性、特別愛問問題”的人,幾乎不懂底層軟件原理,也能靠不停追問代理,把東西做出來。

他不太看好那種想“一鍵自動造完軟件”的編排器路線,比如 Gastown 這類。他覺得這有點像 1970 年的瀑布開發:先在腦子裡把系統規劃到極致,再丟給一個大機器跑完。自己的節奏是反過來:先做一個極簡版本,親手玩一圈,感受手感,再根據使用中的火花慢慢長出新想法。


編程、身份與未來:程序員會變成什麼?

接著聊下去,Peter 直接說,現在方向挺明確的:大量“敲代碼”這件事,會被 AI 接過來,純手寫代碼以後更像“編織毛衣”,是少數人當愛好在玩。

但他又反覆強調,產品到底要做什麼、架構怎麼搭、用起來什麼感覺,這些還是人的事情,開發者要把自己看成更寬的“builder”,因為有了這種“token 化的智能”,同一個人能撬動的事情會多很多。

Lex 這邊就挺真誠,他說自己從來沒想過,最愛的那件事會這麼快被替代。現在短短幾個月,這個身份要變味,他是有點難過的。但他也認同,程序員其實最有條件學會跟 agent 打交道,學會那種“命令行式”的對話,知道 agent 完成任務需要什麼上下文、什麼約束。

Peter 也提到,他在 Mastodon、Bluesky 上因為這些觀點被罵得挺慘,很多人把恐懼直接砸到他身上。他現在能理解那種害怕:幾十年練的手藝,好像要被“蒸汽機”頂掉。

但他還是堅持一點:如果你只認自己是“iOS 工程師”,那就太窄了。軟件的默認門檻被 AI 拉低,大家對體驗、細節的期望反而在抬高,真正有價值的是“會造東西的人”。


智能體 vs 應用:為什麼 80% 的 App 可能會消失

他接著舉了個特別直觀的例子:像 MyFitnessPal、Eight Sleep 這種垂直 app,其實都在做一件事,就是拿你的數據,給你一點建議。

但個人 agent 如果同時知道你在哪、昨晚睡得怎麼樣、這幾天壓力高不高,就能自己改你的健身計劃,順手把床、燈、空調都調好,還能用你最順手的界面來展示。那用戶心裡很自然會問一句:我幹嘛還要多裝一個 app,再付一份訂閱費呢。

Peter 的判斷挺狠,他覺得這類場景一多起來,大概能“自然淘汰”掉差不多 80% 的應用。對開發者來說,軟件還會被寫出來,但形態會從“一個個獨立 app”,變成“被 agent 調用的能力”。

他還預想了一個新模式:用戶直接給 agent 一筆預算,比方說 100 美元,丟一句“幫我搞定這件事”,剩下的就讓 agent 自己去調各種 API,甚至去用類似“租一個人”的服務,把線下的環節也辦完。用戶不在乎是哪個 app、哪個平臺,只在乎問題有沒有被解決。

在這種環境裡,能活得好的,是那些願意變成“面向 agent 的服務”的公司。像外賣、打車這種,本質就是一個下單 API,誰先把接口、權限、結算這些事情搞得對 agent 友好,誰就更容易被個人 agent 默認選中。

這也讓衝突開始冒頭。Cloudflare、Medium 已經在各種層面卡 agent 訪問,他自己在看 React 文章時,經常要手動複製整篇內容給模型,因為網頁直接被擋掉。久而久之,他就不太點 Medium 的鏈接了,開始更偏向那些“對 agent 友好”的站點。

連搜索他都從 Google 換到了 Perplexity、Brave,原因很簡單:Google 現在對自動化、對 agent 並不友好。大公司當然會反擊,但如果長期站在用戶對立面,就有點像當年的 Blockbuster,看著 Netflix 把用戶一點點帶走。


真實感 vs AI 糊作:內容標註與“人的毛邊”

Peter 其實很希望 X 能給每個賬號一點點只讀 API 配額,哪怕只讀書籤也行,這樣像 OpenClaw 這種小工具就能幫你整理、總結收藏的推文。他當時還主動告訴官方自己做了這個東西,對方禮貌但還是讓他下線,他也認了,只是希望這能讓團隊意識到用戶真有這個需求。

但他對“自動發內容”特別反感,在 X 上只要有人用 AI 回他,一旦聞到味道就直接拉黑,零容忍。他主張只要是通過 API、通過 agent 發的內容,都應該被清晰標記,甚至給 agent 單獨的賬號,讓大家一眼看出“這是機器人在替我說話”,因為現在內容太便宜,真正貴的是人的注意力。

這種態度也延伸到郵件和博客上。他說自己寧願看對方的破英文,也不想看“AI 糊出來”的客套話。之前他試過用 agent 寫博客,發現花的時間差不多,但總差點自己的味道,所以現在博客全是他手寫,最多用 AI 幫忙改幾個最糟糕的錯別字,他反而開始覺得“錯別字和毛邊”本身就是人的痕跡。


倦怠、金錢與意義:Peter 的個人旅程

Peter 回頭看 PSPDFKit 的 13 年,說自己是“燒得太亮太久”。真正壓垮他的不是寫代碼,而是和合夥人的分歧、跟大客戶的高壓溝通,這些人和衝突一點點把他磨空。

公司拿到好報價前兩年,他就刻意把自己做成“可被替代的人”,結果交易完成後,整個人像 Austin Powers 被抽走了 mojo,一坐到屏幕前就發呆,完全寫不出代碼,最後乾脆訂了去馬德里的單程機票。

他不太贊成那種“拼命幹到財務自由,然後什麼都不幹”的想法。因為他親身體驗過,早上醒來如果沒有事值得期待,沒有真正的挑戰,很快就會無聊。人一無聊,就會開始找別的刺激,可能是各種藥物,但這種刺激也會變得乏味,然後一步步往更黑暗的地方走。

錢對他來說更像是一種“你做對了事”的反饋,順便能解決很多現實問題,但越往上,邊際收益越低。漢堡就是漢堡,多貴也就那回事。所以他拿出一大塊錢做了基金會,專門幫那些沒那麼幸運的人,這對他更有意義。


融資、開源與大實驗室:OpenClaw 的下一步

OpenClaw 火了之後,Peter 突然發現,幾乎所有大 VC 都在給他發郵件,要約那種“15 分鐘聊聊”。他自己在想的選項其實很極端:要麼什麼都不做,繼續現在挺舒服的生活,要麼在一堆人“你趕緊開公司”的壓力下,再幹一回創業,明知道可能會很精彩,但那種節奏他已經體驗過一次了。

Lex 說他要真想融錢,幾億、上十億美金都不是問題,可他坦白這事兒完全不讓他興奮,因為當 CEO 那套他已經走完一遍,花太多時間在自己不喜歡的事上。更糟的是,一旦把 OpenClaw 產品化,比如做“安全職場版”、加審計日誌、改成 FSL 這種商業限制協議,他會覺得開源版和閉源版之間天然有利益衝突,這跟他想要“免費、隨便玩”的感覺是反著來的。

他也很清楚,純靠捐贈幾乎養不活團隊,Tailwind 被幾乎所有人用,最後還得裁掉大概 75% 員工,就是個鮮例子。現在 OpenClaw 每個月大概倒貼 1 到 2 萬美金,贊助他還特意往上分給依賴項目,自己這邊再加點周邊給貢獻者。OpenAI 給了一點 token 支持,別的公司也有幫忙,但整體看,這條“完全獨立開源”路線長期很難閉環,所以他開始認真聊 Meta、OpenAI 這些大實驗室。

他給大廠提的前提很明確:項目必須繼續開源,類似 Chrome 和 Chromium,那種公司可以做產品,但社區還能自由 hack。因為他在舊金山線下看到的那種“機器人、龍蝦亂跑”的極客氛圍,讓很多人說像回到 10、15 年前互聯網早期,這種社區感他特別珍惜。

在 Meta 和 OpenAI 之間,他自己說“真的挺難選”。OpenAI 那邊,他本來就是 Codex 的自來水,技術上很投緣;Meta 那邊,Ned 和 Mark 花了一整週在玩他的產品,一會兒誇好用,一會兒直接說“這塊很糟”,各種細節反饋,讓他感覺對方是真正在乎東西本身。OpenAI 則拿出了誇張的 token 配額當“source hammer”來勾引他,對一個做代理系統的人來說,這誘惑確實很大。


環境與社會影響:代價、痛苦與被賦能的人

他後來發現,不管去哪兒,總有人先問環境問題,說數據中心用水嚇人。Peter 就真去算賬:普通人用 AI 的推理 token,差不多你每個月少吃一個漢堡,就能把對應的 CO2 和用水抵掉,預訓練算上去也沒誇張到 100 倍那種級別。再看對比,全球打高爾夫用的水,其實還比所有數據中心加起來多,他就吐槽,有些人抓著 AI 的壞處不放,卻完全不看潛在好處。

Lex 這邊態度有點不一樣。他說硅谷有個泡泡,大家太興奮,老在內部互相打雞血,很容易忽略真實世界的感受,尤其是美國中部、全球那些會被裁員、被重組的人。AI 長期可能真能帶來更多機會,但短期的失業、焦慮、家庭壓力,都是實打實的痛。他希望做技術的人,哪怕繼續樂觀,也要經常給自己一個安靜的時刻,承認“我們做的東西會讓很多人受苦”,保持一點謙卑。

Peter 說,他一邊聽批評,一邊也在收郵件:有小企業主告訴他,用 OpenClaw 把收發發票、回客戶郵件這些瑣事自動化了,終於能把時間花在更開心的事上。還有家庭說,家裡殘障女兒用上 OpenClaw 以後,第一次覺得自己能做很多事,那種被賦能的感覺讓全家都很激動。

技術本身早就有,但他把門檻降下來了,還支持免費模型、本地部署、像 Kimi 這種更便宜的選擇,不被某個大廠空間鎖死。

Peter 的回答挺接地氣。他說,最讓他興奮的是“builder 氛圍”又回來了,大家開始用一種玩耍的心態折騰 AI,在各個角落自發搞創作。他舉了維也納 Clockholm 的例子,社區大概 500 人,卻有一大堆人搶著上臺分享作品,這在以前是很難的。

Lex 順著說,如果工具再做得簡單一點、更安全一點,只要你能用自然語言表達想法,就能把東西搭出來,這真的是把權力交回給普通人。


結語:智能體不是主角,你才是

今天聊了這麼多,其實就一件事:智能體已經不再是科幻裡的概念,而是你今天就能裝起來、明天就能跟它一起幹活的東西。它會幫你寫代碼、管文件、連接各種服務,甚至自己改自己的架構——但最後拍板的人,還是你。

從最開始那個一小時寫完的 WhatsApp 小腳本,到後來亂七八糟的改名風波、Moltbook 戲劇、各種安全事故,再到現在幾萬行代碼、幾千個 PR 的 OpenClaw,中間有興奮、有崩潰,也有那種“我是不是該刪庫跑路”的瞬間。可現實就是:越多人玩起來,這個東西就越像一面鏡子,把我們對工具、對權力、對安全、對意義的態度,全都照了出來。

如果你是寫代碼的,可能會有點共鳴:以前我們把“程序員”當身份,現在慢慢要學著把自己當“builder”,把寫代碼當手藝,而不是全部。智能體會幫你抹平很多重複勞動,可方向、取捨、價值觀,這些還是逃不掉,只能你自己扛。

我自己最大的感受是:好用的個人 AI,不是為了多造幾個炫酷應用,而是幫你把注意力從“怎麼點這個按鈕”拉回“我到底想做什麼”。當工具變得越來越聰明,反而逼著我們更認真地想:我在意什麼,我想建什麼,我願意為誰負責。這個問題,誰也替你答不了。

    Share:
    返回文章列表