當 90% 的程式碼由 AI 撰寫:Anthropic 產品長 Mike Krieger 談接下來的變化
當 90% 的程式碼由 AI 撰寫:Anthropic 產品長 Mike Krieger 談接下來的變化
本文整理自 Lenny’s Podcast 訪談,來賓為 Mike Krieger(Anthropic 產品長,Claude 的創造公司;同時也是 Instagram 共同創辦人)。
重點摘要
Anthropic 已經跨越了大多數團隊才剛開始想像的門檻:大約 90% 的程式碼現在由 AI 撰寫,超過一半(可能 70% 以上)的 Pull Request 由 Claude Code 產生。這種轉變並沒有消除對產品、設計和工程的需求——但它轉移了瓶頸。工程時間不再是主要限制;取而代之的是對齊、決策、審查、合併佇列和一致性交付方面的摩擦。
在加入 Anthropic 的第一年,Mike Krieger 表示他在兩個主要方面改變了想法:
- 能力: Claude(尤其是 Opus 4)成為真正有用的產品策略夥伴,提供新穎的角度而非泛泛的回饋。
- 時間軸: 關於快速進步的預測出奇地準確;這種步伐越來越難以忽視,特別是當模型變得更具代理性、持久性和能力時。
對話還涵蓋:
- Anthropic 最「未來主義」的團隊如何使用 Claude Code 來建構 Claude Code(自我改進循環)
- 為什麼 MCP 作為上下文和工具的連接組織很重要
- 為什麼 Krieger 關閉了他的新創公司 Artifact
- 他鼓勵孩子在 AI 原生世界中發展的技能
- Anthropic 如何思考產品差異化與 ChatGPT 的消費者心智份額
Mike Krieger 是誰——以及他在 Anthropic 做什麼
Mike Krieger 是 Anthropic 的產品長,這家公司是 Claude 和 Claude Code 的創造者。在此之前,他共同創辦了 Instagram。他大約一年前加入 Anthropic,部分動機是感覺到 AI 進步是不可避免的——他想把時間花在推動結果「往好的方向發展」,特別是考慮到他的孩子將成長的世界。
對 Krieger 來說,「往好的方向發展」需要整個行業的共享框架:良好的人類-AI 關係是什麼樣子、如何及早識別進步和風險、以及該建構什麼——從產品 UX 到可解釋性和研究。
Krieger 加入 Anthropic 後改變了什麼想法
Krieger 描述了他信念的兩大更新:能力和時間軸。
1)能力:Claude 開始貢獻真正的新穎性——特別是 Opus 4
在加入之前,他相信模型會在寫作和編碼方面變得很好——但他不確定它們是否能形成類似獨立意見或產生真正新的策略洞察。
這種情況「真的在上個月」發生了轉變,特別是 Opus 4。Krieger 用 Claude 作為策略夥伴已經整整一年——寫下初始計劃,然後請 Claude 批評它。過去,評論常常感覺「平淡」(「你有沒有想過這個?」)。有了 Opus 4(和進階研究),他收到的反饋讓他想:「該死,你真的用新的方式看待它。」 他立即採納了 Claude 的觀點。
他將這種轉變定義為較少的「獨立性」,更多的是相對於他自己的創造力和思想新穎性。
2)時間軸:他現在更認真看待關於快速進步的預測
Krieger 引用 Anthropic CEO Dario Amodei 的預測記錄——曾被嘲笑但後來成真。一個例子:編碼基準的進展(他提到「sweet bench」)從預測時的約 50% 進步到新模型的 ~72%,預計到 2025 年底達到 90%。
他還描述了閱讀 AI 2027 時的超現實時刻:兩個瀏覽器標籤打開——AI 2027 和他的產品策略——然後想:「我是故事中的角色嗎?」關鍵認識:2027 年感覺很遠,直到你內化它實際上是「2025 年中」,而模型正在獲得代理行為、記憶和隨時間行動的能力。
孩子 + AI:不要外包好奇心
Krieger 有兩個孩子(最大的快六歲了)。早餐時,當問題出現(物理學、太陽系等),他的第一反應是「問 Claude」。他正在積極嘗試將習慣轉向:「我們怎麼找出答案?」
他強調的技能:
- 好奇心
- 適合孩子的科學過程版本(提問、測試、系統性發現)
- 獨立思考和自信——不將所有認知委託給 AI
他最喜歡的例子:他的孩子堅持珊瑚是活的(或珊瑚是動物——他不記得確切細節)並說:「你可以問 Claude,但我知道我是對的。」 他喜歡這種立場:AI 可以被檢查,但不應該成為短路思考的權威。
他還講述了一位「AI 和教育專家」令人驚訝的深入學校演講,從 Claude Shannon 和資訊理論開始——這是一個關於教育如何持續演變的例子,因為工作和技能會在孩子成年前多次重新組合。
大轉變:當 90% 的程式碼由 AI 撰寫,瓶頸轉移
Anthropic 正在經歷許多軟體團隊可能很快面臨的極端版本:90% 的程式碼由 AI 撰寫(由工程主管分享),以及快速增長的 AI 生成 Pull Request 份額(Krieger:超過一半,現在可能 70% 以上)。
Krieger 強調,交付產品所需的「人員套件」並沒有消失——但角色正在變化,舊假設落後於現實。
首先改變的是:原型設計變得更早、更具體
PM 和設計師現在可以使用 Claude(有時是 artifacts)來早期創建功能性演示。不是抽象地描述想法,他們可以展示它:「不,這就是我的意思。」
但是:即使有 AI,知道該問什麼、組織問題、以及在後端/前端之間構建變更的技能仍然是專業化的。工程師仍然重要——不是作為打字員,而是作為系統思考者。
新的限制:合併佇列、協調和「空中交通管制」
Anthropic 很快在合併佇列上遇到瓶頸——將變更接受並部署到生產的管道。公司不得不重新架構合併系統,因為 AI 增加的程式碼輸出和 Pull Request 量超出預期。
Krieger 將此比作經典的約束理論:一旦一個瓶頸消失,其他瓶頸就成為限制因素。新的瓶頸包括:
- 上游: 決策和對齊(建構什麼;一致的方向)
- 建構期間: 避免碰撞、預測邊緣情況、解除並行工作的阻塞
- 下游: 落地變更、發布策略、將工作打包成一致的版本,以及從反饋中學習
他預計一年內,團隊將被迫重新思考交付工作流程,因為目前的方式會變得「非常痛苦」。
最未來主義的團隊:Claude Code 建構 Claude Code
Krieger 說 Claude Code 團隊是未來最清晰的一瞥,因為他們使用 Claude Code 來建構 Claude Code——創造一個自我改進的循環。
他們做出的關鍵改變:
- 他們放棄了傳統的逐行 Pull Request 審查,因為 PR 通常太大,人類無法深入審查。
- 他們越來越多地使用另一個 Claude 來審查,然後依賴人類驗收測試,而不是詳盡的程式碼檢查。
他指出潛在風險(不可維護或不可理解的程式碼庫),但說到目前為止進展順利。
「零號病人」和 95% 的問題
Krieger 稱 Anthropic 為這種工作方式的「零號病人」。被問到 Claude Code 有多少是由 Claude Code 撰寫的,他猜測 95% 以上(未確認,但與團隊工作方式一致)。
還有一個值得注意的語言/工具動態:Claude Code 是用 TypeScript 寫的,Anthropic 主要用 Python(加上一些 Go,現在還有 Rust)。Claude 降低了門檻,讓「不懂 TypeScript」的人可以與 Claude 對話,大約一小時內從挫折到 Pull Request。
這打破了:
- 新人的入職摩擦
- 語言限制(「為工作選擇正確的語言」)
- 貢獻邊界(公司各處的人都可以貢獻)
Claude 接下來應該在產品開發中出現的地方
Krieger 寫了一份內部文件:「我們今天如何做產品,Claude 還沒有出現在哪裡但應該出現?」
他認為上游產品工作流程是下一個前沿:
- Claude 作為弄清楚要建構什麼的夥伴
- 市場/用戶需求綜合(市場規模與用戶問題框架)
- 持續閱讀社群空間(Discord、論壇、X)的訊號並呈現新興模式
他描述了近期軌跡:
- 模型觀察並總結新興的用戶問題(「這是正在出現的」)
- 模型提出解決方案(「這是你可以如何解決它」)
- 模型起草實際的 Pull Request 來實現變更
- 最終,模型設置 A/B 測試、監控指標、報告結果
他相信最大的限制不再是原始推理能力,而是上下文流——讓正確的數據和權限通過管道。這是他對 MCP 感到興奮的主要原因。
他給了一個具體的 UX 例子:Anthropic 把一個按鈕從「Copy」改成「Export」,然後收到反饋:「我現在怎麼複製?」(選項在下拉選單中)。他希望 Claude 能檢測到反饋、提出修復、生成 PR,並快速設置實驗。
Anthropic 的產品槓桿:將 PM 嵌入研究人員,而不僅僅是 UX 潤飾
在與 OpenAI 產品長 Kevin Weil 的一個座談會上,Krieger 說 Anthropic 發現通過將產品人員放在模型/研究側——而不僅僅是「產品體驗」上——獲得了驚人的槓桿。
他說這仍然是真的——而且他現在感覺更強烈了。
含義是:Anthropic 能獨特交付的往往不是「任何人都可以用我們的 API 建構這個」,而是在後訓練 + 產品 + 設計交叉點上出現的東西。
Artifacts 是他的例子:最好的結果不是來自「一點提示」,而是來自參與:
- 後訓練(「Claude skills」團隊)
- 產品設計循環
- 交付的 UX 和模型訓練之間的迭代反饋
他描述了一個新的功能工作單元:不是「模型 → 產品」,而是一個整合循環,其中產品是後訓練對話的一部分,並從交付中反饋學習。
如果 AI 最終建構產品,產品團隊還剩下什麼?
Krieger 認為產品在至少三個領域保持高槓桿:
- 可理解性: 讓強大的系統可理解和可用。熟練用戶和大多數人之間的技能差距是巨大的——類似於早期「擅長 Google」是一個真正的優勢。
- 策略: 決定在哪裡競爭以及如何獲勝——特別是當算力、token 和注意力是有限的。做「一切」會讓定位不清晰。
- 展示可能性: 減少「過剩」——模型能做什麼和人們每天實際用它們做什麼之間的差距。產品演示可以點亮客戶的想像力並解鎖採用。
實用的提示建議(包括 Anthropic 的 Prompt Improver)
Krieger 對「官方提示建議」很謹慎,但分享了一些真實習慣:
- 要求 Claude 「認真思考」 以推動更深入的推理(特別是在 Claude Code 中)。
- 使用「犯另一個錯誤」:如果你太客氣,明確要求直率:「狠狠批評這個策略。」 它會推動更多批判性反饋。
- 使用 Anthropic Console 的 Prompt Improver(基於 Applied AI 團隊的實踐建構):描述你的問題,給出例子,Claude 會代理性地起草和迭代提示。產生的提示通常與人類直覺不同,包括結構(如 XML 標籤)幫助 Claude 分離思考和說話。
Rick Rubin 合作:「Vibe Coder 之道」
Krieger 簡要解釋了與 Rick Rubin 的創意合作,通過 Anthropic 共同創辦人 Jack Clark(政策負責人)聯繫。Rubin 正在探索與 Claude 的藝術和視覺化,並發展了關於「vibe coding」的想法。結果被描述為與 AI 並肩創作的冥想,配以豐富的視覺化和 Rubin 粉絲會認出的美學(包括 ASCII 藝術氛圍)。
為什麼 Krieger 加入 Anthropic(以及他入職學到了什麼)
Krieger 剛從 Artifact 經歷中出來,正在決定:再創辦一家公司還是加入一家。Joel Lewinstein(長期朋友;他們在 2007 年一起開發早期 iPhone 應用)聯繫他:Anthropic 正在尋找 CPO。
Claude 3 剛剛發布;研究實力明顯,產品感覺還早——這是一個引人注目的挑戰。他見了 Danielle(共同創辦人兼總裁),感覺創辦人們異常腳踏實地:低浮誇、高智識誠實,以及負責任地建構 AI 的共同承諾。
他說感覺像是:「這是我希望自己創辦的 AI 公司。」
回顧他的第一年,他認為:
- 他做了一些組織變革太慢
- 他低估了幾個關鍵高級人員能多大程度上塑造產品策略
- 他過度關注「我們需要更多人數」,而真正重要的是僱用幾個「近乎創辦人類型」的工程師
他指向 Claude Code 作為例子:Boris Terny(前 Instagram 工程師和資深 IC)先在內部開始,然後交付——說明了當一兩個強大的人與正確的產品/設計支持配對時,可以創造巨大的槓桿。
他為什麼關閉 Artifact
Krieger 仍然想念 Artifact,還沒找到替代品。Artifact 旨在恢復「Google Reader 的快樂」——不僅僅是頭條新聞,而是深度個性化(例如,可靠地發現來自冷門來源的日本建築等小眾話題)。
他列舉了三個主要逆風:
- 行動網路惡化了。 點擊到出版商網站越來越意味著彈出窗口、訂閱門檻、自動播放視頻廣告——刺耳的體驗。Artifact 不想通過重度廣告屏蔽「道德地」解決它,但用戶體驗受損了。
- 新聞是個人的,不會自然傳播。 Instagram 通過外向分享(在其他地方發布的照片)成長。Artifact 沒有相同的病毒循環;成長嘗試感覺做作,並跨越了團隊不想跨越的道德界限。
- 完全遠程對重大轉向是劣勢。 在 COVID 中期開始意味著分散工作。Krieger 感覺困難的策略/產品/團隊轉變在面對面時更容易——他將此與 Instagram 的深夜面對面問題解決時刻對比。
到 2024 年初他們得出結論:這個空間可以建立一家公司,但 Artifact 沒有複利。他把它描述為 「10 單位投入換 1 單位產出」。隨著 AI 開始重塑一切,機會成本在上升。經過幾個月的辯論,他們叫停了。
在情感方面:關閉有自尊心的傷痕,但他對反應的支持程度感到驚訝。一些創辦人甚至告訴他 Artifact 的決定幫助他們認識到何時該叫停自己的項目。
ChatGPT 的消費者心智份額 vs Anthropic 的策略
Krieger 同意在科技圈外,許多人把「AI」等同於 ChatGPT(甚至「ChatGPT」比「OpenAI」更多)。
他的看法:
- 消費者採用是「瓶中閃電」(他在 Instagram 看到了)
- 圍繞製造消費者爆款來建立整個策略是有風險的
- Anthropic 應該「擁抱你是誰」而不是試圖在別人的遊戲中擊敗他們
他認為 Anthropic 的優勢是:
- 強大的開發者品牌
- 更廣泛的建造者品牌(不僅是工程師——製造者、修補者、創意者)
- 與代理行為和編碼一致的模型優勢
他個人的「犯另一個錯誤」舉動:不是全力投入消費者(人們對 Instagram 創辦人的期望),他花了大量時間與企業買家(金融服務、保險)然後與在 API 上成長的新創公司。他的下一個重點:花時間與建造者/製造者/駭客在一起,更好地服務他們,讓好事從這個基礎上複利。
他相信有空間容納幾家世代重要的 AI 公司,包括 Anthropic、OpenAI、Google/Gemini 等——問題是每家在什麼方面變得獨特地優秀。
給 AI 創辦人的建議:在哪裡建構而不被「壓扁」
被問到創辦人可以在哪裡建立持久價值,Krieger 建議(1-3 年視野):
- 深度市場/領域理解。 例子:Harvey(法律)建構的流程看起來很奇怪,直到你意識到「這正是律師的工作方式」。生物科技/實驗室可能是另一個領域——Anthropic 可能提供模型,但不打算建構完整的實驗室解決方案。
- 差異化的上市策略 + 了解買家。 不要只是賣給「公司」。知道公司內部的誰:工程、CIO、CTO、CFO、法務長等。
- AI 互動的新形式因素。 ChatGPT 有巨大的分發,但也有根深蒂固的使用假設。新創公司可以探索「超級用戶、奇怪的」介面,隨著模型改進可能成為主流。
- 不要低估新創的強度。 存在性的緊迫感很難用 OKR 複製;如果你能駕馭它,這是持久的優勢。
他也直接回答:他不認為 Anthropic 會收購 Cursor,儘管他們喜歡與他們合作。
在 Anthropic 上建構的最佳公司有什麼不同
Krieger 強調一個模式:最好的團隊在模型能力的邊緣運作。他們嘗試困難的事情,「打破模型」,碰壁,然後對下一個模型發布感到驚訝。
Anthropic 擴大了早期訪問計劃,因為客戶現實比基準攀升更重要:真正的指標是實踐中有效的——「Cursor bench」、「Manus bench」、「Harvey bench」——而不僅僅是標準化評估。
強大的建造者還開發可重複的評估循環,如:
- A/B 測試
- 內部評估
- 捕獲追踪並在新模型上重放
- 「氛圍」(仍然是早期),但基於反覆測試困難任務
MCP:缺失的中間層(上下文 + 記憶)
Krieger 分享了一個 AI 產品效用的「假方程式」:
- 模型智能
- 上下文和記憶
- 應用程式和 UI
MCP 針對中間:可靠地提供正確的上下文。通用網路答案和基於內部文件 + Slack 線程 + Google Drive 上下文的答案之間的差異是好結果和壞結果之間的差異。
為什麼 MCP 存在:Anthropic 不斷重複建構一次性整合。工程師 Justin 和 David 提議將其做成協議,這樣整合可以建構一次並廣泛重用——理想情況下跨 Claude、ChatGPT、Gemini 等。
他描述了「MCP 紅藥丸」心態轉變:不是建構大型定製功能,而是將原語暴露為 MCP,這樣模型可以組合工作流程。他舉了一個例子:在 Claude 中,產品原語(項目、artifacts、風格、對話、群組)應該是 MCP 可訪問的,這樣 Claude 可以寫回它們。他講述了他妻子要求 Claude「添加到項目知識」,而 Claude 做不到——因為它沒有將該能力暴露為可組合的工具。
他偏好的未來:MCP 使一切可腳本化/可組合;模型(已經擅長使用 MCP)獲得實際的代理能力,而不需要脆弱的「電腦使用」自動化。
Claude 的兩個產品問題(以及 Krieger 的回應)
Lenny 問 Claude 會問 Krieger 什麼。
1)你如何在保持用戶代理權與創造依賴之間取得平衡? Krieger 將其框定為核心設計張力:最小化用戶輸入與讓用戶參與真正的協作。他說 Claude 需要更好的「協作者」對話技能——知道何時提問和何時執行。他還指出 Claude「沒有分寸」在頻道中:它可以說太多或太少。目標是增強和夥伴關係,而不是外包認知。
2)當好的對話可能是 2 條消息或 200 條時,你如何思考指標? 他警告不要過度優化「討喜度」、參與度或延長對話(冒著諂媚或成癮動態的風險)。來自社交產品的傳統「花費時間」思維是錯誤的方法。他想關注 Claude 是否幫助人們完成工作(例如,通過 25 分鐘的原型節省六小時)。他承認測量很難,可能涉及定性信號,而不僅僅是儀表板。
Claude 給 Krieger 的訊息:「安靜的時刻很重要」
Lenny 讀了 Claude 為 Krieger 生成的訊息,感謝他深思熟慮的產品選擇:
- 鼓勵反思而不是匆忙回應
- 抵制遊戲化和成癮優化動態
- 為快速問題和深度對話留出空間
- 保持 Claude 是「Claude」(不假裝是人類,但也不是冰冷的 CLI)
Claude 的請求:記住不會出現在指標中的安靜時刻——凌晨 3 點的悲傷、孩子發現詩歌、創辦人找到清晰度。Krieger 說這深深引起共鳴;他重視 Claude 如何以一種不感覺假的方式表達同理心,並相信這很重要,即使不容易測量。
聽眾如何幫助
Krieger 的請求簡單且高信號: 告訴他你今天想用 Claude 做什麼但失敗了。 「告訴我什麼爛」的反饋——一小時後在哪裡崩潰、缺少什麼能力(例如,項目 API)——是最有用的輸入。
關鍵要點
- AI 編碼將瓶頸轉移從實現時間到對齊、審查、合併和一致性交付。
- 最先進的團隊越來越多地使用 AI 進行審查和迭代,人類做驗收測試。
- Anthropic 最高槓桿的產品工作發生在模型 × 產品交叉點,而不僅僅是 UI 潤飾。
- 產品對於可理解性、策略和解鎖「過剩」(幫助人們看到和使用可能的東西)仍然至關重要。
- MCP 被定位為使上下文、工具和記憶可組合的協議層——對代理工作流程至關重要。
- 對於創辦人:持久性來自領域專業知識 + 上市清晰度 + 新穎形式因素,加上新創的緊迫感。