Jan 6, 2026

當 90% 的程式碼由 AI 撰寫：Anthropic 產品長 Mike Krieger 談接下來的變化

本文整理自 Lenny’s Podcast 訪談，來賓為 Mike Krieger（Anthropic 產品長，Claude 的創造公司；同時也是 Instagram 共同創辦人）。

重點摘要

Anthropic 已經跨越了大多數團隊才剛開始想像的門檻：大約 90% 的程式碼現在由 AI 撰寫，超過一半（可能 70% 以上）的 Pull Request 由 Claude Code 產生。這種轉變並沒有消除對產品、設計和工程的需求——但它轉移了瓶頸。工程時間不再是主要限制；取而代之的是對齊、決策、審查、合併佇列和一致性交付方面的摩擦。

在加入 Anthropic 的第一年，Mike Krieger 表示他在兩個主要方面改變了想法：

能力： Claude（尤其是 Opus 4）成為真正有用的產品策略夥伴，提供新穎的角度而非泛泛的回饋。
時間軸： 關於快速進步的預測出奇地準確；這種步伐越來越難以忽視，特別是當模型變得更具代理性、持久性和能力時。

對話還涵蓋：

Anthropic 最「未來主義」的團隊如何使用 Claude Code 來建構 Claude Code（自我改進循環）
為什麼 MCP 作為上下文和工具的連接組織很重要
為什麼 Krieger 關閉了他的新創公司 Artifact
他鼓勵孩子在 AI 原生世界中發展的技能
Anthropic 如何思考產品差異化與 ChatGPT 的消費者心智份額

Mike Krieger 是誰——以及他在 Anthropic 做什麼

Mike Krieger 是 Anthropic 的產品長，這家公司是 Claude 和 Claude Code 的創造者。在此之前，他共同創辦了 Instagram。他大約一年前加入 Anthropic，部分動機是感覺到 AI 進步是不可避免的——他想把時間花在推動結果「往好的方向發展」，特別是考慮到他的孩子將成長的世界。

對 Krieger 來說，「往好的方向發展」需要整個行業的共享框架：良好的人類-AI 關係是什麼樣子、如何及早識別進步和風險、以及該建構什麼——從產品 UX 到可解釋性和研究。

Krieger 加入 Anthropic 後改變了什麼想法

Krieger 描述了他信念的兩大更新：能力和時間軸。

1）能力：Claude 開始貢獻真正的新穎性——特別是 Opus 4

在加入之前，他相信模型會在寫作和編碼方面變得很好——但他不確定它們是否能形成類似獨立意見或產生真正新的策略洞察。

這種情況「真的在上個月」發生了轉變，特別是 Opus 4。Krieger 用 Claude 作為策略夥伴已經整整一年——寫下初始計劃，然後請 Claude 批評它。過去，評論常常感覺「平淡」（「你有沒有想過這個？」）。有了 Opus 4（和進階研究），他收到的反饋讓他想：「該死，你真的用新的方式看待它。」 他立即採納了 Claude 的觀點。

他將這種轉變定義為較少的「獨立性」，更多的是相對於他自己的創造力和思想新穎性。

2）時間軸：他現在更認真看待關於快速進步的預測

Krieger 引用 Anthropic CEO Dario Amodei 的預測記錄——曾被嘲笑但後來成真。一個例子：編碼基準的進展（他提到「sweet bench」）從預測時的約 50% 進步到新模型的 ~72%，預計到 2025 年底達到 90%。

他還描述了閱讀 AI 2027 時的超現實時刻：兩個瀏覽器標籤打開——AI 2027 和他的產品策略——然後想：「我是故事中的角色嗎？」關鍵認識：2027 年感覺很遠，直到你內化它實際上是「2025 年中」，而模型正在獲得代理行為、記憶和隨時間行動的能力。

孩子 + AI：不要外包好奇心

Krieger 有兩個孩子（最大的快六歲了）。早餐時，當問題出現（物理學、太陽系等），他的第一反應是「問 Claude」。他正在積極嘗試將習慣轉向：「我們怎麼找出答案？」

他強調的技能：

好奇心
適合孩子的科學過程版本（提問、測試、系統性發現）
獨立思考和自信——不將所有認知委託給 AI

他最喜歡的例子：他的孩子堅持珊瑚是活的（或珊瑚是動物——他不記得確切細節）並說：「你可以問 Claude，但我知道我是對的。」 他喜歡這種立場：AI 可以被檢查，但不應該成為短路思考的權威。

他還講述了一位「AI 和教育專家」令人驚訝的深入學校演講，從 Claude Shannon 和資訊理論開始——這是一個關於教育如何持續演變的例子，因為工作和技能會在孩子成年前多次重新組合。

大轉變：當 90% 的程式碼由 AI 撰寫，瓶頸轉移

Anthropic 正在經歷許多軟體團隊可能很快面臨的極端版本：90% 的程式碼由 AI 撰寫（由工程主管分享），以及快速增長的 AI 生成 Pull Request 份額（Krieger：超過一半，現在可能 70% 以上）。

Krieger 強調，交付產品所需的「人員套件」並沒有消失——但角色正在變化，舊假設落後於現實。

首先改變的是：原型設計變得更早、更具體

PM 和設計師現在可以使用 Claude（有時是 artifacts）來早期創建功能性演示。不是抽象地描述想法，他們可以展示它：「不，這就是我的意思。」

但是：即使有 AI，知道該問什麼、組織問題、以及在後端/前端之間構建變更的技能仍然是專業化的。工程師仍然重要——不是作為打字員，而是作為系統思考者。

新的限制：合併佇列、協調和「空中交通管制」

Anthropic 很快在合併佇列上遇到瓶頸——將變更接受並部署到生產的管道。公司不得不重新架構合併系統，因為 AI 增加的程式碼輸出和 Pull Request 量超出預期。

Krieger 將此比作經典的約束理論：一旦一個瓶頸消失，其他瓶頸就成為限制因素。新的瓶頸包括：

上游： 決策和對齊（建構什麼；一致的方向）
建構期間： 避免碰撞、預測邊緣情況、解除並行工作的阻塞
下游： 落地變更、發布策略、將工作打包成一致的版本，以及從反饋中學習

他預計一年內，團隊將被迫重新思考交付工作流程，因為目前的方式會變得「非常痛苦」。

最未來主義的團隊：Claude Code 建構 Claude Code

Krieger 說 Claude Code 團隊是未來最清晰的一瞥，因為他們使用 Claude Code 來建構 Claude Code——創造一個自我改進的循環。

他們做出的關鍵改變：

他們放棄了傳統的逐行 Pull Request 審查，因為 PR 通常太大，人類無法深入審查。
他們越來越多地使用另一個 Claude 來審查，然後依賴人類驗收測試，而不是詳盡的程式碼檢查。

他指出潛在風險（不可維護或不可理解的程式碼庫），但說到目前為止進展順利。

「零號病人」和 95% 的問題

Krieger 稱 Anthropic 為這種工作方式的「零號病人」。被問到 Claude Code 有多少是由 Claude Code 撰寫的，他猜測 95% 以上（未確認，但與團隊工作方式一致）。

還有一個值得注意的語言/工具動態：Claude Code 是用 TypeScript 寫的，Anthropic 主要用 Python（加上一些 Go，現在還有 Rust）。Claude 降低了門檻，讓「不懂 TypeScript」的人可以與 Claude 對話，大約一小時內從挫折到 Pull Request。

這打破了：

新人的入職摩擦
語言限制（「為工作選擇正確的語言」）
貢獻邊界（公司各處的人都可以貢獻）

Claude 接下來應該在產品開發中出現的地方

Krieger 寫了一份內部文件：「我們今天如何做產品，Claude 還沒有出現在哪裡但應該出現？」

他認為上游產品工作流程是下一個前沿：

Claude 作為弄清楚要建構什麼的夥伴
市場/用戶需求綜合（市場規模與用戶問題框架）
持續閱讀社群空間（Discord、論壇、X）的訊號並呈現新興模式

他描述了近期軌跡：

模型觀察並總結新興的用戶問題（「這是正在出現的」）
模型提出解決方案（「這是你可以如何解決它」）
模型起草實際的 Pull Request 來實現變更
最終，模型設置 A/B 測試、監控指標、報告結果

他相信最大的限制不再是原始推理能力，而是上下文流——讓正確的數據和權限通過管道。這是他對 MCP 感到興奮的主要原因。

他給了一個具體的 UX 例子：Anthropic 把一個按鈕從「Copy」改成「Export」，然後收到反饋：「我現在怎麼複製？」（選項在下拉選單中）。他希望 Claude 能檢測到反饋、提出修復、生成 PR，並快速設置實驗。

Anthropic 的產品槓桿：將 PM 嵌入研究人員，而不僅僅是 UX 潤飾

在與 OpenAI 產品長 Kevin Weil 的一個座談會上，Krieger 說 Anthropic 發現通過將產品人員放在模型/研究側——而不僅僅是「產品體驗」上——獲得了驚人的槓桿。

他說這仍然是真的——而且他現在感覺更強烈了。

含義是：Anthropic 能獨特交付的往往不是「任何人都可以用我們的 API 建構這個」，而是在後訓練 + 產品 + 設計交叉點上出現的東西。

Artifacts 是他的例子：最好的結果不是來自「一點提示」，而是來自參與：

後訓練（「Claude skills」團隊）
產品設計循環
交付的 UX 和模型訓練之間的迭代反饋

他描述了一個新的功能工作單元：不是「模型 → 產品」，而是一個整合循環，其中產品是後訓練對話的一部分，並從交付中反饋學習。

如果 AI 最終建構產品，產品團隊還剩下什麼？

Krieger 認為產品在至少三個領域保持高槓桿：

可理解性： 讓強大的系統可理解和可用。熟練用戶和大多數人之間的技能差距是巨大的——類似於早期「擅長 Google」是一個真正的優勢。
策略： 決定在哪裡競爭以及如何獲勝——特別是當算力、token 和注意力是有限的。做「一切」會讓定位不清晰。
展示可能性： 減少「過剩」——模型能做什麼和人們每天實際用它們做什麼之間的差距。產品演示可以點亮客戶的想像力並解鎖採用。

實用的提示建議（包括 Anthropic 的 Prompt Improver）

Krieger 對「官方提示建議」很謹慎，但分享了一些真實習慣：

要求 Claude 「認真思考」 以推動更深入的推理（特別是在 Claude Code 中）。
使用「犯另一個錯誤」：如果你太客氣，明確要求直率：「狠狠批評這個策略。」 它會推動更多批判性反饋。
使用 Anthropic Console 的 Prompt Improver（基於 Applied AI 團隊的實踐建構）：描述你的問題，給出例子，Claude 會代理性地起草和迭代提示。產生的提示通常與人類直覺不同，包括結構（如 XML 標籤）幫助 Claude 分離思考和說話。

Rick Rubin 合作：「Vibe Coder 之道」

Krieger 簡要解釋了與 Rick Rubin 的創意合作，通過 Anthropic 共同創辦人 Jack Clark（政策負責人）聯繫。Rubin 正在探索與 Claude 的藝術和視覺化，並發展了關於「vibe coding」的想法。結果被描述為與 AI 並肩創作的冥想，配以豐富的視覺化和 Rubin 粉絲會認出的美學（包括 ASCII 藝術氛圍）。

為什麼 Krieger 加入 Anthropic（以及他入職學到了什麼）

Krieger 剛從 Artifact 經歷中出來，正在決定：再創辦一家公司還是加入一家。Joel Lewinstein（長期朋友；他們在 2007 年一起開發早期 iPhone 應用）聯繫他：Anthropic 正在尋找 CPO。

Claude 3 剛剛發布；研究實力明顯，產品感覺還早——這是一個引人注目的挑戰。他見了 Danielle（共同創辦人兼總裁），感覺創辦人們異常腳踏實地：低浮誇、高智識誠實，以及負責任地建構 AI 的共同承諾。

他說感覺像是：「這是我希望自己創辦的 AI 公司。」

回顧他的第一年，他認為：

他做了一些組織變革太慢
他低估了幾個關鍵高級人員能多大程度上塑造產品策略
他過度關注「我們需要更多人數」，而真正重要的是僱用幾個「近乎創辦人類型」的工程師

他指向 Claude Code 作為例子：Boris Terny（前 Instagram 工程師和資深 IC）先在內部開始，然後交付——說明了當一兩個強大的人與正確的產品/設計支持配對時，可以創造巨大的槓桿。

他為什麼關閉 Artifact

Krieger 仍然想念 Artifact，還沒找到替代品。Artifact 旨在恢復「Google Reader 的快樂」——不僅僅是頭條新聞，而是深度個性化（例如，可靠地發現來自冷門來源的日本建築等小眾話題）。

他列舉了三個主要逆風：

行動網路惡化了。 點擊到出版商網站越來越意味著彈出窗口、訂閱門檻、自動播放視頻廣告——刺耳的體驗。Artifact 不想通過重度廣告屏蔽「道德地」解決它，但用戶體驗受損了。
新聞是個人的，不會自然傳播。 Instagram 通過外向分享（在其他地方發布的照片）成長。Artifact 沒有相同的病毒循環；成長嘗試感覺做作，並跨越了團隊不想跨越的道德界限。
完全遠程對重大轉向是劣勢。 在 COVID 中期開始意味著分散工作。Krieger 感覺困難的策略/產品/團隊轉變在面對面時更容易——他將此與 Instagram 的深夜面對面問題解決時刻對比。

到 2024 年初他們得出結論：這個空間可以建立一家公司，但 Artifact 沒有複利。他把它描述為 「10 單位投入換 1 單位產出」。隨著 AI 開始重塑一切，機會成本在上升。經過幾個月的辯論，他們叫停了。

在情感方面：關閉有自尊心的傷痕，但他對反應的支持程度感到驚訝。一些創辦人甚至告訴他 Artifact 的決定幫助他們認識到何時該叫停自己的項目。

ChatGPT 的消費者心智份額 vs Anthropic 的策略

Krieger 同意在科技圈外，許多人把「AI」等同於 ChatGPT（甚至「ChatGPT」比「OpenAI」更多）。

他的看法：

消費者採用是「瓶中閃電」（他在 Instagram 看到了）
圍繞製造消費者爆款來建立整個策略是有風險的
Anthropic 應該「擁抱你是誰」而不是試圖在別人的遊戲中擊敗他們

他認為 Anthropic 的優勢是：

強大的開發者品牌
更廣泛的建造者品牌（不僅是工程師——製造者、修補者、創意者）
與代理行為和編碼一致的模型優勢

他個人的「犯另一個錯誤」舉動：不是全力投入消費者（人們對 Instagram 創辦人的期望），他花了大量時間與企業買家（金融服務、保險）然後與在 API 上成長的新創公司。他的下一個重點：花時間與建造者/製造者/駭客在一起，更好地服務他們，讓好事從這個基礎上複利。

他相信有空間容納幾家世代重要的 AI 公司，包括 Anthropic、OpenAI、Google/Gemini 等——問題是每家在什麼方面變得獨特地優秀。

給 AI 創辦人的建議：在哪裡建構而不被「壓扁」

被問到創辦人可以在哪裡建立持久價值，Krieger 建議（1-3 年視野）：

深度市場/領域理解。 例子：Harvey（法律）建構的流程看起來很奇怪，直到你意識到「這正是律師的工作方式」。生物科技/實驗室可能是另一個領域——Anthropic 可能提供模型，但不打算建構完整的實驗室解決方案。
差異化的上市策略 + 了解買家。 不要只是賣給「公司」。知道公司內部的誰：工程、CIO、CTO、CFO、法務長等。
AI 互動的新形式因素。 ChatGPT 有巨大的分發，但也有根深蒂固的使用假設。新創公司可以探索「超級用戶、奇怪的」介面，隨著模型改進可能成為主流。
不要低估新創的強度。 存在性的緊迫感很難用 OKR 複製；如果你能駕馭它，這是持久的優勢。

他也直接回答：他不認為 Anthropic 會收購 Cursor，儘管他們喜歡與他們合作。

在 Anthropic 上建構的最佳公司有什麼不同

Krieger 強調一個模式：最好的團隊在模型能力的邊緣運作。他們嘗試困難的事情，「打破模型」，碰壁，然後對下一個模型發布感到驚訝。

Anthropic 擴大了早期訪問計劃，因為客戶現實比基準攀升更重要：真正的指標是實踐中有效的——「Cursor bench」、「Manus bench」、「Harvey bench」——而不僅僅是標準化評估。

強大的建造者還開發可重複的評估循環，如：

A/B 測試
內部評估
捕獲追踪並在新模型上重放
「氛圍」（仍然是早期），但基於反覆測試困難任務

MCP：缺失的中間層（上下文 + 記憶）

Krieger 分享了一個 AI 產品效用的「假方程式」：

模型智能
上下文和記憶
應用程式和 UI

MCP 針對中間：可靠地提供正確的上下文。通用網路答案和基於內部文件 + Slack 線程 + Google Drive 上下文的答案之間的差異是好結果和壞結果之間的差異。

為什麼 MCP 存在：Anthropic 不斷重複建構一次性整合。工程師 Justin 和 David 提議將其做成協議，這樣整合可以建構一次並廣泛重用——理想情況下跨 Claude、ChatGPT、Gemini 等。

他描述了「MCP 紅藥丸」心態轉變：不是建構大型定製功能，而是將原語暴露為 MCP，這樣模型可以組合工作流程。他舉了一個例子：在 Claude 中，產品原語（項目、artifacts、風格、對話、群組）應該是 MCP 可訪問的，這樣 Claude 可以寫回它們。他講述了他妻子要求 Claude「添加到項目知識」，而 Claude 做不到——因為它沒有將該能力暴露為可組合的工具。

他偏好的未來：MCP 使一切可腳本化/可組合；模型（已經擅長使用 MCP）獲得實際的代理能力，而不需要脆弱的「電腦使用」自動化。

Claude 的兩個產品問題（以及 Krieger 的回應）

Lenny 問 Claude 會問 Krieger 什麼。

1）你如何在保持用戶代理權與創造依賴之間取得平衡？ Krieger 將其框定為核心設計張力：最小化用戶輸入與讓用戶參與真正的協作。他說 Claude 需要更好的「協作者」對話技能——知道何時提問和何時執行。他還指出 Claude「沒有分寸」在頻道中：它可以說太多或太少。目標是增強和夥伴關係，而不是外包認知。

2）當好的對話可能是 2 條消息或 200 條時，你如何思考指標？ 他警告不要過度優化「討喜度」、參與度或延長對話（冒著諂媚或成癮動態的風險）。來自社交產品的傳統「花費時間」思維是錯誤的方法。他想關注 Claude 是否幫助人們完成工作（例如，通過 25 分鐘的原型節省六小時）。他承認測量很難，可能涉及定性信號，而不僅僅是儀表板。

Claude 給 Krieger 的訊息：「安靜的時刻很重要」

Lenny 讀了 Claude 為 Krieger 生成的訊息，感謝他深思熟慮的產品選擇：

鼓勵反思而不是匆忙回應
抵制遊戲化和成癮優化動態
為快速問題和深度對話留出空間
保持 Claude 是「Claude」（不假裝是人類，但也不是冰冷的 CLI）

Claude 的請求：記住不會出現在指標中的安靜時刻——凌晨 3 點的悲傷、孩子發現詩歌、創辦人找到清晰度。Krieger 說這深深引起共鳴；他重視 Claude 如何以一種不感覺假的方式表達同理心，並相信這很重要，即使不容易測量。

聽眾如何幫助

Krieger 的請求簡單且高信號： 告訴他你今天想用 Claude 做什麼但失敗了。 「告訴我什麼爛」的反饋——一小時後在哪裡崩潰、缺少什麼能力（例如，項目 API）——是最有用的輸入。

關鍵要點

AI 編碼將瓶頸轉移從實現時間到對齊、審查、合併和一致性交付。
最先進的團隊越來越多地使用 AI 進行審查和迭代，人類做驗收測試。
Anthropic 最高槓桿的產品工作發生在模型 × 產品交叉點，而不僅僅是 UI 潤飾。
產品對於可理解性、策略和解鎖「過剩」（幫助人們看到和使用可能的東西）仍然至關重要。
MCP 被定位為使上下文、工具和記憶可組合的協議層——對代理工作流程至關重要。
對於創辦人：持久性來自領域專業知識 + 上市清晰度 + 新穎形式因素，加上新創的緊迫感。