Dec 22, 2025

TradingAgents 深度解析：多代理 LLM 金融交易框架的突破性架構

0. 論文概述

TradingAgents: Multi-Agents LLM Financial Trading Framework 是一篇來自加州大學洛杉磯分校的研究論文，作者為 Yijia Xiao、Edward Sun、Di Luo 和 Wei Wang。該論文提出了一個由 LLM 驅動的多代理股票交易框架，模擬真實交易公司的組織結構。

核心創新：

組織結構模擬：五層代理架構模擬真實交易公司
辯論機制：多空研究員透過辯論形成投資觀點
混合通訊協議：結構化輸出 + 自然語言對話
風險管理層：三種風險偏好代理共同決策

實驗成果：在 AAPL、GOOGL、AMZN 三支股票上，累積報酬率最高達 26.62%，夏普比率達 8.21，大幅超越所有傳統策略基準。

1. 問題定義與動機

1.1 現有系統的關鍵缺陷

論文指出現有多代理金融系統存在兩大核心問題：

問題 1：組織結構不真實
├── 現有框架缺乏真實交易公司的層級結構
├── 未模擬分析師、研究員、交易員、風控的分工
└── 決策流程過於扁平化

問題 2：通訊效率低落
├── 純自然語言對話產生「電話效應」
├── 資訊在長對話中逐漸失真
└── 上下文窗口被冗餘資訊佔用

1.2 真實交易公司的組織架構

論文觀察到成功的交易公司通常具備以下特徵：

層級	角色	職責
分析層	基本面、技術面、情緒分析師	收集並分析特定類型數據
研究層	多空研究員	辯論形成投資論點
交易層	交易員	執行買賣決策
風控層	風險管理團隊	評估並調整倉位
決策層	基金經理	最終決策批准

TradingAgents 的設計目標是在 LLM 代理系統中重現這一結構。

2. 系統架構：五層組織結構

TradingAgents 採用五層組織架構，每一層都有明確的職責和輸出格式：

flowchart TD
  subgraph Tier1["第一層：分析師團隊"]
    direction LR
    FA["基本面分析師<br/>Fundamental Analyst"]
    SA["情緒分析師<br/>Sentiment Analyst"]
    NA["新聞分析師<br/>News Analyst"]
    TA["技術分析師<br/>Technical Analyst"]
  end

  subgraph Tier2["第二層：研究員團隊（辯論機制）"]
    direction LR
    Bull["多頭研究員<br/>Bullish Researcher"]
    Bear["空頭研究員<br/>Bearish Researcher"]
    Fac["調解者<br/>Facilitator"]
  end

  subgraph Tier3["第三層：交易員"]
    Trader["交易員代理<br/>評估分析 → 決定倉位"]
  end

  subgraph Tier4["第四層：風險管理團隊"]
    direction LR
    RS["風險追求型<br/>Risk-Seeking"]
    RN["風險中性型<br/>Risk-Neutral"]
    RC["風險保守型<br/>Risk-Conservative"]
  end

  subgraph Tier5["第五層：基金經理"]
    FM["基金經理<br/>最終決策"]
  end

  Tier1 --> Tier2
  Tier2 --> Tier3
  Tier3 --> Tier4
  Tier4 --> Tier5

2.1 第一層：分析師團隊

四個分析師代理並行執行，各自專注於不同數據類型：

基本面分析師 (Fundamental Analyst)

輸入數據：
├── 損益表 (Income Statements)
├── 資產負債表 (Balance Sheets)
├── 現金流量表 (Cash Flow Statements)
└── 內部人交易數據 (Insider Transactions)

分析任務：
├── 評估公司內在價值
├── 分析獲利能力趨勢
├── 識別財務健康警訊
└── 計算關鍵財務比率

情緒分析師 (Sentiment Analyst)

輸入數據：
├── Reddit 貼文與評論
├── Twitter/X 推文
└── 社群情緒分數

分析任務：
├── 量化市場情緒傾向
├── 識別情緒轉變點
└── 評估散戶投資者觀點

新聞分析師 (News Analyst)

輸入數據：
├── Bloomberg 新聞
├── Yahoo Finance 新聞
├── EODHD 新聞
└── FinnHub 新聞

分析任務：
├── 識別重大事件
├── 評估宏觀經濟影響
├── 追蹤產業動態
└── 判斷新聞情緒傾向

技術分析師 (Technical Analyst)

輸入數據：
├── OHLCV 歷史股價數據
└── 60+ 技術指標

計算指標：
├── MACD (移動平均收斂/發散)
├── RSI (相對強弱指數)
├── Bollinger Bands (布林通道)
├── SMA/EMA (簡單/指數移動平均)
└── 其他動量與趨勢指標

分析任務：
├── 識別價格趨勢
├── 發現支撐/阻力位
├── 生成買賣訊號
└── 評估動量強度

2.2 第二層：研究員辯論機制

這是 TradingAgents 最創新的設計之一 - 多輪辯論機制：

sequenceDiagram
  participant Bull as 多頭研究員
  participant Fac as 調解者
  participant Bear as 空頭研究員

  Note over Bull,Bear: 接收分析師報告

  loop 多輪辯論
    Bull->>Fac: 提出看漲論點<br/>支撐數據與邏輯
    Bear->>Fac: 提出看跌論點<br/>風險與警訊
    Fac->>Bull: 反駁要求
    Fac->>Bear: 反駁要求
    Bull->>Fac: 反駁空頭觀點
    Bear->>Fac: 反駁多頭觀點
  end

  Fac->>Fac: 綜合辯論內容
  Fac-->>Tier3: 輸出結構化投資建議

辯論流程設計

論點建立階段
- 多頭研究員：強調正面指標、成長潛力、競爭優勢
- 空頭研究員：指出風險因素、估值過高、潛在威脅
反駁階段
- 雙方針對對方論點提出質疑
- 引用數據支持自己立場
綜合階段
- 調解者整合雙方觀點
- 輸出平衡的投資建議

這種機制確保了決策的全面性，避免單一視角的盲點。

2.3 第三層：交易員代理

交易員接收研究員辯論結果，做出具體交易決策：

交易員職責：
├── 評估分析師與研究員的綜合見解
├── 決定交易方向 (買入/賣出/持有)
├── 確定交易時機
└── 計算建議倉位大小

輸出格式：
{
  "action": "BUY" | "SELL" | "HOLD",
  "confidence": 0.0 - 1.0,
  "position_size": percentage,
  "rationale": "詳細推理過程"
}

2.4 第四層：風險管理團隊

風險管理層由三個不同風險偏好的代理組成，形成風險審議機制：

代理類型	風險偏好	典型行為
風險追求型	高	傾向更大倉位、更激進操作
風險中性型	中	平衡風險與報酬
風險保守型	低	傾向減少曝險、保護資本

風險管理流程：
1. 接收交易員的初始決策
2. 三個代理各自評估風險
3. 討論並調整倉位大小
4. 設定停損/停利點位
5. 輸出風險調整後的最終建議

2.5 第五層：基金經理

基金經理作為最高決策者：

基金經理職責：
├── 審視風險管理團隊的討論結果
├── 考慮整體投資組合配置
├── 做出最終執行決策
└── 批准或否決交易建議

決策權限：
├── 可以接受建議原案
├── 可以調整倉位大小
├── 可以延遲執行
└── 可以否決整個交易

3. 通訊協議創新

3.1 混合通訊架構

TradingAgents 採用結構化輸出 + 自然語言對話的混合模式：

flowchart LR
  subgraph Structured["結構化輸出"]
    AR["分析師報告<br/>(JSON/Schema)"]
    TD["交易決策文件<br/>(標準格式)"]
  end

  subgraph NaturalLang["自然語言對話"]
    Debate["研究員辯論"]
    RiskDisc["風險討論"]
  end

  subgraph Global["全域狀態管理"]
    State["共享狀態存儲"]
    Query["直接查詢機制"]
  end

  Structured --> State
  NaturalLang --> State
  State --> Query

3.2 解決「電話效應」

傳統多代理系統的問題：

代理 A → 代理 B → 代理 C → 代理 D
    ↓         ↓         ↓
  原始資訊   部分失真   嚴重失真

TradingAgents 的解決方案：

全域狀態存儲
    ↑
代理 A 寫入 → 原始數據
代理 B 讀取 → 原始數據（非 A 的轉述）
代理 C 讀取 → 原始數據（非 B 的轉述）
代理 D 讀取 → 原始數據（非 C 的轉述）

每個代理都能直接查詢所需資訊，而非依賴前一個代理的轉述。

4. LLM 模型配置策略

4.1 策略性模型分配

TradingAgents 根據任務複雜度分配不同能力的模型：

任務類型	模型選擇	原因
分析師報告生成	o1-preview (深度思考)	需要深度推理
研究員辯論	o1-preview	需要複雜論證
交易決策	o1-preview	需要多因素權衡
數據檢索	gpt-4o-mini	簡單任務，降低成本
API 調用	gpt-4o-mini	工具使用
格式轉換	gpt-4o	表格轉文字

4.2 ReAct 框架整合

所有代理都遵循 ReAct (Reasoning + Acting) 框架：

ReAct 循環：
┌─────────────────────────────────────┐
│ 1. Thought: 分析當前狀態           │
│ 2. Action: 選擇並執行動作          │
│ 3. Observation: 觀察執行結果       │
│ 4. 重複直到任務完成                │
└─────────────────────────────────────┘

這確保了每個決策都有完整的推理鏈，提供可解釋性。

5. 實驗設計

5.1 測試配置

測試期間：2024年6月19日 - 2024年11月19日
測試資產：AAPL (Apple)、GOOGL (Google)、AMZN (Amazon)
交易頻率：每日決策
初始資金：$100,000（假設）

5.2 數據來源

數據類型	來源
歷史股價	OHLCV 日線數據
新聞	Bloomberg, Yahoo, EODHD, FinnHub
社群情緒	Reddit, Twitter/X
內部人交易	SEDI 數據庫
財務報表	季報/年報
技術指標	60+ 指標計算

5.3 基準策略

TradingAgents 與五種傳統策略進行比較：

策略	描述
Buy and Hold	等權重買入持有
MACD	移動平均收斂/發散策略
KDJ & RSI	隨機指標 + 相對強弱指數
ZMR	零均值回歸策略
SMA	簡單移動平均策略

6. 評估指標

6.1 四大績效指標

論文採用四個關鍵指標評估系統表現：

累積報酬率 (Cumulative Return, CR)

$CR = \frac{V_{end} - V_{start}}{V_{start}} \times 100\%$

衡量整個測試期間的總報酬。

年化報酬率 (Annualized Return, AR)

$AR = \left(\left(\frac{V_{end}}{V_{start}}\right)^{\frac{1}{N}} - 1\right) \times 100\%$

將報酬率標準化為年度，便於跨期間比較。

夏普比率 (Sharpe Ratio, SR)

$SR = \frac{\bar{R} - R_f}{\sigma}$

其中：

$\bar{R}$ = 平均報酬率
$R_f$ = 無風險利率
$\sigma$ = 報酬率標準差

衡量風險調整後報酬，是專業投資者最常用的指標。

最大回撤 (Maximum Drawdown, MDD)

$MDD = \frac{Peak - Trough}{Peak} \times 100\%$

衡量從高點到低點的最大跌幅，反映下行風險。

7. 實驗結果

7.1 AAPL (Apple) 表現

策略	累積報酬率	年化報酬率	夏普比率	最大回撤
TradingAgents	26.62%	77.34%	8.21	0.91%
Buy and Hold	17.18%	45.44%	3.53	13.04%
MACD	2.05%	5.05%	1.64	1.09%
KDJ & RSI	2.05%	5.05%	1.64	1.09%
ZMR	-1.35%	-3.26%	-0.21	8.53%
SMA	0.35%	0.85%	0.25	1.55%

關鍵發現：

累積報酬率超越 Buy and Hold 9.44 個百分點
夏普比率達到 8.21，是次佳策略的 2.3 倍
最大回撤僅 0.91%，遠低於 Buy and Hold 的 13.04%

7.2 GOOGL (Google) 表現

策略	累積報酬率	年化報酬率	夏普比率	最大回撤
TradingAgents	24.36%	69.20%	6.39	2.11%
Buy and Hold	6.23%	15.79%	2.31	8.86%
MACD	2.05%	5.05%	1.45	1.26%
KDJ & RSI	1.33%	3.26%	1.06	1.26%
ZMR	-1.61%	-3.88%	-0.47	6.19%
SMA	1.25%	3.07%	1.02	1.66%

7.3 AMZN (Amazon) 表現

策略	累積報酬率	年化報酬率	夏普比率	最大回撤
TradingAgents	23.21%	65.31%	5.60	2.10%
Buy and Hold	17.10%	45.17%	3.53	10.92%
MACD	2.04%	5.02%	1.48	1.09%
KDJ & RSI	2.04%	5.02%	1.48	1.09%
ZMR	0.45%	1.10%	0.12	8.99%
SMA	0.94%	2.31%	0.60	1.79%

7.4 綜合比較圖

累積報酬率比較 (%)
────────────────────────────────────────────────
AAPL TradingAgents  ████████████████████████████  26.62%
AAPL Buy&Hold       █████████████████             17.18%
────────────────────────────────────────────────
GOOGL TradingAgents ██████████████████████████    24.36%
GOOGL Buy&Hold      ██████                         6.23%
────────────────────────────────────────────────
AMZN TradingAgents  █████████████████████████     23.21%
AMZN Buy&Hold       █████████████████             17.10%
────────────────────────────────────────────────

夏普比率比較
────────────────────────────────────────────────
AAPL TradingAgents  ████████████████████████████████  8.21
AAPL Buy&Hold       ██████████████                    3.53
────────────────────────────────────────────────
GOOGL TradingAgents ██████████████████████████        6.39
GOOGL Buy&Hold      ████████                          2.31
────────────────────────────────────────────────
AMZN TradingAgents  ██████████████████████            5.60
AMZN Buy&Hold       ██████████████                    3.53
────────────────────────────────────────────────

8. 關鍵發現與分析

8.1 風險管理的有效性

最令人印象深刻的結果是風險控制能力：

最大回撤比較：

TradingAgents   Buy and Hold    改善幅度
──────────────────────────────────────────
AAPL:  0.91%    13.04%         減少 93%
GOOGL: 2.11%     8.86%         減少 76%
AMZN:  2.10%    10.92%         減少 81%

即使在獲取更高報酬的同時，TradingAgents 的最大回撤始終控制在 2.11% 以下。

這證明了風險管理團隊的三代理審議機制確實有效：

風險追求型代理推動收益
風險保守型代理保護資本
風險中性型代理平衡兩者

8.2 波動市場的適應性

測試期間（2024年6月-11月）包含多個市場波動事件：

美國大選前後的不確定性
科技股估值調整
利率政策變化

TradingAgents 在這種波動環境中表現突出，顯示其適應性強於規則型策略。

8.3 跨資產一致性

三支測試股票涵蓋不同特性：

AAPL：成熟大型科技股
GOOGL：搜尋/廣告主導
AMZN：電商/雲端混合

TradingAgents 在三者上都取得優異表現，顯示框架具有良好的泛化能力。

9. 可解釋性優勢

相較於深度學習黑盒模型，TradingAgents 的每個決策都有完整的推理鏈：

決策追蹤範例（2024年11月19日）：
─────────────────────────────────────────────────

[新聞分析師]
分析了 5 則最新新聞，整體情緒偏正面。
重點事件：iPhone 銷量超預期報導。

[基本面分析師]
Q4 營收成長 6%，毛利率維持 45%。
現金流充沛，無重大財務警訊。

[技術分析師]
RSI 55 (中性)，MACD 呈現黃金交叉。
價格站上 20 日均線，趨勢偏多。

[情緒分析師]
Reddit 情緒分數 0.72 (正面)。
散戶投資者看法樂觀。

[多頭研究員]
基本面穩健 + 技術面轉強 + 情緒正面。
建議買入，目標價位 $195。

[空頭研究員]
估值偏高，P/E 達 30x。
宏觀利率環境仍有壓力。

[調解者綜合]
正面因素多於負面，但需控制倉位。
建議：溫和買入，倉位 15%。

[交易員決策]
BUY | 信心度 0.72 | 建議倉位 15%

[風險管理審議]
風險追求：同意 15%
風險中性：建議降至 12%
風險保守：建議降至 10%
最終共識：12%

[基金經理]
批准 12% 倉位買入決策。
設定 5% 停損。
─────────────────────────────────────────────────

這種透明度使交易者能夠：

理解每個決策的邏輯
識別分析中的潛在問題
調整代理參數

10. 技術架構特點

10.1 無 GPU 需求

系統運行要求：
├── 計算資源：無需 GPU
├── 運行方式：純 API 調用
├── 可擴展性：易於水平擴展
└── 成本模型：按 API 調用計費

這使得系統易於部署和維護，無需昂貴的硬體投資。

10.2 模組化設計

模組替換靈活性：
├── 可更換底層 LLM（GPT-4 → Claude → Gemini）
├── 可添加新的分析師類型
├── 可調整辯論輪數
├── 可修改風險偏好分佈
└── 可整合新的數據源

11. 局限性與未來方向

11.1 當前局限

論文坦承幾個局限性：

測試期間有限
- 僅測試 5 個月
- 未經歷完整牛熊週期
資產類別單一
- 僅測試三支美股
- 未涵蓋其他市場/資產
模擬環境
- 未進行實盤交易
- 未考慮滑點和交易成本
單一持倉
- 每次只交易單一股票
- 未實現投資組合管理

11.2 未來研究方向

論文建議的未來工作：
├── 實盤交易部署與驗證
├── 擴展至更多資產類別
│   ├── 債券
│   ├── 商品
│   ├── 加密貨幣
│   └── 外匯
├── 長期歷史回測（5-10 年）
├── 添加更多專業代理角色
│   ├── 量化分析師
│   ├── 宏觀經濟學家
│   └── 產業專家
├── 即時數據整合
└── 投資組合層級管理

12. 與其他 Agent 框架的比較

12.1 架構比較

特性	TradingAgents	FinGPT	BloombergGPT	FinAgent
多代理架構	五層組織	單代理	單代理	簡單多代理
辯論機制	多空辯論	無	無	無
風險管理	三代理審議	簡單規則	無	基本
可解釋性	完整推理鏈	有限	有限	中等
組織模擬	真實公司結構	無	無	部分

12.2 設計哲學差異

TradingAgents 的獨特定位：
├── 強調「組織智慧」而非「個體智慧」
├── 透過結構化衝突（辯論）提升決策品質
├── 多層審議機制降低風險
└── 完整模擬真實交易公司運作

13. 實際應用考量

13.1 部署建議

如果要將 TradingAgents 應用於實際交易：

部署檢查清單：
├── [ ] API 成本估算（大量 LLM 調用）
├── [ ] 延遲敏感度評估
├── [ ] 數據源可靠性確認
├── [ ] 備援機制設計
├── [ ] 監控與告警系統
├── [ ] 人工審核介入點
└── [ ] 合規性檢查

13.2 成本結構

預估成本組成：
├── LLM API 調用
│   ├── o1-preview：高成本，用於核心推理
│   ├── gpt-4o：中成本，用於格式轉換
│   └── gpt-4o-mini：低成本，用於簡單任務
├── 數據訂閱
│   ├── 新聞 API
│   ├── 財務數據 API
│   └── 社群情緒 API
└── 基礎設施
    └── 伺服器/雲端運算

14. 結語

TradingAgents 論文展示了組織結構設計在多代理系統中的重要性。其主要貢獻：

創新的五層架構：成功模擬真實交易公司組織
辯論機制：透過結構化衝突提升決策品質
混合通訊協議：解決純對話系統的資訊失真問題
優異實驗結果：在風險調整報酬上大幅超越基準

這篇論文對金融 AI Agent 的發展有重要啟示：

不只是讓 AI 更聰明，而是讓 AI 組織更像成功的人類組織。

對於有興趣構建金融交易系統的開發者，TradingAgents 的架構設計值得深入研究和借鑒。