第 14 課:クオンツにおけるLLMの応用
LLMは最も強力な研究アシスタントだが、最悪のトレーダーである。得意なことをさせよう。
GPTトレーダーの幻想と現実
2023年、あるチームが実験を行った:GPT-4に直接トレーディング判断をさせる。
彼らはGPT-4に以下を与えた:
- 過去20日間の価格データ
- 最新の金融ニュース
- 現在のポジション
そして「買う、売る、保持のどれにすべきか?」と尋ねた。
3ヶ月後の結果:
| 指標 | GPT-4戦略 | ランダム戦略 | S&P 500 |
|---|---|---|---|
| リターン | -12% | -3% | +8% |
| シャープレシオ | -0.8 | -0.2 | 0.5 |
| 最大ドローダウン | 25% | 18% | 10% |
GPT-4はランダム戦略さえ下回った。
なぜ失敗したのか?
- 幻覚問題: GPT-4は存在しない「市場パターン」を作り出す
- 数学能力の弱さ: リターンやボラティリティを正確に計算できない
- 記憶がない: 各呼び出しが独立しており、経験を蓄積できない
- 高レイテンシ: 1回の推論に数秒かかり、高速で動く市場を逃す
- 再現性がない: 同じ入力でも異なる出力を生成する可能性がある
しかし同じ期間中、GPT-4を決算分析に使用したチームは報告した:
- 決算解釈の品質が3倍向上
- 調査レポート生成時間が4時間から30分に短縮
- ニュースセンチメント分析の精度85%
結論: LLMは直接取引には適していないが、研究と分析には強力である。
14.1 LLMの正しい役割
LLMができること
| 能力 | クオンツ投資への応用 | 価値評価 |
|---|---|---|
| テキスト理解 | 決算解釈、ニュース分析 | 5/5 |
| 情報抽出 | 10-Kから主要指標を抽出 | 5/5 |
| レポート生成 | 戦略診断レポート、事後分析要約 | 4/5 |
| コード生成 | バックテストコードの作成支援 | 4/5 |
| 知識Q&A | 金融概念の説明 | 3/5 |
LLMができないこと
| 試み | 失敗する理由 | 代替手段 |
|---|---|---|
| 直接価格予測 | リアルタイムデータにアクセスできず、計算が不正確 | 従来のMLモデル |
| リアルタイム取引判断 | レイテンシが大きすぎ、再現性がない | ルール + MLシステム |
| 正確な計算 | 大きな数字でのエラー率が高い | 専用計算モジュール |
| 長期記憶 | コンテキストが制限され、蓄積できない | 外部ナレッジベース |
核心原則:LLMを強化レイヤーとして
14.2 ニュースとセンチメント分析
応用シナリオ
金融ニュースから取引関連情報を抽出:
| ニュースタイプ | 抽出内容 | クオンツ投資での価値 |
|---|---|---|
| 決算発表 | 予想の達成/未達成、ガイダンスの変更 | イベントドリブンシグナル |
| 製品ニュース | 新製品発売、リコール、提携 | ファンダメンタルの変化 |
| マクロ政策 | 金利決定、規制変更 | システミックリスク |
| アナリスト意見 | レーティング変更、目標価格調整 | センチメント指標 |
センチメント分析の例
入力ニュース:
Appleは四半期売上高1230億ドルを報告し、ウォール街の予想1180億ドルを上回った。しかし、中国でのiPhone販売はHuaweiとの競争激化により前年比15%減少した。
LLM抽出:
{
"company": "AAPL",
"event_type": "earnings",
"sentiment_overall": 0.6,
"key_points": [
{"topic": "revenue", "sentiment": 0.8, "value": "beat by 4%"},
{"topic": "china_iphone", "sentiment": -0.7, "value": "-15% YoY"}
],
"trading_signal": "mixed",
"confidence": 0.7
}
使用方法:
- 直接取引せず、シグナルの入力特徴の1つとして使用
- 価格モメンタム、テクニカル指標と組み合わせる
- 履歴データを使用してLLMセンチメントの予測力を検証(バックテスト)
プロンプトエンジニアリングの要点
悪いプロンプト:
このニュースは強気ですか弱気ですか?
良いプロンプト:
あなたは金融アナリストです。以下のニュースを分析してください:
[ニュース内容]
以下の形式で出力してください:
1. 関連する企業/資産(ティッカーシンボル)
2. イベントタイプ(決算/製品/政策/その他)
3. 全体的なセンチメントスコア(-1から1、-1は非常にネガティブ、1は非常にポジティブ)
4. 3つの主要情報ポイント、それぞれにトピック、センチメントスコア、具体的な値
5. 短期的な価格への影響の可能性(上昇/下降/中立)
6. 信頼度(0から1)
JSON形式のみで出力し、説明は不要です。
14.3 決算レポート自動化
10-K/10-Q情報抽出
米国の公開企業の年次報告書(10-K)と四半期報告書(10-Q)には膨大な情報が含まれているが、通常100ページを超える。
LLMは自動的に抽出できる:
| 抽出内容 | 場所 | 用途 |
|---|---|---|
| 売上成長 | 財務諸表 | ファンダメンタルスクリーニング |
| 粗利益率の変化 | MD&A | 収益性トレンド |
| リスク要因の変化 | リスク要因 | リスク警告 |
| 経営陣の議論のトーン | MD&A | センチメント指標 |
| 訴訟の進展 | 法的手続き | イベントリスク |
構造化抽出プロセス
+-------------------+
| 10-K PDFダウンロード |
+--------+----------+
|
v
+-------------------+
| PDF -> テキスト |
+--------+----------+
|
v
+-------------------+
| セグメント化(セクション別) |
+--------+----------+
|
v
+-------------------+
| LLMでセグメント毎に抽出 | <- コンテキストオーバーフローを避けるため各セグメントを個別に処理
+--------+----------+
|
v
+-------------------+
| 構造化データを保存 | -> バックテスト用データベース
+-------------------+
決算トーン変化の検出
連続する決算レポート間のMD&Aトーン変化を比較:
| 前回の声明 | 現在の声明 | シグナル |
|---|---|---|
| "成長を期待" | "慎重ながら楽観的" | トーン弱化 |
| "課題に直面" | "重大な課題に直面" | リスク増大 |
| "探索中" | "開始した" | 進展加速 |
注意: トーン変化は相対的指標 - 履歴比較があって初めて意味がある。
14.4 調査レポート生成
戦略診断レポート
LLMに事後分析レポートの作成を手伝わせる:
入力:
戦略名:モメンタム戦略 v2.3
期間:2024-01-01から2024-03-31
パフォーマンスデータ:
- リターン:+8.5%
- ベンチマークリターン:+12.0%
- 最大ドローダウン:-6.2%
- シャープレシオ:1.2
- 回転率:420%
取引詳細:(CSVを添付)
LLM出力:
# モメンタム戦略 v2.3 2024年Q1事後分析
## 要約
戦略は2024年Q1にベンチマークを3.5%下回った。主に2月のレンジ相場期間中の
連続ストップロスによる。
## 根本的な問題診断
1. **高い回転コスト**: 420%の回転率は約2.1%の年間取引コストを意味する
2. **2月の異常**: 2月のリターン-4.3%、全ドローダウンの70%
3. **セクター集中**: テック株が保有の65%、多様化の欠如
## 改善提案
1. 保有期間フィルターを追加して短期ノイズ取引を削減
2. ADX < 20の場合にポジション削減または戦略停止
3. セクター多様化制約を追加、単一セクター < 30%
## 次のステップ
- [ ] ADXフィルター追加後のパフォーマンスをバックテスト
- [ ] 最小保有期間 = 3日の効果をテスト
レポート品質管理
LLM生成レポートには検証が必要:
| チェック項目 | リスク | 対応 |
|---|---|---|
| データ精度 | LLMがデータを捏造する可能性 | ソースから主要データを抽出、LLMに計算させない |
| 因果関係エラー | 相関を因果関係と誤解 | 主要結論を人間がレビュー |
| 重要情報の欠落 | 部分的な入力のみを見る | すべての入力次元がカバーされているか確認 |
14.5 LLM安全制約
なぜハード制約が必要か?
LLM出力は信頼できない。直接取引に使用すると:
| リスク | シナリオ | 結果 |
|---|---|---|
| 幻覚 | 「データに基づき、フルポジション買いを推奨」 | 実際のデータは裏付けない |
| 計算エラー | 「リターン15%」が実際には1.5% | 誤った判断 |
| 一貫性の欠如 | 同じ質問、異なる答え | 再現性がない |
ハード制約設計
監査証跡
すべてのLLM呼び出しをログに記録する必要がある:
{
"timestamp": "2024-01-15 09:30:00",
"input_prompt": "AAPL決算を分析...",
"output_raw": "...",
"output_parsed": {"sentiment": 0.6, ...},
"model": "gpt-4-0125-preview",
"temperature": 0.1,
"action_taken": "シグナルモデルへの特徴入力として使用",
"final_decision": "取引は実行されず"
}
目的:
- LLMが判断を誤導したかどうかの事後分析
- LLMパフォーマンスの低下を検出して適時調整
- 規制遵守
14.6 LLM Agentアーキテクチャ
マルチエージェントシステムでの位置
+-------------------------------------------------------------+
| Meta Agent |
+----------------------------+--------------------------------+
|
+------------------------+------------------------+
| | |
v v v
+---------+ +---------+ +---------+
| LLM | | Signal | | Risk |
|Research | --------> | Agent | -----------> | Agent |
| Agent | 入力 +---------+ +---------+
+---------+ センチメント
特徴
LLM Agentの位置:
- 重要な判断パス上にはない
- 「参考情報」のみを提供
- 下流のAgentが採用するかどうかを決定
LLM Agentの責任境界
| できること | できないこと |
|---|---|
| ニュースセンチメント分析 | 直接売買シグナルを生成 |
| 決算データ抽出 | ポジションサイズを計算 |
| レポートドラフト生成 | リスク制御パラメータを変更 |
| 戦略ロジックの説明 | 注文を執行 |
| 異常イベントのフラグ | ストップロスを無効化 |
LLM能力境界 LLMは優れた研究アナリストだが、取引判断に直接参加すべきではない。年次報告書の解析、決算説明会のトーン変化検出、会計上の不正のフラグ、ファクター仮説の生成は可能だが、注文の生成、ポジションサイズの計算、リスクパラメータの変更、取引の執行はできない。この境界はアーキテクチャレベルで強制する必要がある:LLM出力はシグナル入力としてのみ機能し、執行やリスク制御パスに直接到達することはない。完全な境界表についてはレッスン22を参照。
14.7 実践的考慮事項
コスト管理
| シナリオ | 呼び出し頻度 | コスト管理戦略 |
|---|---|---|
| リアルタイムニュース分析 | ニュース項目毎 | ルールで無関係なニュースを事前フィルタ |
| 決算分析 | 四半期毎 | コストは許容範囲 |
| 日次レポート生成 | 毎日 | キャッシュを使用して重複呼び出しを回避 |
| リアルタイムQ&A | オンデマンド | 1日の呼び出し回数を制限 |
レイテンシ管理
| 応用 | 許容レイテンシ | 戦略 |
|---|---|---|
| イベントドリブン取引 | < 1秒 | LLMを使用せず、ルールを使用 |
| 日次戦略 | 数分 | LLMを使用可能、バッチ処理 |
| 研究分析 | 数時間 | 自由に使用 |
モデル選択
| タスク | 推奨モデル | 理由 |
|---|---|---|
| センチメント分析 | GPT-3.5 / Claude Haiku | シンプルなタスク、低コスト |
| 決算分析 | GPT-4 / Claude Opus | 深い理解が必要 |
| コード生成 | Claude Opus / GPT-4 | 精度が必要 |
| 単純な分類 | ファインチューニングされた小型モデル | 最低コスト、最小レイテンシ |
レッスン成果物
このレッスンを完了すると、以下を得られます:
- クオンツ投資におけるLLMの役割の明確な理解 - できることとできないことを知る
- センチメント分析能力 - ニュース/決算LLM分析ワークフローを設計できる
- 安全制約の認識 - なぜハード制約が必要かを理解
- アーキテクチャ統合方法 - LLM Agentがマルチエージェントシステムにどう適合するかを知る
受け入れ基準
| チェックポイント | 受け入れ基準 | 自己テスト方法 |
|---|---|---|
| 役割理解 | LLMができること・できないことを各3つ挙げられる | メモなしでリスト化 |
| プロンプト設計 | 構造化されたセンチメント分析プロンプトを書ける | ニュースを与えてプロンプト設計 |
| 安全制約 | LLMが直接取引すべきでない理由を説明できる | リスクを3つリスト化 |
| アーキテクチャの位置づけ | マルチAgent アーキテクチャ図にLLMの位置をマークできる | 図を描く |
設計演習:
LLMニュース分析ワークフローを以下の要件で設計:
- 1日500件の金融ニュース項目を処理
- レイテンシ要件 < 1時間ですべて完了
- コスト予算 < $50/日
- 日次戦略向けのセンチメント特徴を出力
参考解答を見る
ワークフロー設計:
-
事前フィルタリング(ルール):
- キーワードフィルター、保有銘柄のニュースのみを保持
- 100項目まで絞り込むと予想
-
バッチ処理:
- GPT-3.5-turboを使用($0.002/1Kトークン)
- 各ニュース約500トークン入力 + 200トークン出力
- 100項目 x 700トークン x $0.002/1K = $0.14
-
並列呼び出し:
- 10並列呼び出し
- 各約3秒、100項目で合計約30秒
-
出力形式:
{ "symbol": "AAPL", "sentiment": 0.6, "event_type": "earnings", "key_point": "beat expectations" } -
後処理:
- 銘柄毎に複数のニュース項目を集約
- 加重平均センチメントスコアを計算
- 特徴データベースに保存
コスト見積もり:
- $0.14/日 x 30日 = $4.2/月
- $50/日の予算を大きく下回る
レッスンまとめ
- クオンツ投資におけるLLMの正しい役割を理解:研究アシスタント、トレーダーではない
- ニュースセンチメント分析と決算情報抽出の応用をマスター
- LLMリスクを認識:幻覚、計算エラー、再現性なし
- 安全制約の設計方法を学習:ハード制約レイヤー + 監査証跡
- マルチエージェントアーキテクチャにおけるLLM Agentの位置を理解
さらに読む
- 背景:クオンツ取引におけるLLM研究 - 学術的最前線
- GPT-4 Technical Report - LLM能力境界の理解
次のレッスン予告
レッスン15:リスク管理とマネーマネジメント
最高の戦略でも損失は出る - 鍵は「どれだけの損失が許容できるか」である。Risk Agentは拒否権を持ち、資本を守る最後の防衛線である。次のレッスンではリスク管理の核心ロジックを深く掘り下げる。