第 14 課：クオンツにおけるLLMの応用

LLMは最も強力な研究アシスタントだが、最悪のトレーダーである。得意なことをさせよう。

GPTトレーダーの幻想と現実

2023年、あるチームが実験を行った：GPT-4に直接トレーディング判断をさせる。

彼らはGPT-4に以下を与えた：

過去20日間の価格データ
最新の金融ニュース
現在のポジション

そして「買う、売る、保持のどれにすべきか？」と尋ねた。

3ヶ月後の結果:

指標	GPT-4戦略	ランダム戦略	S&P 500
リターン	-12%	-3%	+8%
シャープレシオ	-0.8	-0.2	0.5
最大ドローダウン	25%	18%	10%

GPT-4はランダム戦略さえ下回った。

なぜ失敗したのか？

幻覚問題: GPT-4は存在しない「市場パターン」を作り出す
数学能力の弱さ: リターンやボラティリティを正確に計算できない
記憶がない: 各呼び出しが独立しており、経験を蓄積できない
高レイテンシ: 1回の推論に数秒かかり、高速で動く市場を逃す
再現性がない: 同じ入力でも異なる出力を生成する可能性がある

しかし同じ期間中、GPT-4を決算分析に使用したチームは報告した：

決算解釈の品質が3倍向上
調査レポート生成時間が4時間から30分に短縮
ニュースセンチメント分析の精度85%

結論: LLMは直接取引には適していないが、研究と分析には強力である。

14.1 LLMの正しい役割

LLMができること

能力	クオンツ投資への応用	価値評価
テキスト理解	決算解釈、ニュース分析	5/5
情報抽出	10-Kから主要指標を抽出	5/5
レポート生成	戦略診断レポート、事後分析要約	4/5
コード生成	バックテストコードの作成支援	4/5
知識Q&A	金融概念の説明	3/5

LLMができないこと

試み	失敗する理由	代替手段
直接価格予測	リアルタイムデータにアクセスできず、計算が不正確	従来のMLモデル
リアルタイム取引判断	レイテンシが大きすぎ、再現性がない	ルール + MLシステム
正確な計算	大きな数字でのエラー率が高い	専用計算モジュール
長期記憶	コンテキストが制限され、蓄積できない	外部ナレッジベース

核心原則：LLMを強化レイヤーとして

14.2 ニュースとセンチメント分析

応用シナリオ

金融ニュースから取引関連情報を抽出：

ニュースタイプ	抽出内容	クオンツ投資での価値
決算発表	予想の達成/未達成、ガイダンスの変更	イベントドリブンシグナル
製品ニュース	新製品発売、リコール、提携	ファンダメンタルの変化
マクロ政策	金利決定、規制変更	システミックリスク
アナリスト意見	レーティング変更、目標価格調整	センチメント指標

センチメント分析の例

入力ニュース:

Appleは四半期売上高1230億ドルを報告し、ウォール街の予想1180億ドルを上回った。しかし、中国でのiPhone販売はHuaweiとの競争激化により前年比15%減少した。

LLM抽出:

{
  "company": "AAPL",
  "event_type": "earnings",
  "sentiment_overall": 0.6,
  "key_points": [
    {"topic": "revenue", "sentiment": 0.8, "value": "beat by 4%"},
    {"topic": "china_iphone", "sentiment": -0.7, "value": "-15% YoY"}
  ],
  "trading_signal": "mixed",
  "confidence": 0.7
}

使用方法:

直接取引せず、シグナルの入力特徴の1つとして使用
価格モメンタム、テクニカル指標と組み合わせる
履歴データを使用してLLMセンチメントの予測力を検証（バックテスト）

プロンプトエンジニアリングの要点

悪いプロンプト:

このニュースは強気ですか弱気ですか？

良いプロンプト:

あなたは金融アナリストです。以下のニュースを分析してください：
[ニュース内容]

以下の形式で出力してください：
1. 関連する企業/資産（ティッカーシンボル）
2. イベントタイプ（決算/製品/政策/その他）
3. 全体的なセンチメントスコア（-1から1、-1は非常にネガティブ、1は非常にポジティブ）
4. 3つの主要情報ポイント、それぞれにトピック、センチメントスコア、具体的な値
5. 短期的な価格への影響の可能性（上昇/下降/中立）
6. 信頼度（0から1）

JSON形式のみで出力し、説明は不要です。

14.3 決算レポート自動化

10-K/10-Q情報抽出

米国の公開企業の年次報告書（10-K）と四半期報告書（10-Q）には膨大な情報が含まれているが、通常100ページを超える。

LLMは自動的に抽出できる:

抽出内容	場所	用途
売上成長	財務諸表	ファンダメンタルスクリーニング
粗利益率の変化	MD&A	収益性トレンド
リスク要因の変化	リスク要因	リスク警告
経営陣の議論のトーン	MD&A	センチメント指標
訴訟の進展	法的手続き	イベントリスク

構造化抽出プロセス

+-------------------+
|  10-K PDFダウンロード |
+--------+----------+
         |
         v
+-------------------+
|   PDF -> テキスト   |
+--------+----------+
         |
         v
+-------------------+
| セグメント化（セクション別） |
+--------+----------+
         |
         v
+-------------------+
| LLMでセグメント毎に抽出 |  <- コンテキストオーバーフローを避けるため各セグメントを個別に処理
+--------+----------+
         |
         v
+-------------------+
| 構造化データを保存 | -> バックテスト用データベース
+-------------------+

決算トーン変化の検出

連続する決算レポート間のMD&Aトーン変化を比較：

前回の声明	現在の声明	シグナル
"成長を期待"	"慎重ながら楽観的"	トーン弱化
"課題に直面"	"重大な課題に直面"	リスク増大
"探索中"	"開始した"	進展加速

注意: トーン変化は相対的指標 - 履歴比較があって初めて意味がある。

14.4 調査レポート生成

戦略診断レポート

LLMに事後分析レポートの作成を手伝わせる：

入力:

戦略名：モメンタム戦略 v2.3
期間：2024-01-01から2024-03-31
パフォーマンスデータ：
  - リターン：+8.5%
  - ベンチマークリターン：+12.0%
  - 最大ドローダウン：-6.2%
  - シャープレシオ：1.2
  - 回転率：420%

取引詳細：（CSVを添付）

LLM出力:

# モメンタム戦略 v2.3 2024年Q1事後分析

## 要約
戦略は2024年Q1にベンチマークを3.5%下回った。主に2月のレンジ相場期間中の
連続ストップロスによる。

## 根本的な問題診断
1. **高い回転コスト**: 420%の回転率は約2.1%の年間取引コストを意味する
2. **2月の異常**: 2月のリターン-4.3%、全ドローダウンの70%
3. **セクター集中**: テック株が保有の65%、多様化の欠如

## 改善提案
1. 保有期間フィルターを追加して短期ノイズ取引を削減
2. ADX < 20の場合にポジション削減または戦略停止
3. セクター多様化制約を追加、単一セクター < 30%

## 次のステップ
- [ ] ADXフィルター追加後のパフォーマンスをバックテスト
- [ ] 最小保有期間 = 3日の効果をテスト

レポート品質管理

LLM生成レポートには検証が必要：

チェック項目	リスク	対応
データ精度	LLMがデータを捏造する可能性	ソースから主要データを抽出、LLMに計算させない
因果関係エラー	相関を因果関係と誤解	主要結論を人間がレビュー
重要情報の欠落	部分的な入力のみを見る	すべての入力次元がカバーされているか確認

14.5 LLM安全制約

なぜハード制約が必要か？

LLM出力は信頼できない。直接取引に使用すると：

リスク	シナリオ	結果
幻覚	「データに基づき、フルポジション買いを推奨」	実際のデータは裏付けない
計算エラー	「リターン15%」が実際には1.5%	誤った判断
一貫性の欠如	同じ質問、異なる答え	再現性がない

ハード制約設計

監査証跡

すべてのLLM呼び出しをログに記録する必要がある：

{
  "timestamp": "2024-01-15 09:30:00",
  "input_prompt": "AAPL決算を分析...",
  "output_raw": "...",
  "output_parsed": {"sentiment": 0.6, ...},
  "model": "gpt-4-0125-preview",
  "temperature": 0.1,
  "action_taken": "シグナルモデルへの特徴入力として使用",
  "final_decision": "取引は実行されず"
}

目的:

LLMが判断を誤導したかどうかの事後分析
LLMパフォーマンスの低下を検出して適時調整
規制遵守

14.6 LLM Agentアーキテクチャ

マルチエージェントシステムでの位置

+-------------------------------------------------------------+
|                      Meta Agent                              |
+----------------------------+--------------------------------+
                             |
    +------------------------+------------------------+
    |                        |                        |
    v                        v                        v
+---------+            +---------+              +---------+
|  LLM    |            | Signal  |              |  Risk   |
|Research |  --------> |  Agent  | -----------> |  Agent  |
|  Agent  |   入力      +---------+              +---------+
+---------+  センチメント
             特徴

LLM Agentの位置：
  - 重要な判断パス上にはない
  - 「参考情報」のみを提供
  - 下流のAgentが採用するかどうかを決定

LLM Agentの責任境界

できること	できないこと
ニュースセンチメント分析	直接売買シグナルを生成
決算データ抽出	ポジションサイズを計算
レポートドラフト生成	リスク制御パラメータを変更
戦略ロジックの説明	注文を執行
異常イベントのフラグ	ストップロスを無効化

LLM能力境界 LLMは優れた研究アナリストだが、取引判断に直接参加すべきではない。年次報告書の解析、決算説明会のトーン変化検出、会計上の不正のフラグ、ファクター仮説の生成は可能だが、注文の生成、ポジションサイズの計算、リスクパラメータの変更、取引の執行はできない。この境界はアーキテクチャレベルで強制する必要がある：LLM出力はシグナル入力としてのみ機能し、執行やリスク制御パスに直接到達することはない。完全な境界表についてはレッスン22を参照。

14.7 実践的考慮事項

コスト管理

シナリオ	呼び出し頻度	コスト管理戦略
リアルタイムニュース分析	ニュース項目毎	ルールで無関係なニュースを事前フィルタ
決算分析	四半期毎	コストは許容範囲
日次レポート生成	毎日	キャッシュを使用して重複呼び出しを回避
リアルタイムQ&A	オンデマンド	1日の呼び出し回数を制限

レイテンシ管理

応用	許容レイテンシ	戦略
イベントドリブン取引	< 1秒	LLMを使用せず、ルールを使用
日次戦略	数分	LLMを使用可能、バッチ処理
研究分析	数時間	自由に使用

モデル選択

タスク	推奨モデル	理由
センチメント分析	GPT-3.5 / Claude Haiku	シンプルなタスク、低コスト
決算分析	GPT-4 / Claude Opus	深い理解が必要
コード生成	Claude Opus / GPT-4	精度が必要
単純な分類	ファインチューニングされた小型モデル	最低コスト、最小レイテンシ

レッスン成果物

このレッスンを完了すると、以下を得られます：

クオンツ投資におけるLLMの役割の明確な理解 - できることとできないことを知る
センチメント分析能力 - ニュース/決算LLM分析ワークフローを設計できる
安全制約の認識 - なぜハード制約が必要かを理解
アーキテクチャ統合方法 - LLM Agentがマルチエージェントシステムにどう適合するかを知る

受け入れ基準

チェックポイント	受け入れ基準	自己テスト方法
役割理解	LLMができること・できないことを各3つ挙げられる	メモなしでリスト化
プロンプト設計	構造化されたセンチメント分析プロンプトを書ける	ニュースを与えてプロンプト設計
安全制約	LLMが直接取引すべきでない理由を説明できる	リスクを3つリスト化
アーキテクチャの位置づけ	マルチAgent アーキテクチャ図にLLMの位置をマークできる	図を描く

設計演習:

LLMニュース分析ワークフローを以下の要件で設計：

1日500件の金融ニュース項目を処理
レイテンシ要件 < 1時間ですべて完了
コスト予算 < $50/日
日次戦略向けのセンチメント特徴を出力

参考解答を見る

ワークフロー設計:

事前フィルタリング（ルール）：
- キーワードフィルター、保有銘柄のニュースのみを保持
- 100項目まで絞り込むと予想
バッチ処理：
- GPT-3.5-turboを使用（$0.002/1Kトークン）
- 各ニュース約500トークン入力 + 200トークン出力
- 100項目 x 700トークン x $0.002/1K = $0.14
並列呼び出し：
- 10並列呼び出し
- 各約3秒、100項目で合計約30秒

出力形式：

{
  "symbol": "AAPL",
  "sentiment": 0.6,
  "event_type": "earnings",
  "key_point": "beat expectations"
}

後処理：
- 銘柄毎に複数のニュース項目を集約
- 加重平均センチメントスコアを計算
- 特徴データベースに保存

コスト見積もり:

$0.14/日 x 30日 = $4.2/月
$50/日の予算を大きく下回る

レッスンまとめ

クオンツ投資におけるLLMの正しい役割を理解：研究アシスタント、トレーダーではない
ニュースセンチメント分析と決算情報抽出の応用をマスター
LLMリスクを認識：幻覚、計算エラー、再現性なし
安全制約の設計方法を学習：ハード制約レイヤー + 監査証跡
マルチエージェントアーキテクチャにおけるLLM Agentの位置を理解

さらに読む

背景：クオンツ取引におけるLLM研究 - 学術的最前線
GPT-4 Technical Report - LLM能力境界の理解

次のレッスン予告

レッスン15：リスク管理とマネーマネジメント

最高の戦略でも損失は出る - 鍵は「どれだけの損失が許容できるか」である。Risk Agentは拒否権を持ち、資本を守る最後の防衛線である。次のレッスンではリスク管理の核心ロジックを深く掘り下げる。