第 14 課:クオンツにおけるLLMの応用

LLMは最も強力な研究アシスタントだが、最悪のトレーダーである。得意なことをさせよう。


GPTトレーダーの幻想と現実

2023年、あるチームが実験を行った:GPT-4に直接トレーディング判断をさせる。

彼らはGPT-4に以下を与えた:

  • 過去20日間の価格データ
  • 最新の金融ニュース
  • 現在のポジション

そして「買う、売る、保持のどれにすべきか?」と尋ねた。

3ヶ月後の結果:

指標GPT-4戦略ランダム戦略S&P 500
リターン-12%-3%+8%
シャープレシオ-0.8-0.20.5
最大ドローダウン25%18%10%

GPT-4はランダム戦略さえ下回った。

なぜ失敗したのか?

  1. 幻覚問題: GPT-4は存在しない「市場パターン」を作り出す
  2. 数学能力の弱さ: リターンやボラティリティを正確に計算できない
  3. 記憶がない: 各呼び出しが独立しており、経験を蓄積できない
  4. 高レイテンシ: 1回の推論に数秒かかり、高速で動く市場を逃す
  5. 再現性がない: 同じ入力でも異なる出力を生成する可能性がある

しかし同じ期間中、GPT-4を決算分析に使用したチームは報告した:

  • 決算解釈の品質が3倍向上
  • 調査レポート生成時間が4時間から30分に短縮
  • ニュースセンチメント分析の精度85%

結論: LLMは直接取引には適していないが、研究と分析には強力である。


14.1 LLMの正しい役割

LLMができること

能力クオンツ投資への応用価値評価
テキスト理解決算解釈、ニュース分析5/5
情報抽出10-Kから主要指標を抽出5/5
レポート生成戦略診断レポート、事後分析要約4/5
コード生成バックテストコードの作成支援4/5
知識Q&A金融概念の説明3/5

LLMができないこと

試み失敗する理由代替手段
直接価格予測リアルタイムデータにアクセスできず、計算が不正確従来のMLモデル
リアルタイム取引判断レイテンシが大きすぎ、再現性がないルール + MLシステム
正確な計算大きな数字でのエラー率が高い専用計算モジュール
長期記憶コンテキストが制限され、蓄積できない外部ナレッジベース

核心原則:LLMを強化レイヤーとして

LLMアーキテクチャの位置づけ

14.2 ニュースとセンチメント分析

応用シナリオ

金融ニュースから取引関連情報を抽出:

ニュースタイプ抽出内容クオンツ投資での価値
決算発表予想の達成/未達成、ガイダンスの変更イベントドリブンシグナル
製品ニュース新製品発売、リコール、提携ファンダメンタルの変化
マクロ政策金利決定、規制変更システミックリスク
アナリスト意見レーティング変更、目標価格調整センチメント指標

センチメント分析の例

入力ニュース:

Appleは四半期売上高1230億ドルを報告し、ウォール街の予想1180億ドルを上回った。しかし、中国でのiPhone販売はHuaweiとの競争激化により前年比15%減少した。

LLM抽出:

{
  "company": "AAPL",
  "event_type": "earnings",
  "sentiment_overall": 0.6,
  "key_points": [
    {"topic": "revenue", "sentiment": 0.8, "value": "beat by 4%"},
    {"topic": "china_iphone", "sentiment": -0.7, "value": "-15% YoY"}
  ],
  "trading_signal": "mixed",
  "confidence": 0.7
}

使用方法:

  • 直接取引せず、シグナルの入力特徴の1つとして使用
  • 価格モメンタム、テクニカル指標と組み合わせる
  • 履歴データを使用してLLMセンチメントの予測力を検証(バックテスト)

プロンプトエンジニアリングの要点

悪いプロンプト:

このニュースは強気ですか弱気ですか?

良いプロンプト:

あなたは金融アナリストです。以下のニュースを分析してください:
[ニュース内容]

以下の形式で出力してください:
1. 関連する企業/資産(ティッカーシンボル)
2. イベントタイプ(決算/製品/政策/その他)
3. 全体的なセンチメントスコア(-1から1、-1は非常にネガティブ、1は非常にポジティブ)
4. 3つの主要情報ポイント、それぞれにトピック、センチメントスコア、具体的な値
5. 短期的な価格への影響の可能性(上昇/下降/中立)
6. 信頼度(0から1)

JSON形式のみで出力し、説明は不要です。

14.3 決算レポート自動化

10-K/10-Q情報抽出

米国の公開企業の年次報告書(10-K)と四半期報告書(10-Q)には膨大な情報が含まれているが、通常100ページを超える。

LLMは自動的に抽出できる:

抽出内容場所用途
売上成長財務諸表ファンダメンタルスクリーニング
粗利益率の変化MD&A収益性トレンド
リスク要因の変化リスク要因リスク警告
経営陣の議論のトーンMD&Aセンチメント指標
訴訟の進展法的手続きイベントリスク

構造化抽出プロセス

+-------------------+
|  10-K PDFダウンロード |
+--------+----------+
         |
         v
+-------------------+
|   PDF -> テキスト   |
+--------+----------+
         |
         v
+-------------------+
| セグメント化(セクション別) |
+--------+----------+
         |
         v
+-------------------+
| LLMでセグメント毎に抽出 |  <- コンテキストオーバーフローを避けるため各セグメントを個別に処理
+--------+----------+
         |
         v
+-------------------+
| 構造化データを保存 | -> バックテスト用データベース
+-------------------+

決算トーン変化の検出

連続する決算レポート間のMD&Aトーン変化を比較:

前回の声明現在の声明シグナル
"成長を期待""慎重ながら楽観的"トーン弱化
"課題に直面""重大な課題に直面"リスク増大
"探索中""開始した"進展加速

注意: トーン変化は相対的指標 - 履歴比較があって初めて意味がある。


14.4 調査レポート生成

戦略診断レポート

LLMに事後分析レポートの作成を手伝わせる:

入力:

戦略名:モメンタム戦略 v2.3
期間:2024-01-01から2024-03-31
パフォーマンスデータ:
  - リターン:+8.5%
  - ベンチマークリターン:+12.0%
  - 最大ドローダウン:-6.2%
  - シャープレシオ:1.2
  - 回転率:420%

取引詳細:(CSVを添付)

LLM出力:

# モメンタム戦略 v2.3 2024年Q1事後分析

## 要約
戦略は2024年Q1にベンチマークを3.5%下回った。主に2月のレンジ相場期間中の
連続ストップロスによる。

## 根本的な問題診断
1. **高い回転コスト**: 420%の回転率は約2.1%の年間取引コストを意味する
2. **2月の異常**: 2月のリターン-4.3%、全ドローダウンの70%
3. **セクター集中**: テック株が保有の65%、多様化の欠如

## 改善提案
1. 保有期間フィルターを追加して短期ノイズ取引を削減
2. ADX < 20の場合にポジション削減または戦略停止
3. セクター多様化制約を追加、単一セクター < 30%

## 次のステップ
- [ ] ADXフィルター追加後のパフォーマンスをバックテスト
- [ ] 最小保有期間 = 3日の効果をテスト

レポート品質管理

LLM生成レポートには検証が必要:

チェック項目リスク対応
データ精度LLMがデータを捏造する可能性ソースから主要データを抽出、LLMに計算させない
因果関係エラー相関を因果関係と誤解主要結論を人間がレビュー
重要情報の欠落部分的な入力のみを見るすべての入力次元がカバーされているか確認

14.5 LLM安全制約

なぜハード制約が必要か?

LLM出力は信頼できない。直接取引に使用すると:

リスクシナリオ結果
幻覚「データに基づき、フルポジション買いを推奨」実際のデータは裏付けない
計算エラー「リターン15%」が実際には1.5%誤った判断
一貫性の欠如同じ質問、異なる答え再現性がない

ハード制約設計

LLM制約レイヤーアーキテクチャ

監査証跡

すべてのLLM呼び出しをログに記録する必要がある:

{
  "timestamp": "2024-01-15 09:30:00",
  "input_prompt": "AAPL決算を分析...",
  "output_raw": "...",
  "output_parsed": {"sentiment": 0.6, ...},
  "model": "gpt-4-0125-preview",
  "temperature": 0.1,
  "action_taken": "シグナルモデルへの特徴入力として使用",
  "final_decision": "取引は実行されず"
}

目的:

  • LLMが判断を誤導したかどうかの事後分析
  • LLMパフォーマンスの低下を検出して適時調整
  • 規制遵守

14.6 LLM Agentアーキテクチャ

マルチエージェントシステムでの位置

+-------------------------------------------------------------+
|                      Meta Agent                              |
+----------------------------+--------------------------------+
                             |
    +------------------------+------------------------+
    |                        |                        |
    v                        v                        v
+---------+            +---------+              +---------+
|  LLM    |            | Signal  |              |  Risk   |
|Research |  --------> |  Agent  | -----------> |  Agent  |
|  Agent  |   入力      +---------+              +---------+
+---------+  センチメント
             特徴

LLM Agentの位置:
  - 重要な判断パス上にはない
  - 「参考情報」のみを提供
  - 下流のAgentが採用するかどうかを決定

LLM Agentの責任境界

できることできないこと
ニュースセンチメント分析直接売買シグナルを生成
決算データ抽出ポジションサイズを計算
レポートドラフト生成リスク制御パラメータを変更
戦略ロジックの説明注文を執行
異常イベントのフラグストップロスを無効化

LLM能力境界 LLMは優れた研究アナリストだが、取引判断に直接参加すべきではない。年次報告書の解析、決算説明会のトーン変化検出、会計上の不正のフラグ、ファクター仮説の生成は可能だが、注文の生成、ポジションサイズの計算、リスクパラメータの変更、取引の執行はできない。この境界はアーキテクチャレベルで強制する必要がある:LLM出力はシグナル入力としてのみ機能し、執行やリスク制御パスに直接到達することはない。完全な境界表についてはレッスン22を参照。


14.7 実践的考慮事項

コスト管理

シナリオ呼び出し頻度コスト管理戦略
リアルタイムニュース分析ニュース項目毎ルールで無関係なニュースを事前フィルタ
決算分析四半期毎コストは許容範囲
日次レポート生成毎日キャッシュを使用して重複呼び出しを回避
リアルタイムQ&Aオンデマンド1日の呼び出し回数を制限

レイテンシ管理

応用許容レイテンシ戦略
イベントドリブン取引< 1秒LLMを使用せず、ルールを使用
日次戦略数分LLMを使用可能、バッチ処理
研究分析数時間自由に使用

モデル選択

タスク推奨モデル理由
センチメント分析GPT-3.5 / Claude Haikuシンプルなタスク、低コスト
決算分析GPT-4 / Claude Opus深い理解が必要
コード生成Claude Opus / GPT-4精度が必要
単純な分類ファインチューニングされた小型モデル最低コスト、最小レイテンシ

レッスン成果物

このレッスンを完了すると、以下を得られます:

  1. クオンツ投資におけるLLMの役割の明確な理解 - できることとできないことを知る
  2. センチメント分析能力 - ニュース/決算LLM分析ワークフローを設計できる
  3. 安全制約の認識 - なぜハード制約が必要かを理解
  4. アーキテクチャ統合方法 - LLM Agentがマルチエージェントシステムにどう適合するかを知る

受け入れ基準

チェックポイント受け入れ基準自己テスト方法
役割理解LLMができること・できないことを各3つ挙げられるメモなしでリスト化
プロンプト設計構造化されたセンチメント分析プロンプトを書けるニュースを与えてプロンプト設計
安全制約LLMが直接取引すべきでない理由を説明できるリスクを3つリスト化
アーキテクチャの位置づけマルチAgent アーキテクチャ図にLLMの位置をマークできる図を描く

設計演習:

LLMニュース分析ワークフローを以下の要件で設計:

  1. 1日500件の金融ニュース項目を処理
  2. レイテンシ要件 < 1時間ですべて完了
  3. コスト予算 < $50/日
  4. 日次戦略向けのセンチメント特徴を出力
参考解答を見る

ワークフロー設計:

  1. 事前フィルタリング(ルール):

    • キーワードフィルター、保有銘柄のニュースのみを保持
    • 100項目まで絞り込むと予想
  2. バッチ処理

    • GPT-3.5-turboを使用($0.002/1Kトークン)
    • 各ニュース約500トークン入力 + 200トークン出力
    • 100項目 x 700トークン x $0.002/1K = $0.14
  3. 並列呼び出し

    • 10並列呼び出し
    • 各約3秒、100項目で合計約30秒
  4. 出力形式

    {
      "symbol": "AAPL",
      "sentiment": 0.6,
      "event_type": "earnings",
      "key_point": "beat expectations"
    }
  5. 後処理

    • 銘柄毎に複数のニュース項目を集約
    • 加重平均センチメントスコアを計算
    • 特徴データベースに保存

コスト見積もり:

  • $0.14/日 x 30日 = $4.2/月
  • $50/日の予算を大きく下回る

レッスンまとめ

  • クオンツ投資におけるLLMの正しい役割を理解:研究アシスタント、トレーダーではない
  • ニュースセンチメント分析と決算情報抽出の応用をマスター
  • LLMリスクを認識:幻覚、計算エラー、再現性なし
  • 安全制約の設計方法を学習:ハード制約レイヤー + 監査証跡
  • マルチエージェントアーキテクチャにおけるLLM Agentの位置を理解

さらに読む


次のレッスン予告

レッスン15:リスク管理とマネーマネジメント

最高の戦略でも損失は出る - 鍵は「どれだけの損失が許容できるか」である。Risk Agentは拒否権を持ち、資本を守る最後の防衛線である。次のレッスンではリスク管理の核心ロジックを深く掘り下げる。

この章を引用する
Zhang, Wayland (2026). 第 14 課:クオンツにおけるLLMの応用. In AIクオンツ取引:ゼロからイチへ. https://waylandz.com/quant-book-ja/Lesson-14-LLM-Applications-in-Quant
@incollection{zhang2026quant_Lesson_14_LLM_Applications_in_Quant,
  author = {Zhang, Wayland},
  title = {第 14 課:クオンツにおけるLLMの応用},
  booktitle = {AIクオンツ取引:ゼロからイチへ},
  year = {2026},
  url = {https://waylandz.com/quant-book-ja/Lesson-14-LLM-Applications-in-Quant}
}