Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
株式のシステムトレード初心者の最初の一歩(評価方法を中心に)
Search
tomo
March 21, 2023
Technology
1
630
株式のシステムトレード初心者の最初の一歩(評価方法を中心に)
マケデコで2022/9/28(水) に開催した「初心者向け株式分析セミナー: データ分析/モデル作成から評価まで全部!」で利用した資料の一部です
tomo
March 21, 2023
Tweet
Share
More Decks by tomo
See All by tomo
マケデコ プログラミングに頼らないExcelシートと生成AIによる日本株データ分析 発表資料
gamella
1
550
アドベントカレンダーのお礼とマーケットAI開発プロジェクトにおけるプロジェクトマネジメントのエッセンス 補講
gamella
1
790
JPX Tokyo Stock Exchange Prediction Award Ceremony 解法総評
gamella
2
2.2k
J-Quants表彰会資料 - 上位入賞者解法総評 #JQuants
gamella
1
2.8k
LDAを利用した予測モデル構築 - J-Quants ニュース分析チャレンジ!発表資料
gamella
1
23k
為替短期予測を支える基盤技術 - データエンジニアミーティング資料
gamella
4
3.1k
Other Decks in Technology
See All in Technology
これはPerl? それともRuby? クイズ〜〜〜〜〜!!!- Perl or Ruby Quiz
moznion
3
2k
組織デバイスのための効率的なアプリケーション更新戦略
kenchan0130
0
360
LINE-ChatGPT 倫理問題を整理する全力肯定彼氏くん [LuC4]に訪れたサービス開始以来の最大の危機
o_ob
2
170
【完全版】Dify - LINE Bot連携 考え方と実用テクニック
uezo
2
620
不要なリソースを自動で定期的に整理する方法 ~Sandboxアカウントのコストを削減しよう!~
amixedcolor
3
140
Graph Database と Generative AI の素敵な関係
oracle4engineer
PRO
16
2.6k
Case Study: Concurrent Counting
ennael
PRO
0
130
トークナイザー入門
payanotty
2
1k
LINEヤフー新卒採用 コーディングテスト解説 アルゴリズム問題編
lycorp_recruit_jp
0
14k
Webセキュリティのあるきかた
akiym
32
11k
Low Latency Join Method for Distributed DBMS
yugabytejapan
0
180
コード✕AIーソフトウェア開発者のための生成AI実践入門~
yuhattor
4
880
Featured
See All Featured
From Idea to $5000 a Month in 5 Months
shpigford
381
46k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
Infographics Made Easy
chrislema
239
18k
WebSockets: Embracing the real-time Web
robhawkes
59
7.4k
Typedesign – Prime Four
hannesfritz
39
2.3k
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.7k
Optimising Largest Contentful Paint
csswizardry
31
2.8k
Docker and Python
trallard
40
3k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
92
16k
Building Adaptive Systems
keathley
38
2.2k
Transcript
株式のシステムトレー ド初心者の最初の一歩 (評価方法を中心に) Tomoya Kitayama STRICTLY CONFIDENTIAL
投資戦略設計の基本コンセプト 株式投資の戦略を立案する場合、投資する株式の銘柄選択を助けるた めのスコアをまず設計すること 多い スコアが高い銘柄を投資対象に 組み入れる スコア 未来の収益率に対して相関 あることを期待値として、スコア 高
い銘柄を投資対象に組み入れる ただし、スコア 高 てもリスク 高 い銘柄を購入しす ると、リターン/ リスクでみたと に収益 悪化するの で、スコアはリスクで調整する(標準 偏差で割る、など)こと 多い スコアが低い銘柄 投資対象か ら除外する スコアが未来 収益率に対して、相関が ある場合 、スコアが低いこと 値下が りする可能性が高いことを示す ある投資対象 グループに投資する場 合もそ なかからスコアが低い銘柄を除 外するような使い方もある。 設計したスコア を利用し投資 意思決定を行う
スコアはどうやって作るのか? 手法 説明 テクニカル分析 移動平均乖離率などそもそも銘柄全体を通して比較できるテクニカ ル分析 そ ままスコアになる。また、試してみるとわかるが、移動 平均乖離率 結構きちんとこ
後 評価手法を使うとそこそこ効果 があることなどもわかります。 ファンダメンタル分析 ROEなどファンダメンタルから銘柄間で比較可能な正規化したスコア を生成する手法。ある種 王道 アプローチであり、多数先行研究 があります。個人的に 投資指標として ROEというレポートとか わかりやすくて好きです。 オルタナティブデータ から 生成 あまり個人投資家 皆様が触る機会も少ないと思います で、今回 セミナーで オルタナティブデータ推進協議会にも協力いただき、 詳しく説明いたします。 機械学習モデル 後半 セッションでど ようにスコアを生成するかを詳しく説明しま す。今後 AMAを聞く上で 基礎知識になれ 幸いです! 銘柄間で比較可能なスコアをつ って評価をする手法はいろんなケースで利用で ます!
スコアはどうやって評価するのか? 1 投資戦略の評価を行う際は、 ならずその投資戦略の用途(デイトレード、長期 投資など)に合致した評価手法を採用する必要 あります。 # エントリー価格 エグジット価格 用途
A 次 営業日 始値/ 後場 始値 次 営業日 終値 スコア 有効性が当日限りにおいて有効かどうかを検証す るために計測。イントラデイトレード 基本スコアであり、 もっとも機械学習としても再現性が高い。 B 次 営業日 終値 2営業日後 終値 スコア 有効性が日をまたいで有効かどうかを計測しま す。スイングトレードやスコア 基本性能を計測するために 利用します。Kaggleで採用したスコア。 C 次 営業日 終値 1週間以降 終値 計測された有効性が複数日付をまたいで有効かどうかを計 測します。ど くらい 期間を対象とするか 戦略によって 変わります。 D 2営業日後 終値 1ヶ月以上先 長い 期間 終値 エントリー 価格に2営業日後 終値を使うことで次 日に 発生するアノマリー的な動きに収益性が依存しないことを 検証するために利用。 4半期ベースなど 長期的な投資に おける有効性を検証する場合に採用。
スコアはどうやって評価するのか? 2 スプレッドリターンは銘柄群に対するスコアの分位を利用した評価方法であり、スコアを生成し たと に上位X%、下位X%の銘柄に投資し続けて取得で るリターン(収益率)の差分を評価する 手法。おそらく最もクオンツの中で利用している検証方法 Aラン キング Top
20% Botto m 20% パフォーマンスのよいスコアとは、 - Top 20%の銘柄はオレンジのように勝ち続ける - Bottom 20%の銘柄は緑のように負け続ける このPLの差分 大 いと価値 高い 累積PLの期待値
スコアはどうやって評価するのか? 3 算出されたスコア 将来のリターンに対して有益な情報を含んでいた場合、スコア 高い銘柄ほど将来の収益率 高いとしたら、順位相関 0より大 (もし はマイナ スの効果を期待するなら0より小さ
)なる。 Numeraiでも採用している評価方法(今はTCもあるので、ちょっと状況は異なる) Aラ ンキ ング Bラ ンキ ング 順位相関であれ ば、分布の仮定 不要となり、 EDA時にクイッ クに検証を実施 可能 オルタナティブデータ ら計算 した各銘柄のスコア 将来の各銘柄のリターン 順位 相関 線形相関を、XとYの分布 正規分布である保証はないた め使う局面 限定される つまり生成したスコア 各銘柄の将来のリターンに対して、順序 似通っている ものを設計すれば良い
ここまでの内容をどのように計算するか • ここまでの各種計算方法は様々なライブラリにすでになっています。もちろん自分で Pythonで実装するのもOK。 • 例えば、マイクロソフト 提供しているクオンツライブラリ qlibなど 有名です。 https://github.com/microsoft/qlib
ここ 差異を計測 する
Thank You! STRICTLY CONFIDENTIAL