Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SIGNATE: 日本取引所グループ ファンダメンタルズ分析チャレンジ 1位解法 / the 1st place solution of JPX Fundamentals Analysis Challenge on SIGNATE

SIGNATE: 日本取引所グループ ファンダメンタルズ分析チャレンジ 1位解法 / the 1st place solution of JPX Fundamentals Analysis Challenge on SIGNATE

SIGNATEで開催された『日本取引所グループ ファンダメンタルズ分析チャレンジ 』で1位となった株価の値動きの予測手法についての解説。

コンペティションのサイト:
https://signate.jp/competitions/423

m_mochizuki

July 20, 2021
Tweet

More Decks by m_mochizuki

Other Decks in Technology

Transcript

  1. 2 ๬݄ ਖ਼߂ ..PDIJ[VLJ σʔλαΠΤϯςΟετ ࣗݾ঺հ n 4*(/"5&(SBOENBTUFS n ͜ͷίϯϖͷ݁Ռɺ૯߹ϥϯΩϯάҐʹɻ

    n ത࢜ ཧֶ n ઐ໳͸ੜ෺ɾҩༀؔ܎ͷσʔλ͕ͩɺ࠷ۙ͸ ͍Ζ͍Ζͳ෼໺ͷσʔλΛѻ͍ͬͯΔɻ n %%#+σʔλղੳνϟϨϯδ  ɺ*5૑ༀ ίϯςετ  ౳ͷ*5ͱόΠΦͷ ڥքྖҬͷίϯϖʹͯड৆ෳ਺ɻ n גऔҾʹಛผৄ͍͠Θ͚Ͱ͸ͳ͍
  2. 3 DeNA Kaggle社内ランク制度 Performance Tiers Grandmaster Master Expert https://dena.ai/kaggle/ Competition

    Medals Kaggle(一部Signate)の成績に応じて業務時間の一定割合をKaggle・Signateに当てることが可能 3 https://www.kaggle.com/progression Expert Contributor Novice 226人 1,591人 6,705人 60,040人 90,805人 S A B competition point >0 の人数 (2021年7月現在) Master Grandmaster SS
  3. ಛ௃ྔҰཡ 7 2 銘柄情報 • 会計基準のカテゴリ • 決算種別のカテゴリ • 業績予想の決算種別のカテゴリ

    • 会社区分のカテゴリ • 市場・商品区分のカテゴリ • 33業種区分/17業種区分のカテゴリ • TOPIXニューインデックスシリーズ規模区分 テクニカル • 起点日から過去5/10/20日以内の最高値/最安値への変動率 • 取引所公式終値の20/40/60/120営業日前からの変化率 • 取引所公式終値の過去20/40/60/120営業日間かからの変化率 • 取引所公式終値の20/40/60/120日移動平均からの乖離率 • 起点日の最高値と最安値の対数の比の20/40/60/120日移動平均 試して駄目だったこと 銘柄コードのカテゴリ は追加するとCV悪化。 特定の銘柄が常に値上がりしやすい等の傾向 はないためと考えられる。
  4. ಛ௃ྔҰཡ 8 2 ファンダメンタルズ • 総資産/純資産/営業キャッシュフロー/財務キャッシュフロー/投資キャッシュフロー/売上/営業利 益/経常利益/純利益の前年同期比 • 四半期あたりの売上高/営業利益/経常利益/純利益の前年同期比 •

    季節調整済みの四半期あたりの売上高/営業利益/経常利益/純利益の前年同期比 • 業績予想の売上高/営業利益/経常利益/純利益の前年同期比 • 四半期PER/季節調整済み四半期PER/業績予想に基づくPER • 四半期ROE/季節調整済み四半期ROE/業績予想に基づくROE • PBR • 当該時点での全銘柄の時価総額の合計に対する当該銘柄の時価総額/売買代金/純資産/総 資産の比 • 配当利回り • 配当性向 • 配当基準日/予想配当基準日から起点日までの日数 なお、四半期毎の特徴量は、きっかり3ヶ月にならない場合があるので、前回の決算からの日数 で標準化した。
  5. ༧ଌ͢΂͖͸ɺגՁͷมಈ཰Ͱ͸ͳ͘ɺͦͷॱҐ 9 n Ұݟ͢Δͱະདྷͷ࠷ߴ஋ɾ࠷҆஋΁ͷมಈ཰Λ༧ଌ͢Δίϯϖʹݟ͑Δɻ n ࣮ࡍ͸ɺධՁࢦඪ͕ॱҐ૬ؔ܎਺Λϕʔεʹ͍ͯ͠ΔͨΊɺະདྷͷมಈ཰͕େ ͖͍໏ฑ͔Βখ͍͞໏ฑͷॱʹͰ͖Δ͚ͩਖ਼֬ʹฒ΂Δ͚ͩͰे෼ 3 𝒔𝒄𝒐𝒓𝒆 =

    𝝆𝒍𝒐𝒘 − 𝟏 𝟐 + 𝝆𝒉𝒊𝒈𝒉 − 𝟏 𝟐 𝝆𝒍𝒐𝒘࠷҆஋΁ͷมಈ཰ͷਅ஋ͱ༧ଌ஋ͷ4QFBSNBOͷॱҐ૬ؔ܎਺ 𝝆𝒉𝒊𝒈𝒉࠷ߴ஋΁ͷมಈ཰ͷਅ஋ͱ༧ଌ஋ͷ4QFBSNBOͷॱҐ૬ؔ܎਺
  6. ৴པʹ஋͢ΔDSPTTWBMJEBUJPOͷߏங 11 n ֤GPME͕೥ͷ֤೥ʹରԠ͢ΔΑ͏ʹGPME$7 p ೥ʹ͍ͭͯ͸લ೥ಉظൺͷಛ௃ྔ͕ܭࢉͰ͖ͳ͍ͨΊࣺͯͨɻ p ೥͸$7ͷUFTUʹ͸࢖༻͠ͳ͍ͷͰɺશGPMEͰ܇࿅ʹར༻ n είΞ͸ɺUFTUσʔλͷ͏݄ͪ೔͔Β݄೔·Ͱͷ֤໏ฑͷ࠷ऴࣄྫͩ

    ͚Λ࢖ͬͯܭࢉ͠ɺ͜ͷείΞΛվળΛ໨ඪʹͯ͠ࢼߦࡨޡͨ͠ɻ p ্هͷΑ͏ʹධՁର৅ࣄྫΛݶఆͨ͠ཧ༝͸ޙड़ n ౤ߘͨ͠Ϟσϧͷ$7είΞ œ  p QSJWBUF-#ͷ࠷ऴείΞ͸ͱဃ཭͸ͳ͘ɺదਖ਼ͳ$7ͩͬͨͱݟ ΒΕΔɻ 4
  7. CBDLUFTUͰ͸ͳͯ͘$7ʹͨ͠ཧ༝ 12 n ΋ͪΖΜ྆ํ΍ͬͯ΋͍͍͕ɺ$7ͰΛUFTUʹͨ͠৔߹͸CBDLUFTUʹ΋ͳͬͯศརɻ n $7ͳΒɺͷશظؒʹΘͨͬͯ൚Խ͢Δ͜ͱ͕อূͰ͖Δɻ p CBDLUFTUͰ͸೥͸ධՁ͠Α͏͕ͳ͍͸ͣɻ n $7Ͱ͸ɺͦͷաఔͰͰ͖Δ֤Ϟσϧ͕΄΅౳͍͠ڧ͞ʹͳΔͷͰɺ୯७ʹฏۉ͢ΔΞϯαϯ

    ϒϧΛຊ൪ͷਪ࿦ʹྲྀ༻ՄೳɻશσʔλΛ࢖͑Δ্ʹɺWBMJEBUJPOࡁΈϞσϧͷฏۉͳͷͰ ҆શੑ͕ߴͦ͏ɻ n $7ͷσϝϦοτͱͯ͠ɺະདྷΛ܇࿅σʔλʹͯ͠աڈΛਪ࿦͢Δ৔߹͕దਖ਼ͳධՁͱͳΒͳ ͍ݒ೦͸͕͋ͬͨɺࠓճ͸େ͖ͳ໰୊ʹͳΒͳ͍ͱ൑அɻ 5 : train : test 2017 2018 2019 2020 2017 2018 2019 2020 2017 2018 2019 2020 2017 2018 2019 2020 2017 2018 2019 2020 2017 2018 2019 2020 2017 2018 2019 2020 CV backtest
  8. ͦͷଞ 14 n ϥϯλΠϜධՁ࣌ʹ࠷৽σʔλͰ܇࿅͢Δ͜ͱ΋Մೳ͕ͩͬͨɺίʔυݟ௨͕͠ѱ͘ ͳΓɺະདྷͷσʔλΛࢀরࣦͯ֨͠ʹͳΔϦεΫ΋૿͑ΔͨΊ࣮ࢪ͠ͳ͍͜ͱʹͨ͠ɻ n ্هʹՃ͑ͯɺߦํ޲ͷGPSจΛഉআͯ͠QBOEBTͰॲཧͨ͜͠ͱ΍ɺධՁʹؔ܎ͳ ͍ɺܾࢉ୹৴ൃද೔Ҏ֎ͷਪ࿦ΛεΩοϓ͢Δ͜ͱͰɺൺֱత͍ܰίʔυʹͳͬͨɻ QSJWBUF-#Ͱͷਪ࿦࣌ؒඵ p

    ਪ࿦࣌ؒ͸্ҐνʔϜͰ࠷୹ n ੍ݶ࣌ؒ͸࣌ؒͳͷͰɺ·ͩ·ͩ੝ΓࠐΊΔΞΠσΞ͸͋ͬͨ͸ͣɻ n ԿΛ༧ଌ͢Δ͜ͱ͕ٻΊΒΕ͍ͯΔͷ͔ߟ͑ͯɺ஍ಓʹ΍Δ΂͖͜ͱΛ΍ͬͨΒண࣮ ʹείΞ͕վળͨ͠ɻࢢ৔ͷҰ࣌తͳτϨϯυͷΑ͏ͳۮવͷཁૉʹࠨӈ͞Εͳ͍Α ͏ʹɺ͏·͘ઃܭ͞Εͨίϯϖͩͬͨͱ͍͏ҹ৅ɻ 7
  9. 15