Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

GDPナウキャスティング・webアプリ「NowcastingR」の概要

 GDPナウキャスティング・webアプリ「NowcastingR」の概要

GDPナウキャスティング・webアプリ「NowcastingR」の概要

https://secondapunta.shinyapps.io/NowcastingR/

secondapunta

March 02, 2022
Tweet

More Decks by secondapunta

Other Decks in Research

Transcript

  1. 1 GDP ナウキャスティング・web アプリ「NowcastingR」の概要1,2 白井 洋至† 【本稿について】 GDPナウキャスティング・webアプリ「NowcastingR」の運⽤を開始した。本アプ リは、定期的にGDPナウキャスティング結果を公表するものであるが、先⾏研究のモ デルとはいくつかの異なる特徴を備えている。未だ検討すべき点は多いものの、本稿

    では現時点(2022年3⽉2⽇時点)での概要を紹介する。 1 本稿の内容は、個人的な見解をもとにまとめたものであり、掲載されている内容により、直接的・間接 的を問わず、何らかの被害をこうむった場合にも一切の責任を負いません。また本稿の内容は予告なしに 変更または廃止することがあります。本アプリは< https://secondapunta.shinyapps.io/NowcastingR/>に て公開しています。 2 最終更新日/web サイト参照日:2022 年 3 月 2 日 † [email protected]
  2. 2 1. はじめに GDPは、国⺠経済の活動状況を多⾯的・総合的に表す重要な経済統計である。しか し、四半期統計であるうえ、最も公表の早い1次QEでさえ、公表には当該四半期終了 から約1か⽉半を要する3。そのため、GDPを⾜もとの景気判断に利⽤することはでき ない。こうした経緯から、従前、速報性の⾼い⽉次経済統計等をもとに、モデルベー スで⾜もとのGDP予測を⾏う「GDPナウキャスティング」の研究が⾏われてきた4,5。 特に最近では、東京財団政策研究所や林・館6のように研究結果のみならず、定期的に ナウキャスティング結果を公表する事例もあり、市場参加者からの注⽬度も⾼まりつ

    つある7。 この度、筆者が運⽤を開始したwebアプリ「NowcastingR」も、東京財団政策研究所 や林・館4同様、定期的にナウキャスティング結果を公表するものであるが、先⾏研究 のモデルとはいくつかの異なる特徴を備えている。後述の通り、未だ検討すべき点は 多いものの、本稿では現時点(2022年3⽉2⽇時点)での概要を紹介する。 3 GDPの概要や公表時期については、内閣府「国⺠経済計算の作成⽅法」 <https://www.esri.cao.go.jp/jp/sna/data/reference1/h27benchmark/pdf/sakusei_houhou2015_202111.pdf >を参照。 4 Banburaら[2010]は、ナウキャスティングを「We define nowcasting as the prediction of the present, the very near future and the very recent past.」としている。ナウキャスティングについては、原[2014]、⼤和 総研「新局⾯を迎えるナウキャスティング」 < https://www.dir.co.jp/report/research/economics/outlook/20210226_022119.html>、東京財団政策研究 所「GDPナウキャストとは」<https://www.tkfd.or.jp/research/detail.php?id=3871>等を参照。 5 ⽇本のGDPを対象としたナウキャスティングの先⾏研究としては、原ら[2013]、浦沢[2014][2021]、 Iizuka[2018]、近松ら[2018]、Hayashiら[2020]等が挙げられる。 6 東京財団政策研究所「GDPナウキャスティング」 <https://www.tkfd.or.jp/research/detail.php?id=3852>、林・舘「GDP ナウキャスト」< https://sites.google.com/view/fumio-hayashis-hp/home-japanese>を参照。 7 ⽇本経済新聞[2021]や⽇本経済研究センター「コロナ禍で改良⽬指すGDPナウキャスト」 <https://www.jcer.or.jp/policy-proposals/20220210.html>を参照。なお、本稿では、⽇本のGDPナウキ ャスティングに焦点をあてるが、⽶国では、アトランタ連銀 (GDPNow<https://www.frbatlanta.org/cqer/research/gdpnow.aspx>やニューヨーク連銀(New York Fed Staff Nowcast<https://www.newyorkfed.org/research/policy/nowcast>が数年前からGDPナウキャス ティングを公表しており、市場参加者からの注⽬度も⾼い。
  3. 3 2. 本分析におけるナウキャスティング・モデルの特徴 本分析におけるナウキャスティング・モデルの主な特徴として、(1)需要項⽬ごと にモデル推計・予測を⾏うこと、(2)⼤量の⽉次経済統計を特徴量とした機械学習モ デルであること、の2点が挙げられる。 (1)需要項⽬ごとにモデル推計・予測を⾏うこと 先⾏研究(脚注5)のモデルは、いずれもGDPそのものを予測対象としたものであ るが、本分析では需要項⽬ごとにモデル推計・予測を⾏う8,9。需要項⽬ごとに予測を ⾏う最⼤の利点は、GDPの変動要因が分析可能となることである10。ナウキャスティ

    ングの最⼤の⽬的は「予測」であるが、エコノミストや市場参加者といった実務者の ⽴場から⾔えば、景気判断には予測結果のみならず、例えば「今期のGDPは輸出が牽 引」といった「予測の説明」が不可⽋となる。本モデルはそうした課題に応じるもの でもある。 (2)⼤量の⽉次経済統計を特徴量とした機械学習モデルであること 浦沢[2021]や⼤和証券4も指摘の通り、GDPナウキャスティング・モデルには、主に ダイナミックファクター・モデル(以下、DFM)が⽤いられるが、本分析では機械学 習モデルを⽤いる11。マクロ経済分析への機械学習の利⽤については、結果の解釈が難 しくなることもあり、必ずしも適さないとの指摘がある4,12 。しかし、筆者の知る限 り、特に⽇本のGDPナウキャスティングにおける機械学習の活⽤事例は限られており 13、その有⽤性を判断するためにも知⾒の蓄積が必要である。本分析で機械学習を⽤い る理由は、⾼い予測精度への期待に加え、⼤量の⽉次経済統計を特徴量として利⽤す るためである。具体的には、本分析では200超の⽉次経済統計を特徴量に需要項⽬ごと に機械学習モデルを推計・予測する14。これは「エコノミストが⼤量の経済統計からそ 8 GDP(QE)は、個⼈消費、住宅投資、設備投資、⺠間在庫、政府消費、公共投資、公的在庫、純輸出 (輸出 ‒ 輸⼊) 、開差の和で表される。需要項⽬や寄与度等については、内閣府資料のほか、中村ら [2011]、中村[2017]を参照。 9 需要項⽬ごとに推計・予測を⾏う事例としては、例えば、ブリッジ・モデルを利⽤した稲⽥ [2011][2014]等が挙げられる。 10 そのほか、需要項⽬ごとの予測値を合算して最終的な予測値とするため(脚注 8) 、機械学習における アンサンブル学習のような効果も期待される。 11 機械学習に関する⼀般的な議論は、Hastie[2014]等を参照。 12 ⽇本における機械学習の経済分析への活⽤事例やその課題等は、拙著 <https://www.slideshare.net/seconda_punta/cpi-126600190>等を参照。 13 拙著< https://www.slideshare.net/seconda_punta/gdp-143633696>等を参照。 14 特に本分析の場合、サンプル数が少ないこともあり、過学習となるリスクには注意が必要となる。
  4. 4 れぞれの需要項⽬にあうデータを選択・分析し、それをもとに最新値を予測する」プ ロセスを、機械学習モデルで⾃動化するイメージである。 また、後述の通り、本分析では、特徴量の重要度(以下、PFI:Permutation Feature Importance)も計測しており、例えば「個⼈消費の予測には、具体的にどの 経済統計がどのくらい影響しているのか」等も把握可能となる15。 3. 本分析のデータセット 本章・次章では、ナウキャスティング・モデルの詳細について、2022年1Q

    GDP (1次QE)を予測するケースを例⽰する。この場合、ナウキャスティング期間は、 2021年4Q GDPの公表⽉である2022年2⽉末頃から2022年1Q GDP公表⽇の2022年5 ⽉18⽇までとし、この間、経済統計が新たに公表されるたびに予測値を更新する。 3. 1 ⽬的変数 (2005年1Q から 2021年4Qまで) GDPの需要項⽬である個⼈消費、住宅投資、設備投資、⺠間在庫、政府消費、公共 投資、公的在庫、輸出、輸⼊と開差(いずれも季節調整済み・実質・実額)を取得 し、⺠間在庫、公的在庫、開差を除き前期⽐ベースに変換する。なお、次節で述べる 特徴量にリアルタイムデータ16が存在しないこともあり、本分析においてはリアルタイ ムデータではなく、その時点で取得可能な改定値を利⽤する。この点については、今 後検討の余地がある17。 3. 2 特徴量 (2005年1⽉ から 最新値まで) 筆者の経験をもとに、景気との関連性の⾼いとみられる約240個の⽉次経済統計を選 定・取得する(参考1)。選定にあたっては、できる限り、①実質・季節調整済みの指 数であること18、②GDPよりも公表が早いこと19、③統計のヘッドラインだけでなく、 15 PFIについては、森下[2021]等を参照。 16 ⽉次経済統計に関しては、基準年の変更や季節調整のかけ直しにより、適宜遡及改定が⾏われる。 17 例えば、設備投資や⺠間在庫の推計には「法⼈企業統計調査」が⽤いられるが、1次QE公表時には当該 統計は未公表であり、その段階ではARIMAモデルによる予測値等で代替される(国⺠経済計算推計⼿法 解説書< https://www.esri.cao.go.jp/jp/sna/data/reference1/sakusei_top.html>を参照)。そのため、厳密 にはモデル推計に⽤いるデータと予測対象の定義が⼀致していない。⼀⽅、リアルタイムデータを利⽤し た場合でも問題がないわけではない。例えば、2016年3QのGDPは「2008SNA等対応」に伴い、1次QEと 2次QEで10兆円超の乖離が⽣じた。 18 ⼀部統計については、筆者が加⼯・実質化・季節調整を⾏っている。 19 例えば、内閣府「消費総合指数」は個⼈消費と同様の推計⽅法で作成される統計であるが、GDPより
  5. 5 財・業種別等の内訳も取得できること、の3点を考慮した。なお、⽉次経済統計の多く は、公表まで当該⽉終了から1か⽉程度を要する。すなわち、ナウキャスティングを開 始する2022年2⽉末時点においては、同年1⽉以前分までしか公表されていない。そこ で、本分析では予測対象期間において統計未公表⽉がある場合、前⽉⽐横ばいとする 20。最後に四半期平均を算出した後、⼀部統計を除き前期⽐ベースに変換する。以上よ り、特徴量については予測時点である2022年1Qまでの四半期ベースのデータセットと なる。 4. モデル推計・予測

    前章のデータセットを⽤いて、以下(1)〜(4)の通り、需要項⽬ごとにモデル推 計・予測し、それらをもとにGDP予測値を算出する。 (1)個⼈消費、住宅投資、設備投資、政府消費、公共投資、輸出、輸⼊ 各需要項⽬の前期⽐を⽬的変数、⽉次経済統計を特徴量とした機械学習モデルをそ れぞれ推計する。推計期間は2005年2Qから2021年4Q(バリデーション:12四半期分 をローリング推計21、ハイパーパラメータはグリッドサーチにより探索)とし、複数の 機械学習モデル(エラスティックネット、サポートベクトル回帰、k近傍法、ランダム フォレスト、確率勾配ブースティング22)のうち、バリデーションデータにおける予測 精度の最も⾼いモデルを採⽤する。そのため(参考2)の通り、需要項⽬によって機械 学習モデルは異なることになる。推計したモデルに2022年1Qの特徴量を外挿し、 2022年1Qの予測値(前期⽐ベース)をそれぞれ算出する。最後に実額ベースに変換す るため、当該予測値に2021年4Qの実額をそれぞれ乗じる。 (2)⺠間在庫 実額を⽬的変数、⽉次経済統計を特徴量とした機械学習モデルを推計する。推計⽅ 法は(1)と同様であり、推計したモデルに2022年1Qの特徴量を外挿し、2022年1Qの 予測値(実額ベース)を算出する。 も公表時期が遅いため、当該統計は特徴量から除いている (<https://www5.cao.go.jp/keizai3/getsurei/211119oshirase.pdf>を参照)。 20 GDP 公表⽇に近づくほど、当該期間における⽉次経済統計も順次公表され、予測精度が⾼まっていく イメージとなる。 21 学習期間:55四半期、テスト期間:1四半期、スライド:1四半期とした。 22 本モデルは「R」の「tidymodels」パッケージを利⽤し、engine は「glmnet」「kernlab」「kknn」 「ranger」「xgboost」「lightgbm」とした。
  6. 6 (3)公的在庫、開差 当該項⽬については、⽉次経済統計を利⽤した予測が難しいため、前期から横ばい とする。 (4)GDP予測値の算出 (1)から(3)の結果により(脚注8参照)、2022年1Q GDP予測値(実額ベー ス)を算出する。前期⽐については、当該予測値と2021年4Q GDPの実額より算出す る。

    5. 結果と考察 以下では、バリデーション期間(2019年2Qから2021年4Q)における予測結果を概 観する。先⾏研究に倣い、予測精度のベンチマークとして、⺠間エコノミストのコン センサス予測であるESPフォーキャスト23を利⽤するが、前述の通り、本分析ではリア ルタイムデータを⽤いていないこともあり、厳密な⽐較ではないことには注意が必要 である24。 5. 1 GDP 参考3は、実績値と予測値の推移であり、両者の動きは概ね連動していることが確認 される。特に新型コロナウイルス感染症の影響により、GDPが急減した2020年2Qに おいても両者の乖離は1.8%ptに⽌まる等、ショック時においても本モデルの有⽤性が ⼀定程度維持されることが⽰唆された。また、前述の通り、厳密な⽐較ではないもの の、当該期間におけるMAEは0.6%ptと、同期間におけるコンセンサス予測25(0.7%pt 弱)と⽐べても遜⾊のない結果であった(参考4)。 5. 2 需要項⽬ ⼀⽅、需要項⽬ごとの予測精度はまちまちの結果となった(参考4)。参考5は、参 考3同様、実績値と予測値の推移であるが、個⼈消費、輸出、輸⼊では両者の動きが概 ね連動する⼀⽅、その他の需要項⽬では乖離がみられた。特に、政府消費や公共投資 ではバリデーション期間を通じて、実績値の動きを⼗分に補⾜できておらず、今後改 23 ESPフォーキャストについては、< https://www.jcer.or.jp/esp-forecast-top>を参照。 24 予測精度の評価については今後の課題である。モデルや特徴量についても適宜修正・変更を検討してい くため、同条件での⽐較は難しい。 25 ESP フォーキャストの MAE は、現時点で取得した GDP 改定値と各時点の ESP フォーキャストを⽐ 較したものであることには注意が必要である。
  7. 7 善の余地がある。 参考6は、需要項⽬ごとのPFI(上位10位)である26。興味深いことに、需要項⽬ご とに差はあるものの、いわゆる関連指標を選択していることが確認される。具体的に は、個⼈消費であれば「消費活動指数」、輸出であれば「実質輸出」といった、エコ ノミストが、個⼈消費や輸出を実際に分析する際に⽤いる統計が上位にランクインし ている。以上の結果を利⽤すれば、例えば「2021年4QのGDPについては、個⼈消費 が牽引の⾒通し。「消費活動指数」の持ち直しが予測値を押し上げ」といった分析も 可能となる。これは、前述の「予測の説明」にあたるものであり、従来のナウキャス ティング・モデルにはない特徴といえる。

    6. まとめ 先⾏研究とは異なる⼿法(200超の⽉次経済統計を特徴量に需要項⽬ごとに機械学習 モデルを推計・予測)でGDPナウキャスティングを⾏い、バリデーション期間ではあ るものの、実績値を概ね捕捉できること、⼀定程度の「予測の説明」も可能であるこ とを確認した。 但し、前述の通り、本分析は未だ多くの課題(リアルタイムデータの利⽤、⼀部需 要項⽬の予測精度、予測精度の評価⽅法等)を抱えており、これらの点については、 今後継続して取り組む中で、モデルの特徴を踏まえつつ改善を⽬指していきたい。 26 本分析の PFI は、特徴量間の相関を考慮していないことには注意が必要である。精度評価指標は RMSE とした(シャッフル回数:10 回)。
  8. 8 参考⽂献 [1] Marta Banbura, Domenico Giannone, Lucrezia Reichlin(2010)“Nowcasting”, Working

    Paper Series, European Central Bank [2] Nobuo Iizuka(2017)“Nowcasting gross domestic product in Japan using professional forecastersʼ information”, Kanagawa University Economic Society Discussion Paper No. 2017-4 [3] Trevor Hastie, Robert Tibshirani, Jerome Friedman, 杉⼭将ほか訳(2014) 「統計的 学習の基礎―データマイニング・推論・予測―」共⽴出版 [4] Fumio Hayashi, Yuta Tachi(2020)“Nowcasting Japan's GDP”, SSRN [5] 稲⽥義久(2011) 「⽇本経済のマクロ計量分析:超短期モデル予測と合意予測」⽇ 本経済新聞出版社 [6] 稲⽥義久(2014) 「超短期モデルの⽇本経済への応⽤と展開」⽉刊誌「統計」 2014年4⽉号 [7] 浦沢聡⼠(2014)「リアル・タイム GDP 予測:ダイナミック・ファクター・モ デルの活⽤」 ESR No.6 2014 年 秋号 [8] 浦沢聡⼠(2021)“GDPナウキャスティング:成果と課題”, Kanagawa University Economic Society Discussion Paper No. 2021-01 [9] 近松京介、平形尚久、城⼾陽介、⼤⾼⼀樹(2018)「わが国のGDPのナウキャス ティングに関する検討」⽇本銀⾏ワーキングペーパーシリーズ [10] 中村隆英、新家健精、美添泰⼈、豊⽥敬(2011) 「経済統計⼊⾨」東京⼤学出版 会 [11] 中村洋⼀(2017) 「GDP統計を知る」⼀般財団法⼈⽇本統計協会 [12] ⽇本経済新聞「再開する⽇本経済 10〜12⽉期、⺠間予測は年率6%成⻑」2021 年12⽉15⽇付電⼦版 [13] 原尚⼦(2014)「GDPのナウキャスティング:⼤量の指標を利⽤した新たな予 測⼿法」⽉刊誌「統計」2014年4⽉号 [14] 原尚⼦、⼭根渉太郎(2013)「GDPのナウキャスティング(⾜もと予測)のた めの新たな⽉次推計⼿法」⽇本銀⾏ワーキングペーパーシリーズ [15] 森下光之助(2021) 「機械学習を解釈する技術」技術評論社
  9. 9 参考1: 本分析で利⽤する経済統計 経済統計 出所 備考 GDP 内閣府 - 家計調査

    総務省 - 商業動態統計 経済産業省 - 消費活動指数 ⽇本銀⾏ - 景気ウォッチャー調査 内閣府 - 鉱⼯業出荷内訳表 経済産業省 - 鉱⼯業総供給表 経済産業省 - 鉱⼯業指数 経済産業省 - 第三次産業活動指数 経済産業省 - 建設着⼯統計 国⼟交通省 - 建設総合統計 国⼟交通省 建設⼯事費デフレーターで実質化 機械受注統計 内閣府 - 実質輸出⼊指数 ⽇本銀⾏ - 経常収⽀ ⽇本銀⾏ - 実効為替レート ⽇本銀⾏ - 労働⼒調査 総務省 - 毎⽉勤労統計 厚⽣労働省 - 実質雇⽤者報酬 - 毎⽉勤労統計、労働⼒調査より試算 ⼀般職業紹介状況 厚⽣労働省 - 参考2: 需要項⽬別の機械学習モデル 需要項⽬ 機械学習モデル 個⼈消費 glmnet 住宅投資 lightgbm 設備投資 kernlab 在庫投資 kknn 政府消費 ranger 公共投資 ranger 輸出 glmnet 輸⼊ glmnet
  10. 10 参考3: GDP実績値と予測値の推移 参考4: 実績値と予測値の⽐較 需要項⽬ MAE(%pt) 決定係数 GDP 0.64

    0.94 個⼈消費 0.93 0.81 住宅投資 1.15 0.65 設備投資 1.60 0.48 ⺠間在庫 0.85 0.30 政府消費 0.47 0.43 公共投資 1.42 0.30 輸出 1.30 0.96 輸⼊ 1.24 0.80