機械学習を活用した GDP ナウキャスティング

1 機械学習を活用した GDP ナウキャスティング1,2 －鉱工業指数からみた足もとの景気－白井洋至† 【要旨】
GDP 統計（四半期別 GDP 速報）は、国民経済の活動状況を多面的・総合的に表す極めて重要な経済指標であるものの、その公表時期は遅く、足もとの景気判断に用いることはできない。こうした経緯もあり、従前、速報性の高い月次経済指標等を用いて、足もとの GDP 統計を予測する、 GDP ナウキャスティングの研究が行われている。本稿では、既存の手法とは異なり、鉱工業指数の業種別データのみを説明変数に、機械学習を活用して GDP ナウキャスティングを行ったところ、良好な予測精度が得られた。さらに、当該モデル予測とコンセンサス予測を組み合わせることにより、予測精度が向上した。このことは、当該モデルにおいても、鉱工業指数以外の情報を追加することにより、予測精度のさらなる向上が期待できることを示唆している。 1 本稿の内容は、個人的な見解をもとにまとめたものであり、掲載されている内容により、直接的・間接的を問わず、何らかの被害をこうむった場合にも一切の責任を負いません。また本稿の内容は予告なしに変更または廃止することがあります。 2 最終更新日：2019 年 5 月 3 日 † [email protected]

2 1. はじめに3 GDP 統計（四半期別 GDP 速報）は、国民経済の活動状況を多面的・総合的に表す極めて重要な経済指標である。しかし、四半期統計であることに加え、各種の基礎統計を利用して推計する加工統計のため、最も公表の早い 1
次速報（以下、1 次 QE）ですら、その公表時期は、当該四半期最終月から 1 か月と 2 週間程度後と、ラグが生じている。こうした経緯もあり、GDP 統計をより早く把握したいというニーズは強く、従前、速報性の高い月次経済指標等を用いて、足もとの GDP 統計を予測する、GDP ナウキャスティングの研究が行われている4,5。GDP ナウキャスティングの一般的な手法としては、 GDP やその需要項目を厳選した少数の速報性の高い経済指標で説明する「ブリッジ・モデル」や多数の経済指標の情報を少数のファクターに集約して用いる「ファクター・モデル」が挙げられる6,7,8（原[2014]）。また、近年では、「ブリッジ・モデル」と「ファクター・モデル」のハイブリッド型モデルも開発されており、原ら[2013]や原[2014]は、その予測精度は、民間エコノミスト約 40 名のコンセンサス予測である ESP フォーキャスト調査（以下、 ESP 調査9）を平均的に上回ると報告している。さらに、近松ら[2018]は、こうしたモデル予測とエコノミスト等による予測を組み合わせることで、予測精度がさらに向上すると報告している10。本分析も同様に GDP ナウキャスティングを行うものであるが、先行研究との大きな違いは、予測手法に機械学習の手法を用いたこと、その説明変数として鉱工業指数の業種別データのみを用いたことの二点である。近年、機械学習は、社会的にも大きな注目を集めているが、GDP ナウキャスティングへの活用は、未だ一般的とはいえない11,12。この背景には、機械学習を用いた分析は、高い予測精度こそ期待されるものの、結果の解釈やその説明は、線形回帰等に比べて難しく、経 3 内閣府 <https://www.esri.cao.go.jp/jp/sna/data/reference1/h23/pdf/sakusei_houhou23_201811.pdf> <https://www.esri.cao.go.jp/jp/sna/data/data_list/sokuhou/files/old_keisu/old_keisu_top.html> （参照日：2019 年 5 月 3 日） 4 Banbura ら[2010]は、ナウキャスティングを「We define nowcasting as the prediction of the present, the very near future and the very recent past.」としている。本稿では、1 四半期前（例えば 2019 年 1 月時点であれば 2018 年 10-12 月期）を分析対象とする。 5 以下では、経済指標を用いた GDP ナウキャスティングの研究事例を挙げるが、近年では、高杉ら[2015]や山澤 [2018]のようにテキストデータを用いたものも存在する。 6 ブリッジ・モデルは予測対象に対する説明力の観点から利用指標を絞り込むため、有用性の低い情報が入りにくいい。他方、ファクター・モデルは多数の指標を 1 つの予測モデルに取り入れることが可能である（原[2014]）。原ら [2013]や原[2014]では、近年、GDP ナウキャスティング手法の主流は、ブリッジ・モデルからファクター・モデルに移ってきていると指摘している。 7 各モデルの研究事例としては、ブリッジ・モデルでは増島[2014]や稲田[2011, 2014]等、ファクター・モデルでは北村[2002]や浦沢[2014]等を参照。 8 本稿では、日本の GDP ナウキャスティングに焦点をあてるが、米国では、アトランタ連銀（GDPNow）やニューヨーク連銀（New York Fed Staff Nowcast）が GDP ナウキャストを公表しており、市場参加者からの注目度も高い。 GDPNow <https://www.frbatlanta.org/cqer/research/gdpnow.aspx> New York Fed Staff Nowcast <https://www.newyorkfed.org/research/policy/nowcast> （参照日：2019 年 5 月 3 日） 9 ESP 調査の概要は、日本経済研究センター<https://www.jcer.or.jp/esp-forecast-top> （参照日：2019 年 5 月 3 日）を参照。また、その経緯や予測精度については、稲田[2011]、小峰[2015]、斎藤[2015]等に詳しい。 10 近松ら[2018]については、日本銀行として当該手法による GDP 予測の公表は未定としているものの、その活用が期待されている（日本経済新聞[2018]）。 11 機械学習の GDP ナウキャスティングへの活用事例としては、Richardson ら[2018]が挙げられる。 12 日本における機械学習の経済分析への活用事例やその課題等は、白井[2018] <https://www.slideshare.net/seconda_punta/cpi-126600190> （参照日：2019 年 5 月 3 日）等を参照。最近では、大和総研が「AI を活用した経済指標予測」の公表を開始する等、ナウキャスティングへの新たな活用事例もみられている。大和総研 <https://www.dir.co.jp/release/2018/18122601.html> （参照日：2019 年 5 月 3 日）

3 済学的な理論モデルやエコノミストの実務等には馴染み辛いということが考えられる 12,13,14。しかし、GDP ナウキャスティングの最大の目的が足もとの GDP 統計の予測であること、機械学習活用による知見が十分に蓄積していない現状を踏まえれば、検討の余地があると考えられる。また、
前述の先行研究は、手法こそ異なるものの、いずれも多数の経済指標を必要とする。例えば、原ら[2013]や原[2014]では、GDP 統計の基礎統計 473 系列に加え、鉱工業生産指数、第三次産業活動指数、21 系列のサーベイ・データの約 500 もの経済指標を用いており、データ収集・加工等の作業プロセスが煩雑になると想定される。本稿では、GDP ナウキャスティングの説明変数を鉱工業指数の業種別データのみとすることで、こうした作業負担の軽減を図った。 2. GDP 統計と鉱工業指数15 2.1 GDP 統計本分析では、GDP 統計のうち、最も注目度の高い実質 GDP 前期比年率（以下、実質 GDP）を目的変数とした。なお、GDP 統計については、より精度の高い基礎資料の入手等に伴い、頻繁に改定されるため、いつ時点の計数を目的変数とするかを定める必要がある 1,16,17。ここでは、より早い段階での実質 GDP の把握を念頭に 1 次 QE を目的変数とした。具体的には、内閣府 HP より取得可能な 2002 年 2Q から 2018 年 4Q までの実質 GDP（1 次 QE）を用いた18。 2.2 鉱工業指数19 鉱工業指数は、経済産業省から公表される経済指標であり、日本全体の鉱工業の動向を示す。本分析で鉱工業指数を用いる主な理由は、①景気の動きに敏感であること、②速報性の高さの 2 点である。 ① 景気の動きに敏感であること GDP に占める鉱工業の割合は 2 割弱とそれほど大きくないものの、景気の現状を示す景気動向指数（一致 CI）の採用系列のうち、約半数が鉱工業指数から選定される等20、鉱工業指数は、景気の動きに敏感であることが知られている。 13 そのほか、経済分析の場合、サンプルサイズの小ささも影響しているように思われる。例えば、GDP 統計のような四半期統計の場合、20～30 年分のデータを用いても、そのデータ数はたかだか 100 前後である。この問題については、本稿 3 章で改めて指摘する。 14 機械学習と統計学の違いは、小野田[2018]等を参照。 15 本分析で用いるデータは、すべて内閣府、経済産業省 HP より取得した。内閣府 <https://www.esri.cao.go.jp/jp/sna/data/data_list/sokuhou/files/files_sokuhou.html> 経済産業省 <https://www.meti.go.jp/statistics/tyo/iip/b2015_result-2.html> （参照日：2019 年 5 月 3 日） 16 公表元である内閣府によれば、GDP 統計においては、公表時期を出来るだけ早めるために、早期に利用できる基礎資料を用いて推計するとともに、より精度の高い基礎資料の入手に応じて、段階的に推計値を改定し、統計の正確性を一層高めていくとしており、1 次速報公表後も計 5 回の改定が行われる。それ以外にも、季節調整のかけ直し、基礎統計の年間補正、推計方法の見直し等に対応し、随時遡及改定が行われる。 17 前述の先行研究でも、いつ時点の計数でナウキャスティングを行うかについては、必ずしも一致していない。 18 なお、当該期間中にも数回の基準改定が行われているが、特段の処理は行わず、公表値をそのまま用いた。 19 経済産業省 <https://www.meti.go.jp/statistics/toppage/report/minikaisetsu/pdf/iip_nyuumon.pdf> （参照日：2019 年 5 月 3 日） 20 生産指数（鉱工業）、鉱工業用生産財出荷指数、耐久消費財出荷指数、投資財出荷指数（除輸送機械）の 4 系列が採用されている。内閣府 <https://www.esri.cao.go.jp/jp/stat/di/kobetu_gaiyou.html> （参照日：2019 年 5 月 3 日）

4 ② 速報性の高さ鉱工業指数は、月次経済指標であり、その公表時期は、翌月末に速報を公表と、GDP 統計（1 次 QE）に対して 2 週間程度先行している。そのため、①の性質も含めて、GDP ナウキャスティング
に適した経済指標といえる。また、本分析の特徴の一つが、鉱工業指数のうち生産・出荷・在庫指数、それぞれの業種別データを用いたことである。例えば、鉱工業生産指数は、業種別の生産指数を基準年における各業種のウエイト（付加価値額）で加重平均したものであり、全業種の生産動向が一つの指標に集約されている。その一方、加重平均を行うことによって、個別業種がそれぞれ持つ、足もとの景気に関する情報が失われている可能性がある21。本分析では、実質 GDP 同様、2002 年 2Q 以降の鉱工業指数（生産・出荷・在庫）の業種別データの前期比を説明変数とすることにより、こうした情報を取り込むことを試みた22。なお、鉱工業指数も GDP 統計同様、速報以降数回の改定が行われるが、経済産業省 HP より取得できるデータは、最新の改定値のみである。そのため、厳密には GDP 統計（1 次 QE）と指標公表時点が異なることには留意が必要である。 3. 分析手法 2002 年 2Q から 2018 年 4Q までの実質 GDP を目的変数、鉱工業指数（生産・出荷・在庫）の業種別データ（前期比）を説明変数に、2002 年 2Q から 2015 年 4Q の約 14 年分を学習データ、2016 年 1Q から 2018 年 4Q の直近 3 年分をテストデータとしてナウキャスティングを行った。但し、当該データセットを機械学習のモデルにそのまま当てはめることは、以下の観点から適切でないと考えられる。まず、目的変数よりも説明変数のデータ数の方が多く、過学習が生じやすい構造にある。加えて、説明変数の中には、そもそも目的変数とは関連性の低い変数や経済構造の変化等により、その関係性が不安定な変数も含まれることが想定される。本分析では、こうした懸念を考慮し、より頑健性の高い予測モデルを構築するために、以下 3.1～3.4 の操作を行った。なお、予測精度の評価には、テストデータにおける実績値と予測値の RMSE（平均平方二乗誤差）を用いた。この際、鉱工業生産指数（前期比）を説明変数とした単回帰分析をベンチマークとした。 3.1 説明変数の選択目的変数と関係性の低い説明変数やその関係性が不安定な説明変数を探索するため、学習データ（2002 年 2Q から 2015 年 4Q）を 2002 年 2Q から 2012 年 4Q （約 11 年分）と 2013 年 1Q から 2015 年 4Q（3 年分）に分割し23、両期間における目的変数と各説明変数の相関係数を算出した。得られた相関係数の積が 0 未満、または、その差が 0.5 超の変数については、データセットから取り除いた。 21 こうした考え方は、GDP ナウキャスティングではないものの、水門ら[2019]や白井[2018]12 に近い。 22 鉱工業指数（生産・出荷・在庫）の業種別データのうち、2002 年 2Q 以降、連続したデータの取得が可能な計数を抽出した。この結果、「生産指数」、「出荷指数」は 91 系列、「在庫指数」は 75 系列のデータセットとなった。 23 テストデータが直近 3 年間であることを考慮した。

5 3.2 予測モデルの選択過学習を回避するため、ディープラーニングやアンサンブル学習のような複雑なモデルは用いず、類似研究である Richardson ら[2018]や白井[2018]12 を参考に、比較的シンプルなモデルであるサポートベクトル回帰のみを用いた24,25,26。分析には、統計解析ソフト「R」の kernlab
パッケージを用い、ハイパーパラメータの設定には、時系列データであることを考慮し、caret パッケージの createTimeSlices を用いた27。 3.3 複数のモデル予測を組み合わせ（単純平均）学習データ内で良好なモデルが得られたとしても、その後、経済構造に変化等が生じた場合、テストデータにおける予測が不安定になる恐れがある。ここでは、そうしたリスクを分散させるため、鉱工業指数（生産・出荷・在庫）の業種別データをすべて説明変数とするのではなく、「生産指数」、「出荷指数」、「在庫指数」、「生産・出荷指数」、「生産・在庫指数」、「出荷・在庫指数」、「生産・出荷・在庫指数」の 7 つを説明変数として、それぞれの予測モデルを構築した。そのうえで、それらのモデル予測を様々な組み合わせで単純平均することにより、最終的な予測値とした。 3.4 モデルの頑健性のチェックモデルの頑健性をチェックする目的から、同様の操作を、学習データを 2002 年 2Q から 2016 年 4Q の約 15 年分、テストデータを 2017 年 1Q から 2018 年 4Q の直近 2 年分としたもの（学習データを 1 年分延長）についても行い、参考値として RMSE 28を算出した（以下、参考 RMSE）。 4. 分析結果表 1 は、予測精度上位 3 位のモデルとベンチマークの RMSE であり、いずれのモデル予測もベンチマークを上回る予測精度（RMSE：0.75％～0.76％）となった。また、これらのモデル予測の RMSE と参考 RMSE の差は 0.1％強と、一定の頑健性も確認された。前述の通り、本分析に用いた鉱工業指数は最新の改定値であるため、単純な比較はできないが、実質 GDP（1 次 QE）公表月の ESP 調査の RMSE（直近 3 年分）が 0.84％であることを踏まえれば、良好な予測結果といえる。以上を 24 Richardson ら[2018]は、GDP ナウキャスティングにあたり、いくつかの機械学習の手法を試し、その中でもサポートベクトル回帰の予測精度が最も高いと報告している。同様に、CPI ナウキャスティングを行った白井[2018]12 においてもサポートベクトル回帰の予測精度の高さが示されている。実際、本分析においても、ランダムフォレスト、勾配ブースティング等も試したが、サポートベクトル回帰を上回る結果は得られなかった。 25 サポートベクトル回帰については、赤穂[2008]や Hastie[2014]等を参照。 26 Hastie[2014]では、説明変数の数が目的変数よりもかなり大きい場合には、分散の大きさと過学習が主要な問題となり、その結果として、シンプルで強く正則化された手法が選択されることが多いと指摘している。 27 createTimeSlices の各パラメータは、テストデータが 3 年間であることを考慮し、initialWindow ＝ 40、 horizon＝ 12、fixedWindow ＝ FALSE とした。時系列データの交差検証については、 <https://otexts.com/fpp2/accuracy.html> （参照日：2019 年 5 月 3 日）等を参照。 28 この場合、説明変数の選択には、学習データ（2002 年 2Q から 2016 年 4Q）を 2002 年 2Q から 2014 年 4Q（約 13 分）と 2015 年 1Q から 2016 年 4Q（2 年分）に分割したものを用いた。また、createTimeSlices の各パラメータは、 initialWindow ＝ 40、horizon ＝ 8、fixedWindow ＝ FALSE とした。

6 まとめれば、説明変数を鉱工業指数（生産・出荷・在庫）の業種別データのみとしても、機械学習を活用することにより、良好な予測精度での GDP ナウキャスティングが可能であることが確認された。なお、興味深いことに、近松ら[2018]を参考に、当該モデル予測と
ESP 調査の単純平均をとり、 RMSE を算出したところ、0.65％となり、モデル予測をさらに上回る予測精度となった。これは、当該モデル予測が鉱工業指数のみから成るのに対し、ESP 調査はそれ以外の様々な情報も織り込んでおり、両者が補完関係にあることに起因すると考えられる。すなわち、本分析では、データ収集・加工等の作業負担軽減のため、説明変数に鉱工業指数のみを用いたが、当該モデルにおいても、鉱工業指数以外の情報を追加することにより、予測精度のさらなる向上が期待できることを示唆している。表 1 予測精度上位 3 位のモデルとベンチマークの RMSE（単位：％）予測モデルの組み合わせ RMSE （参考 RMSE） ①「生産指数」＋「出荷指数」＋「在庫指数」 0.75 0.94 ②「生産指数」＋「在庫指数」＋「生産・出荷指数」＋「生産・在庫指数」＋「出荷・在庫指数」 0.75 0.88 ③「生産指数」＋「出荷指数」＋「在庫指数」＋「出荷指数・在庫指数」 0.76 0.86 （ベンチマーク）鉱工業生産指数を説明変数とした単回帰分析 1.01 1.14 図 1 実質 GDP とモデル予測（表 1①）の推移実質 GDP（実線）予測値（点線）（備考）内閣府「四半期別 GDP 速報」、経済産業省「鉱工業指数」により作成、「」により（備考）内閣府「四半期別 GDP 速報」、経済産業省「鉱工業指数」により作成、「」により

7 5. まとめ鉱工業指数の業種別データのみを説明変数に、機械学習を活用して GDP ナウキャスティングを行ったところ、良好な予測精度が得られた。さらに、当該モデル予測とコンセンサス予測を組み合わせることにより、予測精度が向上した。このことは、当該モデルにおいても、鉱工業指数以外の情報を追加することにより、予測精度のさらなる向上が期待できることを示唆している。本稿で得られた結果を踏まえれば、GDP
ナウキャスティングにおいて、機械学習を活用することにより、既存の手法とは異なる新たな知見が得られた。こうした知見の蓄積は、当該分野に新たな可能性をもたらすものと考えられる29。 29 本稿では、主に月次経済指標を用いた GDP ナウキャスティングに焦点をあてたが、予測精度の向上に加え、公表頻度の引き上げや早期化等を達成するためには、前述のテキストデータ等 5、経済指標以外のデータ活用も検討する必要がある。

8 参考文献 [1] 赤穂昭太郎（2008）「カーネル多変量解析―非線形データ解析の新しい展開 (シリーズ確率と情報の科学)」岩波書店 [2] 稲田義久（2011）「日本経済のマクロ計量分析：超短期モデル予測と合意予測」日本経済新
聞出版社 [3] 稲田義久（2014）「超短期モデルの日本経済への応用と展開」月刊誌「統計」2014 年 4 月号 [4] 浦沢聡士（2014）「リアル・タイム GDP 予測：ダイナミック・ファクター・モデルの活用」 ESR No.6 2014 年秋号 [5] 小野田崇(2018)「機械学習とは何か？」月刊誌「統計」2018 年 1 月号 [6] 北村冨行、小池良司(2002）「多くの情報変数を用いた予測方法の有用性について」日本銀行金融研究所ディスカッション・ペーパー・シリーズ [7] 小峰隆夫(2015)「ESP フォーキャスト調査の歩みと成果」月刊誌「統計」2015 年 12 月号 [8] 斎藤太郎(2015）「コンセンサス予測と個別機関予測の特徴－月次指標予測による分析－」月刊誌「統計」2015 年 12 月号 [9] 高杉亮介、山名早人（2015）「国会議事録を用いた経済指標のナウキャスティング」 DEIM Forum 2015 [10] 近松京介、平形尚久、城戸陽介、大高一樹（2018）「わが国の GDP のナウキャスティングに関する検討」日本銀行ワーキングペーパーシリーズ [11] 水門善之、坂地泰紀、和泉潔、島田尚、松島裕康（2019）「内閣府景気動向指数の先行系列に基づく機械学習を用いた短期経済予測」SIG-SAI-034-04 [12] 日本経済新聞「エコノミスト泣かせ？日銀が GDP を正確に予測」2018 年 12 月 13 日付電子版 [13] 原尚子、山根渉太郎（2013）「GDP のナウキャスティング（足もと予測）のための新たな月次推計手法」日本銀行ワーキングペーパーシリーズ [14] 原尚子（2014）「GDP ナウキャスティング：大量の指標を利用した新たな予測手法」月刊誌「統計」2014 年 4 月号 [15] 増島雄樹（2014）「月次 GDP による予測の強みと弱み－検索データ活用で早期の精度向上も－」月刊誌「統計」2014 年 4 月号 [16] 山澤成康（2018）「計量テキスト分析による景気判断－コーディングルールや主成分を使った時系列分析－」ESRI Discussion Paper [17] Adam Richardson, Thomas van Florenstein Mulder, Tugrul Vehbi.（2018）“Nowcasting New Zealand GDP Using Machine Learning Algorithms”, CAMA Working Paper [18] Martha Banbura, Domenico Giannone, Lucrezia Reichlin.（2010）“Nowcasting”, Working Paper Series, European Central Bank [19] Trevor Hastie, Robert Tibshirani, Jerome Friedman, 杉山将ほか訳（2014）「統計的学習の基礎―データマイニング・推論・予測―」共立出版

機械学習を活用した GDP ナウキャスティング

機械学習を活用した GDP ナウキャスティング

secondapunta

More Decks by secondapunta

Other Decks in Research

Featured

Transcript

1 機械学習を活用した GDP ナウキャスティング1,2 －鉱工業指数からみた足もとの景気－白井洋至† 【要旨】

4 ② 速報性の高さ鉱工業指数は、月次経済指標であり、その公表時期は、翌月末に速報を公表と、GDP 統計（1 次 QE）に対して 2 週間程度先行している。そのため、①の性質も含めて、GDP ナウキャスティング

8 参考文献 [1] 赤穂昭太郎（2008）「カーネル多変量解析―非線形データ解析の新しい展開 (シリーズ確率と情報の科学)」岩波書店 [2] 稲田義久（2011）「日本経済のマクロ計量分析：超短期モデル予測と合意予測」日本経済新