Slide 1

Slide 1 text

Pythonではじめる オープンデータ分析 〜書籍の紹介と書籍で紹介しきれなかった事例の紹介〜 吉住遼 みんなのPython勉強会 2025/12/11 @Zoom

Slide 2

Slide 2 text

自己紹介 吉住遼 @well_living_ry ● 所属など ○ 株式会社マネーフォワード / マネーフォワード総合研究所 ○ データアナリスト・サイエンティスト ● Pythonとか ○ Python歴は10年以上 ○ PyCon JP 2022登壇(後で少し触れます) ○ 10月に著書『Pythonではじめるオープンデータ分析 』出版→ ● SNSいろいろ ○ X: Ryo YOSHIZUMI @well_living_ry ( https://x.com/well_living_ry ) ○ GitHub: WeLLiving @well-living ( https://github.com/well-living ) ○ note: Ryo YOSHIZUMI ( https://note.com/well_living_ry ) ○ zenn: Ryo YOSHI @welliving ( https://zenn.dev/welliving ) ○ Qiita: Ryo YOSHI @well_living ( https://qiita.com/well_living ) ○ Spaker Deck: Ryo YOSHI @welliving ( https://speakerdeck.com/welliving )

Slide 3

Slide 3 text

よくあるやつ(留意事項) ● 本資料に記載された情報は発表者にて判断した情報源を元に個人が作成したものであり、所属組織 (マ ネーフォワード)が作成したものではありません。 ● 本資料に記載された内容は、資料作成時点においてのものであり、予告なく変更する場合があります。 ● 本資料の内容および情報の正確性、完全性等について、何ら保証を行っておらず、また、いかなる責任 を持つものではありません。 ● 本資料は、e-Statやその他公的サービスから取得したデータを使用していますが、資料の内容 (数値)は 国によって保証されたものではありません。

Slide 4

Slide 4 text

ざっくり目次 ● 少しだけ会社紹介 ● 書籍『Pythonではじめるオープンデータ分析』の紹介 ● 【余談】出版の経緯 ● 書籍にないオープンデータの活用例 ● お知らせ 想定する聞き手と前提知識 ● 書籍『Pythonではじめるオープンデータ分析』やオープンデータに興味がある方 ● Pythonを触ったことがあるくらいの知識をお持ちの方

Slide 5

Slide 5 text

株式会社マネーフォワード ● オープンデータ活用事例に関わるので少しだけ会社紹介 マネーフォワード は、SaaS×Fintech領域で、国内最大級のユーザー基盤とプロダクトラインナップを提供 個人向け家計簿アプリ 『マネーフォワード ME』 法人・個人事業主向けバックオフィスSaaS 『マネーフォワード クラウド』 *マネーフォワード 2025/12/8時点Webサイトより

Slide 6

Slide 6 text

Money Forward, Inc. 6 家計簿アプリ「マネーフォワード ME」 とマーケティング支援「マネーフォワード ME リサーチ」 *2 こちらをご覧ください→ https://biz.hm.moneyforward.com/services/research *2 調査設計からレポート納品までワンストップ 数千〜数万件のアンケート回収が可能 1 購買・投資データを活用した購入者像・非購入者像の属性分析 調査設計からレポート納品までお任せください。家計簿デー タを⽤いてアンケート配信対象者を限定した上で、数千〜数万 のアンケート回収が可能です。 購買‧投資データを分析し、購⼊者像‧⾮購⼊者像を具体的 に把握することができます。デモグラ分析だけではなく、お⾦ の使い⽅やライフスタイルの傾向など、ユニークな情報を提供 します。 2 1,700万⼈突破! ※1 *1 調査委託先:株式会社マクロミル、回答者: 20~60代の家計簿アプリ利用者 各1,034名、調査期間:家計簿アプリ    2024年8月13日~2024年8月14日、資産管理アプリ  2024年8月13日~2024年8月14日、調査手法:インターネットリサ ―チ。   家計簿アプリは、スマホやタブレットを使って家計簿を管理できるアプリ、資産管理アプリとは、スマホやタブレットを使って複数の資産を一元管理で きるアプリを指す。 ● 様々な金融関連サービスを一元管理 2,590以上の金融関連サービスに対応。金融機関の対応数国内No.1※1 ! ● 自動分類で家計や支出を見える化 毎日の支出を、食費や日用品などに自動で分類。 何にお金を使っているのか、今月あとどれだけ使えるのか、簡単に確認でき る。 ● 銀行や証券の連携で資産全体も管理 生活用や貯金用のいくつもある銀行口座や、 証券口座を連携すると、あなたの資産をまとめて確認できる。

Slide 7

Slide 7 text

法人・個人事業主向けバックオフィスSaaS マネーフォワード クラウド *マネーフォワード 2025年11月期第3四半期決算説明資料より抜粋

Slide 8

Slide 8 text

Money Forward, Inc. 8 https://corp.moneyforward.com/institute/

Slide 9

Slide 9 text

書籍『Pythonではじめるオープンデータ分析 』 ● データも事例も豊富 ○ オープンデータや統計データの活用方法について、包括 的にまとめた本 ○ 人口、家計、為替、GDP、企業統計など扱うデータも事 例も豊富 ● 経済統計や公的統計などのデータの取得から加工、可視 化、分析までを Pythonを用いて実践的に学べる ○ e-Stat、gBizINFO、EDINET、FREDなど様々なデータ取 得元サービスやAPIを紹介 ○ APIキーさえ取得すればサポートサイト( GitHub)のソー スコードをすぐ動かして実践できる ● オープンデータで世の中を知る面白さ ○ Pythonが書けなくても本書のグラフを見るだけでもいろ いろ知れる ○ 応用すれば、データを活用し事実に基づいてビジネスや 研究に役立つ示唆を出せるようになる …はず

Slide 10

Slide 10 text

オープンデータ?経済統計?公的統計? ● A. オープンデータ ○ 誰もがインターネットなどを通じて容易に利用できる ような形で公開されたデータ ● B. 経済統計・指数 ○ 家計や企業活動、物価など、経済に関する統計・指 数 ● C. 公的統計 ○ 国の行政機関・地方公共団体などが作成する統計 ● オープンデータと公的統計には定義がある(次とその次の参考スライド) ● 本書では主にベン図の S = A ∪ B ∪ C に含まれるデータを扱い、株価など一部の役立つ S のデータも 扱う

Slide 11

Slide 11 text

【参考】オープンデータとは (1) 出典:Open Knowledge Foundation「Open Data Handbook」(https://opendatahandbook.org/guide/ja/what-is-open-data/)、CC BY 4.0 (2) 出典:デジタル庁ウェブサイト(https://www.digital.go.jp/resources/open_data)、PDL1.0(https://www.digital.go.jp/resources/open_data/public_data_license_v1.0) Open Knowledge Foundationの定義(*1) ● 利用できる、そしてアクセスできる ○ データ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロード できるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。 ● 再利用と再配布ができる ○ データを提供するにあたって、再利用や再配布を許可しなければならない。また、他のデータセットと組み合わせて使うことも許可しなければなら ない。 ● 誰でも使える ○ 誰もが利用、再利用、再配布をできなければならない。データの使い道、人種、所属団体などによる差別をしてはいけない。たとえば「非営利目 的での利用に限る」などという制限をすると商用での利用を制限してしまうし「教育目的での利用に限る」などの制限も許されない。 日本政府の定義(*2) 国、地方公共団体及び事業者が保有する官民データのうち、国民誰もがインターネット等を通じて容易に利用(加工、編集、再配布等)できるよう、次のいずれの 項目にも該当する形で公開されたデータをオープンデータと定義する。 ● ① 営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの ● ② 機械判読に適したもの ● ③ 無償で利用できるもの

Slide 12

Slide 12 text

【参考】公的統計と基幹統計 「統計法の目的 は、公的統計の作成及び提供に関し基本となる事項を定めることにより、 公的統計の体系的 かつ効率的な整備及びその有用性の確保 を図り、国民経済の健全な発展及び国民生活の向上に寄与 する こととなっています(第 1条)。」(*1) ● 公的統計(*1) ○ 国の行政機関・地方公共団体などが作成する統計 ● 基幹統計(*2) ○ 国勢統計、国民経済計算、その他、国の行政機関が作成する統計のうち総務大臣が指定する特に 重要な統計 (*1) 出典:「統計法について」(総務省)(https://www.soumu.go.jp/toukei_toukatsu/index/seido/1-1n.htm) (*2) 出典:「基幹統計一覧」(総務省)(https://www.soumu.go.jp/toukei_toukatsu/index/seido/1-3k.htm)

Slide 13

Slide 13 text

本書で取り上げているオープンデータや公的統計 政府統計ポータルサイトe-Statだけでも2025/12現在、700以上の調査と150万以上の データセット →多種多様なデータの中から適当に選んでるわけではないです ● 日本の統計の場合 ○ 基幹統計や統計検定 統計調査士の資格で扱われる統計、あるいは肥後雅博著『 経済統計への招 待』や新家義貴著『経済指標の読み方』など研究者・エコノミストが書籍で取り上げている統計から 選定 ● 世界の統計の場合 ○ 人口やGDPなどの選定の観点は日本の統計と同じ。国際連合や米国統計局のような信頼できる 機関のサイトやAPIを紹介

Slide 14

Slide 14 text

例えば生活時間は基幹統計の社会生活基本調査から 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 15

Slide 15 text

例えば生活時間は基幹統計の社会生活基本調査から 1日4分×365日≒24時間。StaPy約2時間毎月参加で「学習」時間の年平均はほぼ達成 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 16

Slide 16 text

第Ⅰ部 Pythonデータ分析の基礎 + 第Ⅱ部第6章 第2部以降のオープンデータを扱う際に必要となるデータ取得 からデータハンドリング、統計値の集計、可視化までを Python で行う方法を紹介 ● すでにPythonでのデータ分析に習熟されているアナリス ト・エンジニアの方 ○ →軽い復習やメソッドを思い出せないときのリファ レンスに。 ● はじめてPythonでのデータ分析に触れる方 ○ →書籍掲載のコードは上からそのまま実行できま す。Pythonの基本的なコーディング(リストや for文 など)の入門書は別途ご用意ください。 (例えば、春山鉄源著『 経済学のためのPython入門』など) 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 17

Slide 17 text

Point ● データハンドリングのライブラリはオーソドックス なpandas ● データ抽出、整形、結合などの図解が豊富 → ● サンプルコードのNotebookではメソッドごとにセ ルで実行結果を確認できる ● 「基幹統計」「名目値」など公的統計や経済統計 特有の考え方も紹介 あと、架空の会社のサンプルのデータフレームが(たぶ ん)使いやすい(生成AIと壁打ちしながら作った) pandas ~データハンドリングと統計の基礎~ 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 18

Slide 18 text

データの可視化とPlotly Point ● 可視化ライブラリはMatplotlibよりインタラクティブなグラフが作りやすい Plotlyがメイン ● 棒グラフ、折れ線、円グラフ、・・・主要なグラフを Plotlyで可視化するコードを一通り紹介 ● 色・サイズの変更、グラフの組み合わせ、複数の描画領域などの Plotlyのテクニックを少ないページ数で コンパクトに説明 (出典:『Pythonではじめるオープンデータ分析』講談社)

Slide 19

Slide 19 text

5章と1.2節 データ取得と著作権~Requestsとpython-dotenv~ Point ● APIでのデータ取得は標準ライブラリの urllib.requestより手軽なRequests ● APIキーの安全な利用方法として、環境変数の設定や「 .env」ファイルとpython-dotenvライブラリ、 「.gitignore」についてもちゃんと説明 ● 第1章では、データの利用規約と著作権(「 CC BY」や「PDL 1.0」など)についても丁寧に解説 可視化や統計のような分析の技術的 側面だけでない正しいデータの扱い 方も学べる 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 20

Slide 20 text

第Ⅱ部 第6章 オープンデータ・経済統計・公的統計 Point ● 第6章は書籍全体の中核の章 ● 公的機関などのデータを一覧で紹介 ○ 世界の公的機関のデータとサービス ■ 国連、世界銀行、IMF、WHO、WTO、OECD、BIS、 EUのEurostat、米国統計局、米国FRBのFREDなど ○ 日本の公的機関のデータとサービス ■ e-Stat、日本銀行時系列統計データ検索サイト、 EDINET、法人番号公表サイト、gBizINFO、不動産情 報ライブラリ、地理院地図、RESAS、東京都オープン データカタログサイト、e-Govポータル、Japan Dashboardなど ● 特に日本の政府統計ポータルサイト e-Statの使い方を詳 細に説明→ 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 21

Slide 21 text

第2部 オープンデータ分析の基礎 と 第3部 オープンデータ分析の実践 ● e-StatやgBizINFOなどサービスごとではなく、データの種類・分野ごとの章立 て ○ 関心分野に合わせて好きな章だけ読める ● 次スライドで第7章人口データ、8章家計・生活・労働データ、 11章法人・産業 データとその活用について少し紹介 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 22

Slide 22 text

人口データとテキスト生成AI(LLM)のプロンプトへの活用 よく見かける人口ピラミッドも Plotlyで可視化 ● からあげ(@karaage0703)さん「本の内容を プロンプトとして入れると、可視化結果とか グッとよくなりますし、結果の答え合わせとし て本を活用できます。 」 (* Xより抜粋) ● 例えば、国勢調査の人口のデータは "時間 軸(調査年) " 列に "2020年"と"2020年の不 詳補完値 " があったり、各列に"総数" や"再 掲" など重複して集計してしまう項目が含ま れていたりするので、 LLMのプロンプトは本 書や本書の参照リンクを参考に設計すると 誤った出力をしにくい * https://x.com/karaage0703/status/1985322766812455045 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 23

Slide 23 text

家計・生活・労働データと書籍で紹介していないデータへの応用 ● 家計調査:消費者側の世帯を対象とした統計 ● 小売物価統計調査 :供給者側の店舗を対象とした 統計 ● どちらも国の基幹統計ですが、小売物価統計は書 籍では取り上げませんでした。 *note「オープンデータ分析の書籍出版によせて~家計調査と小売物価統計調査の付録~」 ←本書を通じて、データの入手先を把握 し、Python を使えるようになると、本書で 紹介している事例以外にも、みずから必 要な情報を取得し、加工できるようになる

Slide 24

Slide 24 text

法人・産業データとgBizINFO API移行の対応について ● 法人・企業・会社などの用語の定義を整 理した上で、経済センサスなどの目的に 応じたデータを紹介 ● 法人データはgBizINFOで個社ごとの データが取得可能 ○ gBizINFOのAPIは2026年1月に 次期システムに移行予定で、 2025年12月現在、新規利用の受 付はしていません。 ○ 次期システム公開後1か月くらい を目途に、書籍のサポートサイト GitHubに次期システムの仕様に 対応した修正コードを提供予定で す。 出典:『Pythonではじめるオープンデータ分析』講談社

Slide 25

Slide 25 text

オープンデータ分析をなぜ「Pythonではじめる」のがよいのか ● Pythonはpandas, Plotly, Requestsなどオープン・ソース・ソフトウェア(OSS)のライブラリが豊富 ● Pythonはインターネットや書籍の情報も多い(心なしか生成AIの回答も他のプログラミング言語より良い 気がする) ● Pythonはデータ取得から加工、可視化、分析まで、一気通貫で行うのにとりわけ便利 ● 本書の内容を応用して、 ○ オープンデータを特徴量にしてscikit-learnやPyTorchなどで機械学習をするにも、 ○ statsmodelsなどで統計解析するにも、 ○ 可視化してDashやStreamlitなどで簡単なWebアプリにするにも、 ○ OpenAIやAnthropicのライブラリでLLMのプロンプトにするにも、 ○ AirflowやSQLModelなど組み合わせてデータ取得とDB格納を定期実行するにも、 ○ DjangoやFastAPIなどでオープンデータを活用した本格的なアプリのバックエンドを作るにも、 ○ →どんな方向へも発展させやすいのがPythonの良いところ

Slide 26

Slide 26 text

Pythonで作りたいものがないなら、「オープンデータ分析 」 ● オープンデータは使いやすい。だから、はじめやすい ○ 誰もがインターネットなどを通じて容易に利用できるような形で公開されたデータ ● オープンデータのうち、公的データは、意味のあるデータ・知識が身につくデータ ○ 公的統計などの公的機関のオープンデータは、データの中身を知ること自体が社会を知ることにな り、仕事や何らかの役に立つことも多い ○ ボストンやカリフォルニアの住宅価格とかアヤメの種類とかがデータ自体として役に立つ日本人は 稀(カリフォルニアに移住するか不動産購入するなら役立つのかもしれない)

Slide 27

Slide 27 text

No content

Slide 28

Slide 28 text

【余談その1】PyCon JP 登壇から出版まで ● 2022年10月15日 PyCon JP 2022 登壇 「Pythonで公的統計APIのオープンデータ活用 」 ● 講談社サイエンティフィクの方から書籍執筆の企画提案をいただく ● 〜約2年半〜 ● 2025年10月24日『Pythonではじめるオープンデータ分析 』出版

Slide 29

Slide 29 text

【余談その2】執筆で苦労したこと、たぶん皆さん苦労すること 〜約2年半〜の部分で起こったこと ● gBizINFO APIの次期システムへの移行が公表。発売タイミングで API新規受付が停止 ● RESAS APIの廃止とサイトのアップデート(書籍執筆中だった RESAS API部分は削除) ● Japan Dashboardなど脱稿直前にいくつか新しいサービス提供が開始(書籍に紹介追加) ● 金融・市場データを取得するライブラリの候補にしていた pandas-datareaderが執筆開始してから約 2年 間ほぼ更新されず、その部分も Requestsに書き換え ● FREDで一部のデータが提供されなくなる ● データやAPIのサービスの提供状況を校了ぎりぎりまでモニタリング ● 各データの著作権を調べる作業 ○ 調べやすいように本書で用いていないデータを含め、各サービスのデータに関する利用規約のリン クをできるかぎりリンク先に整理しました ○ https://github.com/python-opendata-analysis/python-opendata-analysis-book/tree/main/terms_of_use

Slide 30

Slide 30 text

【余談その3】PyCon JP 登壇まで ● みんなのPython勉強会で、『PythonユーザのためのJupyter[実践]入門』『Python インタラクティブ・デー タビジュアライゼーション入門 』 の著者@drillerさん(PyCon JP 2016にも登壇)と会う ● Python x 金融のコミュニティfin-py (@drillerさんがオーガナイザー)ができる(初回から参加) 〜〜 ● fin-pyでPyConのプロポーザル出さないかという話をいただく 〜〜 ● 2022年10月15日 PyCon JP 2022 登壇 「Pythonで公的統計APIのオープンデータ活用 」 コミュニティでの発表・登壇はいろんな機会につながります

Slide 31

Slide 31 text

No content

Slide 32

Slide 32 text

オープンデータの活用例 本書でも、スタートアップ企業を地図上に可視化したり、ふるさと納税を固定効果モデルで分析する活用例を紹 介。 他にもたくさんあると思いますが、次スライドから以下の活用例を紹介します。 ● 市場全体を知る ● 自社データと組み合わせる ○ 社内データと公的オープンデータを組み合わせた政策への活用事例 ● 調査統計の目標母集団とアンケート調査データの補正 ● 経済・社会シミュレーションの基礎数値

Slide 33

Slide 33 text

市場全体を知る~事業戦略・事業計画と市場規模~ ● 市場規模の推定 ○ 事業の見込み判断にはまず市場規模( TAM: Total Addressable Market 等)を推定する必要があ る ● コトラーのSTP ○ S: セグメンテーション ■ 市場を類似したニーズを持つ顧客セグメントに細分化する ○ T: ターゲティング ■ セグメントごとの販売機会を特定し、どのセグメントをターゲットにするか定める ○ P: ポジショニング ■ 自社プロダクトをターゲット市場で特有の位置を占めるように設計 市場を公的統計と比較しやすいセグメントに分け、各セグメントにおけるシェアはどの程度でどのセグメントの伸 びしろが大きいか、事業戦略の検討材料に使える 【参考書籍】 ● Philip Kotler, Kevin Lane Keller『コトラー&ケラーのマーケティング・マネジメント』

Slide 34

Slide 34 text

市場全体を知る~B to C と B to B の市場規模~ ● B to C (消費者向け事業)の場合 ○ 「数」の規模だと、性別・年齢・都道府県ごとなどの人口や世帯数が統計局の 国勢調査 で調べられ る ■ →例えば、2025年現在、日本の人口は約 1億2千3百万人 ○ 「金額」規模だと、統計局の 家計調査 ・全国家計構造調査 や厚生労働省の国民生活基礎調査 な どと国勢調査の掛け算でざっくり推定できる ● B to B (対企業向け事業)の場合 ○ 「数」の規模だと、企業等数 は統計局の経済センサス 、法人数は国税庁の法人番号公表サイトや 経済産業省のgBizINFOで調べられる ■ →例えば、令和3年の経済センサスによると、企業等数は約 368万社 ○ 「金額」規模だと、規模の大きい会社は財務省の 法人企業統計 で調べられる ○ 上場企業は金融庁の EDINETでより詳細に調べられる

Slide 35

Slide 35 text

マーケット概況と市場全体に対するKPIの把握 ● gBizINFOなど社外の法人データと自社の見込み顧客や商談実施顧客などのデータを法人番号等で名 寄せすることで、市場全体に対する KPI(Key Performance Indicator)を算出 6% 50% 67% 見込み顧客獲得の余白はまだ ありそうだし、商談獲得ペース が伸びてるからマーケティング の予算を増やしていこう 商談獲得の伸びに比べて契約獲得の伸 びが鈍いな… ↓ [仮説]前年度から新たに建設・不動産業 界の商談を増やそうとしたが、うまくいっ ていない のかな? 全法人 見込み顧客法人 商談実施済法人 契約済法人 FY2024時点 550万件 FY2023時点 525万件 +4% FY2024時点 30万件 FY2023時点 25万件 +20% FY2024時点 15万件 FY2023時点 10万件 +50% FY2024時点 10万件 FY2023時点 8万件 +25% ※本頁で扱っている数値は全て仮のものです。

Slide 36

Slide 36 text

セグメント別に市場を把握 ● 社外の法人データでしか持ち得なかった顧客の業界情報を使って自社の見込み顧客や商談情報をセ グメントに切って可視化・分析することが可能 ※本頁で扱っている数値は全て仮のものです。 6% 87% 30% 全法人 見込み客法人 商談実施済法人 契約済法人 FY2024時点 100万件 FY2023時点 95万件 +5% FY2024時点 6万件 FY2023時点 5万件 +20% FY2024時点 5万件 FY2023時点 2万件 +150% FY2024時点 1.5万件 FY2023時点 1万件 +50% 建 設 ・ 不 動 産 5% 45% 85% FY2024時点 450万件 FY2023時点 430万件 +4% FY2024時点 24万件 FY2023時点 20万件 +20% FY2024時点 10万件 FY2023時点 8万件 +25% FY2024時点 8.5万件 FY2023時点 7万件 +22% ↑ 以 外

Slide 37

Slide 37 text

(マネーフォワードの事例) 社内データと公的オープンデータを組み合わせた政策への活用事例 ● 社内データ(クラウド会計データ)と公的 オープンデータ(経済センサス等)につい て、業種などの軸で割合を比較 → ● クラウド会計データから作成した指標 は、景気動向を示す既存の経済指標と 高い相関を持つ指標が得られ、経済動 向の分析に活用できる可能性が示され た↓ *内閣府 経済財政分析ディスカッション・ペーパー「クラウド会計データを活用した 経済動向分析の手法」( https://www5.cao.go.jp/keizai3/discussion-paper/dp252.pdf ) *内閣府 経済財政分析ディスカッション・ペーパーより抜粋

Slide 38

Slide 38 text

調査統計の目標母集団とアンケート調査データの補正 ● アンケート調査では、調査したい目標母集団の分布に合わせて、アンケート調査の対象を標本抽出でき れば理想 ● 実際のインターネット調査などでは年代や収入などに偏りがあるケースが多い ● 調査データに偏りがある場合、レイキング・キャリブレーションや傾向スコアを用いた補正などで重み付け して集計 ● 例えば、目標母集団が日本人一般であれば、アンケートデータの偏りの補正(レイキングの周辺比率)に 公的統計の人口推計や国民生活基礎調査などを活用 【参考書籍】 ● 土屋隆裕『概説 標本調査法』 ● 星野崇宏『調査観察データの統計科学』 ● 星野崇宏, 上田雅夫『マーケティング・リサーチ入門』

Slide 39

Slide 39 text

経済・社会シミュレーションの基礎数値 〜ファイナンシャル・プランニングの例〜 身近な個人のライフ・プラン・シミュレーション(ファイナンシャル・プランニング)では、さまざまな公的統計の数値 を参考にする。 ● 年収やその上昇率の参考数値は、厚生労働省の賃金構造基本統計調査や国民生活基礎調査、統計局 の家計調査など。公務員の場合は総務省の地方公務員給与実態調査なども ● 生活費の参考数値は統計局の家計調査や全国家計構造調査 ● 教育費は文部科学省の子供の学習費調査 ● 住宅価格の参考数値は国土交通省の住宅市場動向調査や不動産情報ライブラリ、住宅金融支援機構 の調査 ● インフレ率は統計局の消費者物価指数 ● 寿命は厚生労働省の生命表 など。より高度な金融の確率的シミュレーション等でも同様に公的統計の数値を参照 【参考: ライフ・プラン・シミュレーションの無料サイト】 ● 生命保険文化センター 「e-ライフプランニング」( https://www.jili.or.jp/plan.html ) ● 金融広報中央委員会 「知るぽると ライフプランシミュレーション 生活診断」( https://www.shiruporuto.jp/public/document/container/sindan/ )

Slide 40

Slide 40 text

事例を集めています ● 政府統計ポータルサイト e-Statだけでも、2025/12現在、700以上の調査と150万以上のデータセット。書 籍で取り上げることができたのは一部だけ ● 公的オープンデータを分析した事例がインターネット上( GitHub, note, zenn, Qiitaなど)にまだまだ少ない ● 生成 AIも外部情報を検索しテーブルデータを集計してくれるように進歩しているが、公的統計の仕様を正 しく理解できてないため誤った集計をしてしまうケースも多い ● 本書の事例にない統計についても加工・分析方法のブログなどでの発信が増えれば、いずれ生成 AI が 分析手順を学習してくれるはず ● オープンデータ・公的統計の活用はまだまだこれからで、本書の出版は、世の中のオープンデータ活用を 進めるためのきっかけの一つ ● 本書の事例集サイト *で、本書に掲載していない事例とサンプルコードも掲載していきます。事例は皆さま からの Pull Request も受け付けています。 一緒にオープンデータ活用を進めていきましょう! *オープンデータ分析 事例集サイト ( https://github.com/python-opendata-analysis/opendata-casebook )

Slide 41

Slide 41 text

【告知その1】オープンデータ スプリント イベント【fin-py】 【スプリント】Pythonではじめるオープンデータ分析 ● fin-py Python x 金融のコミュニティ ○ Pythonまたは金融どちらかに関係する方がスキルレベルを問わずに気軽に情報交換、ディスカッ ション、その他交流をするためのコミュニティ(@ drillerさんがオーガナイザー) ● スプリント ○ 日時:2026/1/11(日) 10:00~16:00 ○ 会場:オフライン(燈株式会社様 御茶ノ水オフィス) ○ スプリントとは、決まった時間内で、集中して開発や作業を行うイベントです。今回はチーム(リー ダー+メンバー)に分かれて、データ分析の課題に取り組みます。 ○ connpassイベントリンク ■ https://connpass.com/event/376827/

Slide 42

Slide 42 text

【告知その2】YouTube配信 TBS CROSS DIG ● 共著者の神戸大学原准教授がYouTubeチャンネル TBS CROSS DIG with Bloomberg の CROSS DIG 1on1に出演し、本書に絡めたオープンデータ分析に ついて紹介予定 ● 2026/12/13(土)に配信 ● (一般向けのためPythonなどの技術的な内容はあまり多くありません)

Slide 43

Slide 43 text

最後に~謝辞~ 「私たちは、 OSSでオープンデータを分析でき、世の中のために ''オープンさ "に取り組んでいるプログラマー や公的機関などの方がたのおかげで、 ''オープンさ ”の恩恵を享受できる環境にいます (使っているうちに、 オープンに分析結果やライブラリを公開して、世の中に貢献したくもなるでしょう)。 」(第Ⅰ部冒頭より) ● OSS開発者の方々 ○ pandas, Plotly, Requestsなどライブラリのメンテナンスに感謝 ● 公的機関の方々 ○ e-Statだけでも、2025/12現在、700以上の調査と150万以上のデータセットの整備、及び 300近い 調査データのAPIの提供に感謝。一部の基幹統計が CSV, ExcelのみなのでAPI化を期待 ○ gBizINFOには、統計ではなく個別法人ごとのデータの整備と APIの提供に感謝。2026年1月から の次期システムも期待 ○ 金融庁のEDINETも、国土交通省の国土交通データプラット フォーム(MCPも提供)も、他の公的 オープンデータも感謝。願わくば日本銀行時系列データ検索サイトも FREDのようにオープンデータ 化・API化を期待 ● 2025年国勢調査などの調査員の方々 ○ 1軒ずつ調査票を回収していただき感謝 統計法の目的(≒公的統計の目的)は、 国民経済の健全な発展及び国民生活の向上に寄与 すること 知見を共有し合って、オープンデータ活用を進めていきたい