一橋大学 #経済学のための実践的データ分析 2020秋: 4/12

Slide 1

Slide 1 text

一橋大学「経済学のための実践的データ分析」 2020秋: 4/12 4.データベースの使い方+α 4.1.データベース101 4.2.BigQuery を使ってみよう 4.3.MySQL を構築してみよう 4.4.データ可用性とプライバシー一橋大学大学院経済学研究科原泰史 [email protected]

Slide 132

Slide 132 text

材料2. NISTEP企業名辞書 • 企業名, 企業名の変遷などを納めたデータベース • “産業セクターのイノベーション分析・研究に用いるデータベースの中心に位置付けられ、特許情報や国内営利企業（以下、「企業」と呼ぶ）に関する各種調査情報など、外部データから指定した企業に関する情報を抽出するためのハブとしての役割を担う” • 日本の会社データ(東洋経済新報社), IIP パテントデータベース, 証券コードなどとの接続が可能 • “企業名の読み、本社所在地、業種など、外部データに含まれる数多くの企業から分析対象である企業を正しく特定しデータ抽出するための支援、および、合併や企業名称の変遷を考慮したデータの収集など、企業を中心としたイノベーション分析・研究における核となる機能を持つ” • 使いみち • いくつかのデータベースをつなぎ合わせることで、企業の活動を定量的に計測することが可能になる 2020/9/25 132 comp_id 出願人テーブル/ida_sequence 証券コード又は EDINETコード企業ID comp_id 外部データ接続テーブル東洋経済会社コード日本の会社データ4万社（東洋経済新報社） NISTEPによるファイル公開範囲（一般財団法人知的財産研究所より入手のこと）（必要に応じて利用者が購入のこと） IIPパテントデータベース IIPパテントデータベース（2015年版）との接続用日本の会社データ4万社との接続用 NISTEP企業名辞書外部データ接続テーブル証券コード、EDINETコードを持つ企業情報データ（財務・株価データなど）（必要に応じて利用者が準備のこと）外部データ接続テーブル（将来予定）企業名と住所をキーとした汎用接続テーブル企業統計調査データなど（必要に応じて利用者が準備のこと）外部データ外部データ NISTEP企業名辞書は、 Ver.2015_1よりRDB構造に変更された

Slide 136

Slide 136 text

材料2. NISTEP 企業名辞書 • 構成テーブル 2020/9/25 136 番号テーブル名称概要論理名物理名 1 企業名辞書メインテーブル 1_comp_nam e_main_TB L 企業名、企業id等のメインの情報、およびパネルデータとして整備をする必要がなく、最新の情報のみ保持すればよいデータを保管 2 沿革テーブル 2_comp_histor y_TBL 名称変更や吸収合併などの事象が発生した際に発生した年、事象の種類を保管 3 所在地テーブル 3_address_TB L 企業の所在地に関する情報を保管本社、本店、移転など複数の住所情報の保管、パネル化が可能 4 企業規模テーブル 4_comp_size_ TBL 資本金、従業員数、中小企業基本法による企業規模情報を保管規模測定年ごとのパネル化が可能 5 業種（証券コード協会）テーブル 5_ind_class_ts e_TBL 証券コード協議会の定める当該企業の業種区分を保管属する分類が変更された際のパネル化が可能 6 業種（日本標準産業分類）テーブル 6_ind_class_js ic_TBL 主業の日本標準産業分類を保管属する分類が変更された際のパネル化が可能 7 EDINETコードテーブル 7_edinet_code _TBL EDINETのコードを保管コードが変更された際のパネル化が可能 8 証券コードテーブル 8_sec_code_T BL 証券コードを保管コードが変更された際のパネル化が可能 9 連結企業テーブル 9_consolidate _TBL 連結子会社である場合の親企業情報を保管連結関係の変化のパネル化が可能 10 データ登録条件マスターテーブル 10_reg_reason_MT BL 企業が企業名辞書に登録された理由に関するマスターテーブル 11 企業名称使用開始事象マスターテーブル 21_use_name_start_ event_MTBL 新設、旧名称からの名称変更等、企業名称の使用が開始された場合の使用開始事象に関するマスターテーブル 12 企業名称使用終了事象マスターテーブル 22_use_name_end_e vent_MTBL 名称変更、吸収合併など、企業名称の使用が終了した場合の使用終了事象に関するマスターテーブル 13 事業所区分マスターテーブル 31_office_class_MT BL 住所情報の本社、本店、事業所等を判定するためのマスターテーブル 14 業種（証券コード協会）マスターテーブル 51_tse_MTBL 証券コード協議会の定める業種区分に関するマスターテーブル 15 業種（日本標準産業分類）マスターテーブル 61_jsic_MTBL 日本標準産業分類に関するマスターテーブル平成25年10月改定・平成26年4月1日施行に準拠 16 企業連結事象発生マスターテーブル 91_consolidate1_MT BL 連結事象が発生した場合の発生理由(子会社化等)に関するマスターテーブル 17 企業連結事象終了マスターテーブル 92_consolidate2_MT BL 連結事象が終了した場合の発生理由(他社の子会社となった、独立した等)

Slide 137

Slide 137 text

材料2. NISTEP 企業名辞書 • ER図 2020/9/25 137 企業名辞書メインテーブル（1_comp_name_main_TBL）企業id 企業名称ふりがな法人格コード英語名称 URL データ登録理由id データ登録日データ更新日沿革テーブル（2_comp_history_TBL）企業id 名称使用開始年名称使用開始事象id 事象発生前企業id 名称使用終了年名称使用終了事象id 事象発生後企業id データ登録日データ更新日企業名称使用開始事象マスターテーブル（21_use_name_start_event_MTBL）事象id 事象概要データ登録日データ更新日 1…N 連結企業テーブル（9_consolidate_TBL）企業id 連結事象発生年連結事象発生事象id 連結事象発生前連結企業id 連結先連結企業id 連結事象終了年連結事象終了事象id 連結事象終了後連結企業id データ登録日データ更新日所在地テーブル（3_address_TBL）企業id 所在地利用開始年所在地利用終了年本店・本社コード所在地都道府県コード地方自治体コード住所コード緯度経度データ登録日データ更新日 EDINETコードテーブル（7_edinet_code_TBL）企業id EDINETコード確認年 EDINETコードデータ登録日データ更新日企業規模テーブル（4_comp_size_TBL）企業id 企業規模測定年中小企業基本法資本金階級従業員数階級データ登録日データ更新日業種（証券コード協会）テーブル（5_ind_class_tse_TBL）企業id 東証33分類開始年東証33分類終了年東証33分類コードデータ登録日データ更新日事業所区分マスターテーブル（31_office_class_MTBL）本店・本社コード概要データ登録日データ更新日 N…1 1…1 企業名称使用終了事象マスターテーブル（22_use_name_end_event_MTBL）事象id 事象概要データ登録日データ更新日 1…1 1…1 企業連結事象発生マスターテーブル（91_consolidate1_MTBL）事象id 事象概要データ登録日データ更新日企業連結事象終了マスターテーブル（92_consolidate2_MTBL）事象id 事象概要データ登録日データ更新日 1…1 1…1 証券コードテーブル（8_sec_code_TBL）企業id 証券コード上場市場上場日上場廃止日 ISINコードデータ登録日データ更新日業種（日本標準産業分類）テーブル（6_ind_class_jsic_TBL）企業id JSIC開始年 JSIC終了年 JSIC分類番号データ登録日データ更新日業種（証券コード協会）マスターテーブル（51_tse_MTBL）東証33分類コード東証33分類版東証33分類大分類東証33分類小分類データ登録日データ更新日業種（日本標準産業分類）マスターテーブル（61_jsic_MTBL） JSIC分類番号 JSIC版 JSIC大分類 JSIC中分類 JSIC小分類データ登録日データ更新日 1…1 1…1 データ登録条件マスターテーブル（10_reg_reason_MTBL）理由id 登録理由データ登録日データ更新日 1…1

Slide 170

Slide 170 text

最初のプレスリリース (cont.) • 【本サービスにおける個人情報の取り扱いについて】これまで本サービスでは、学生が当社の就職情報サイト「リクナビ」にご登録いただく際にご同意いただいたプライバシーポリシーに基づき、リクナビサイト上での行動履歴の解析結果を取引企業に対して提供しておりました。プライバシーポリシー https://job.rikunabi.com/2020/general/move/?screen=navg/help/privacy_policy.html • なお、本サービスで企業に提供されるデータは、リクナビの閲覧データをもとに算出されたスコアであり、学生の能力を推し量るものではありません。この点、いかなる時期であっても提供された情報を合否の判定に活用しないことにご同意いただいた企業にのみ、本サービスをご提供してきました。ご利用いただいている企業には当社から定期的に利用状況の確認をさせていただいております。【今後の対応につきまして】本サービスの提供にあたっては、各種法令にも照らしつつ、学生の個人情報保護を最優先にサービスの設計や各種規約を整備してまいりました。しかしながら、昨今では個人情報保護に関する社会の認識も大きく変化しております。海外におけるルール整備の潮流も受け、本日の一部報道にもあります通り、関係各所から当社のプライバシーポリシーの表現が学生に伝わりにくいものとなっているのではないかとご意見をいただきました。こうした背景から、2019年7月31日（水）をもって、サービス提供を一時休止させていただくことを決めました。学生の個人情報がどのように企業に提供されていくのか、よりわかりやすい表現や説明方法を検討し終えるまで、本サービスは一時的に休止いたします。このたびは、多大なご迷惑をおかけしますこと、申し訳ございません。 https://www.recruitcareer.co.jp/news/pressrelease/2019/190801-02/

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text