Slide 1

Slide 1 text

一橋大学 「経済学のための 実践的データ分析」 2020夏: 8/10 8.データの可視化 8.1.データのビジュアリゼーション 8.2.tableau をつかってみよう 8.3.可視化ツール/ライブラリを使う 8.4.最終レポートのご相談 APPENDIX ネットワーク分析 一橋大学大学院経済学研究科 原泰史 [email protected]

Slide 2

Slide 2 text

今日の内容 • 10:30-10:45 • プレ講義 [録画なし] • 10:45-11:05 • 8.1データのビジュアリゼー ションでできること[録画あり] • 11:05-11:10 • インターミッション[録画なし] • 11:10-11:30 • 8.2 tableau をつかってみよ う[録画あり] • 11:30-11:35 • インターミッション2[録画なし] • 11:35-11:55 • 8.3 可視化ツール/ライブラリ を使ってみる [録画] • 11:55-12:00 • インターミッション3[録画なし] • 12:00-12:20 • 8.4 最終レポートのご相談 [録画]

Slide 3

Slide 3 text

次回以降の 予定 • 7/9 8/10 • 7/13 補講なのでお休み • 7/16 9/10回 • 「経済学と機械学習」 • 9.1 機械学習を経済学で使 う • 9.2 SVMとRidgeと決定 木分析 • 9.3 スパース推定 • 9.4 因果推論 • 7/20 10/10回 • 最終レポートプロポーサル 報告会 • 詳細については8.4 で • 7/30 最終レポートの納品日

Slide 4

Slide 4 text

8.1 データビジュアライゼーションとは?

Slide 5

Slide 5 text

可視化の意味 • わかりやすく見せる • より多くの人, あるいは伝えるべきひとに伝える • データを実直に, ありのままに伝える • データをよりわかりやすく見せる • どちらにするかは対象とするオーディエンス次第

Slide 6

Slide 6 text

これまでに使ったデータの可視化 • (マルチ)散布図 • ヒストグラム • 回帰曲線 • 回帰モデル

Slide 7

Slide 7 text

No content

Slide 8

Slide 8 text

データの見せ方 1. 表やグラフ 2. インフォグラフィック 3. ポンチ絵 4. 動画 (Youtube)

Slide 9

Slide 9 text

1. 表やグラフ • グラフ • 棒グラフ • 線グラフ • 円グラフ • 表 • 回帰分析表 • 相関係数表 • 2020年5月に公表した3つの Working Paper から、グラフや 表を抜き出して説明してみます。

Slide 10

Slide 10 text

1. 表やグラフ • 内容を読みやすくする • 色をつけてみやすくする http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2390

Slide 11

Slide 11 text

1. 表やグラフ http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2390

Slide 12

Slide 12 text

1. 表やグラフ • クロス表 • 分散分析 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2391

Slide 13

Slide 13 text

1. 表やグラフ • 集計表 • 度数分布表 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2391

Slide 14

Slide 14 text

1. 表やグラフ • 相関係数 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2391

Slide 15

Slide 15 text

1. 表やグラフ • 回帰分析 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2393

Slide 16

Slide 16 text

1. 表やグラフ • 2020年時点の(割とオールドスクールな)社会科学ワールドで生 きていくならば、とりあえずは表やグラフが「キッチリ」書け れば十分 • ここでのキッチリとは、たとえば有効数字を揃えるとか、論文誌や卒 論のフォーマットに従い表やグラフをまとめること • 二次元で表現できないことを三次元で可視化することもあるけ れど、まずは、二次元のグラフや表で見せられれば、特に問題 は無いかなとおもいます。 • 残り3つは、可視化手法の中でも比較的モダンだったり、すご く狭い世界で通用するものをご紹介

Slide 17

Slide 17 text

2. インフォグラフィック • Def. “情報、データ、知識を視覚的に表現したものである[1]。 インフォグラフィックは情報を素早く簡単に表現したい場面で 用いられ、標識、地図、報道、技術文書、教育などの形で使わ れている。また、計算機科学や数学、統計学においても、概念 的情報を分かりやすく表現するツールとしてよく用いられる。 科学的情報の可視化にも広く適用される。” • 狭義のDef. • データをフォントや画像などと組み合わせて、わかりやすく可視化し たもの • まずはみんなの目を惹くためにつくるもの

Slide 18

Slide 18 text

ナポレオン遠征 https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%83%95%E3%82%A9%E3%82%B0%E3%83%A9%E3%83%95%E3%8 2%A3%E3%83%83%E3%82%AF#/media/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Minard.png

Slide 19

Slide 19 text

2. インフォグラフィック https://public.tableau.com/en-us/s/gallery/fifa-19-top-ranked-players

Slide 20

Slide 20 text

2.インフォグラフィック(続き) https://markezine.jp/article/detail/26798 https://liginc.co.jp/news/46707

Slide 21

Slide 21 text

2. インフォグラフィック • まとめ • インフォグラフィック ≒ かっこいいフォントとかわい いイラストをつかって、数字を 思ったよりも大きなフォントサ イズで見せること • デザイン能力がいろいろな意味 で必要 • Piktochart など、自分でイン フォグラフィックを作る方法も ございます (8.3 でご紹介) • ポスター発表などでご活用頂け る可能性が • 具体例

Slide 22

Slide 22 text

3. ポンチ絵 • (政府が提案する)事業を行うと、どんな成果が期待出来るかを わかりやすく図示すること。

Slide 23

Slide 23 text

ポンチ絵(続き) • ポンチ絵の具体例 https://www.mhlw.go.jp/content/12000000/000519833.pdf

Slide 24

Slide 24 text

ポンチ絵へのツッコミ • 数量的インパクトに対する言及がない • 投資に対する政策効果が明記されていな い • どのようにPDCAが行われるのか不明確 • EBPM (Evidence Based Policy Making) • こうした政策に対して因果関係を明確にす ること (where 経済学がすごく役に立ちそ う) • データを定期的に収集することの重要性 • かといって、EBPMを推進するリスクは 「減点主義」の官僚にあるらしい 引用; https://gendai.ismedia.jp/articles/-/70122?page=2

Slide 25

Slide 25 text

とはいっても、私にもポンチ絵を書いて いた時期がありました(1.1 参照) • ポンチ絵の要件 • (〇〇党のせんせーや事務次 官が)数十秒で読んで理解で きること • しかも、内容が過不足なく明 記されていること • 「穴」がないようにすること • 色がいっぱい使われているこ と • 何よりも予算が取れること • で、どんなカッコいい ジャーナルに載るよりも、 きれいなポンチ絵が出来て いないと予算は取れない、 らしい。

Slide 26

Slide 26 text

3. ポンチ絵 • For Undergraduate Students • 中央官庁志望でも無い限り、書き方を覚えなくていいです • たぶん、民間で使う技術ではない気がします • For Graduate Students と社会人の皆様 • 中央官庁や地方自治体が、どういう力学で動いているのかを知るため にはこの上ない情報が埋まっているのがポンチ絵であります • 個人的には、ポンチ絵データを画像解析して分析したいなあとか考え ております

Slide 27

Slide 27 text

4. 動画(YoutubeやNetflix) • 分析結果や解析の結果、インフォグラフィックを動画にする • 具体例 BarChartRace • https://www.youtube.com/watch?v=OkM8PxOnaIA

Slide 28

Slide 28 text

4. 動画 (Youtube や Netflix) • Bar Chart Race の作り方は 8.3 で • https://public.flourish.studio/visualisation/2658794/?fbclid= IwAR3r9vPw9hp-Yy9fdRVJ2dIdyIG-wZZYFXQ- TyqPG1F47j6D3JdoJ0rd3Ks

Slide 29

Slide 29 text

4. 動画 (Youtube やNetflix) • Netflix; 世界の今をダイ ジェスト (Explained) • https://www.netflix.com /title/80216752 • インフォグラフィック+ナ レーション+動画というス タイル • だいたいの座学講義より わかりやすい気がしない でもない気がする

Slide 30

Slide 30 text

4. 動画 (youtube や netflix) • 中川先生のやさしい ビジネス研究 • https://www.youtube .com/channel/UCS8 9vRmX0PfWxmJWOjJ q6ZA • 研究成果や理論を動 画で解説 (日本中の大 学生が2020/5月時点 で受けているやつ)

Slide 31

Slide 31 text

ここまでのまとめ • まずは手堅く表やグラフでまとめましょう • ターゲットとする顧客に向けて表現手法は使い分ける

Slide 32

Slide 32 text

8.2 tableau を使ってみよう

Slide 33

Slide 33 text

やりたいこと • FIFA19 のデータ (レポート1で使ったもの) をtableau でいろい ろな手法を使ってビジュアライズしてみる

Slide 34

Slide 34 text

Tableau とは • “Tableau は、接続からコラボ レーションまでをスムーズに行え る、最も強力でセキュアかつ柔軟 なエンドツーエンドのデータ分析 プラットフォームです。 • データのパワーの活用を可能にし て、ビジネスをサポートします。 個人で利用できるように設計され、 エンタープライズ規模に拡張する こともできる Tableau は、アク ションを生み出すインサイトを データから引き出せる唯一の BI プラットフォームです。” https://www.tableau.com/ja-jp/products/what-is-tableau

Slide 35

Slide 35 text

Tableau のインストール • https://www.tableau.com/tft/activation にアクセスする

Slide 36

Slide 36 text

Tableau のインストール • Download Tableau Desktop をクリックする • 大学のメールアドレスを指定し, Download Free Trial をクリック

Slide 37

Slide 37 text

Tableau のインストール • exe (windows) または dmg (mac) がダウンロードされる ので, インストールを行う

Slide 38

Slide 38 text

Tableau の起動 • Windows 10 の場合

Slide 39

Slide 39 text

Tableau にデータをインポートする • 接続から, “Microsoft Excel” を選択する

Slide 40

Slide 40 text

Tableau にデータをインポートする ファイルを選択する

Slide 41

Slide 41 text

Tableau にデータをインポートする • “データ インタープリターを使用してクリーニング” をクリック

Slide 42

Slide 42 text

Tableau でデータを可視化してみる • ウインドウ下のワークシートをクリックする

Slide 43

Slide 43 text

Tableau でデータを可視化してみる • 左下の”メジャー” から, 列に age を, 行に wage をド ロップする • 合計値が表示され ているので, 右上 に合計値がひとつ プロットされてい る

Slide 44

Slide 44 text

Tableau でデータを可視化してみる • 列と行それぞれにつ いて▼をクリックし, “メジャー -> 合計値” から “ディメンジョ ン” に選択しなおす

Slide 45

Slide 45 text

Tableau でデータを可視化してみる • 右下にある値をクリックし, “除外” をクリックする

Slide 46

Slide 46 text

Tableau でデータを可視化してみる • 散布図が生成される

Slide 47

Slide 47 text

Tableau で地域ごとの選手数をプロット してみる • “ディメンジョン” をクリックし, 地 理的役割から “国/ 地域” を選択する

Slide 48

Slide 48 text

Tableau で地域ごとの選手数をプロット してみる • Nationality ごとの選手数を地図上にプロットできる

Slide 49

Slide 49 text

Tableau で地域ごとの選手数をプロット する • 右下をクリックし, マッピン グできていない国名同士を 手動で対応させる

Slide 50

Slide 50 text

Tableau で地域ごとの選手数をプロット する • 空欄だった中国 やイングランド, 韓国のデータが 埋め込まれる

Slide 51

Slide 51 text

様々な形式でプロットする • 表形式 • 箱ひげ図

Slide 52

Slide 52 text

様々な形式でプロットする • 棒グラフ

Slide 53

Slide 53 text

ツリーマップ

Slide 54

Slide 54 text

様々な形式でプロットする • パックバブル • バブルチャート

Slide 55

Slide 55 text

Wordcloud

Slide 56

Slide 56 text

今日の実習 これまでの講義で利用した • (1)Dbpedia.org ソース • 東証一部/二部/マザーズの企業概要データ • 日本の経済/経営/社会/法学者の概要データ • 日本のロック/ヒップホップ/フォークグループの概要データ • (2) FIFA19 の選手収録データ • (3) 日経NEEDS データ • 東証マザーズ • 東経2部 について, tableau を使って可視化を行いましょう

Slide 57

Slide 57 text

今日の実習 • ワードクラウド • 地域や国にマッピングしたグラフ • 棒グラフ • 線グラフ などを作成してみること

Slide 58

Slide 58 text

まとめ • 手堅くデータを可視化するには tableau が便利 • 割と導入している企業も多いみたいであります

Slide 59

Slide 59 text

Appendix: ライセンスの導入の仕方 • (一橋生と学習院生向けに)Tableau の Education 版ラ イセンスをお配りしています • 一橋生は Google Classroom を確認のこと

Slide 60

Slide 60 text

Appendix: ライセンスの導入の仕方 • メニューから[ヘルプ]-[プロダクトキーの管理]をクリックする

Slide 61

Slide 61 text

Appendix: ライセンスの導入の仕方 • [ライセンス認証] をクリックする

Slide 62

Slide 62 text

Appendix: ライセンスの導入の仕方 • [プロダクト キーを使用したライセンス認証]をクリックする

Slide 63

Slide 63 text

Appendix: ライセンスの導入の仕方 • プロダクトキーを入力し, [ライセンス認証]をクリックする

Slide 64

Slide 64 text

8.3 可視化ツール/ライブラリを使う

Slide 65

Slide 65 text

可視化の技法 • Piktochart • 8.1 でご紹介した, インフォグラ フィックを作るためのツール • Flourish • 8.1 でご紹介した, Bar Chart Race を作るためのツール • ヒートマップ • ハイライト表 • ツリーマップ • ガントチャート • Seaborn • これまでの講義で一部使用 • https://seaborn.pydata.org/ • https://seaborn.pydata.org/exam ples/index.html • Plotly • https://plot.ly/python/ • 後ほど解説。

Slide 66

Slide 66 text

Piktochart

Slide 67

Slide 67 text

piktochart • インフォグラフィック作成用サイト • https://piktochart.com/

Slide 68

Slide 68 text

ケーススタディ; (SADA)MASASHI と YOSHIKI

Slide 69

Slide 69 text

MASASHI と YOSHIKI の共通点 • 幼少期からクラシックの素養がある • MASASHI : バイオリン • YOSHIKI : ピアノ • (生き様が)ロックである • MASASHI: バンドが解散したり, 映画で負債をかかえたり • YOSHIKI: バンドが解散したり, バンドが再結成したり • 身体的故障を抱え楽器演奏ができなかった時期がある • 名曲をたくさん作っている • MASASHI: 親父の一番長い日, 道化師のソネット, 精霊流し • YOSHIKI: FOREVER LOVE, 紅, ART OF LIFE

Slide 70

Slide 70 text

Web 上でグラフなどを作成

Slide 71

Slide 71 text

完成。

Slide 72

Slide 72 text

BarChartRace と Flourish

Slide 73

Slide 73 text

BarChartRace と Flourish • よくある、棒グラフがグラフィカルに動くやつ (BarChart Race) をつくってみよう • https://app.flourish.studio/login?redirect=%2Fprojects

Slide 74

Slide 74 text

Flourish • アカウント登録を行う

Slide 75

Slide 75 text

Flourish • 可視化の技法が選べる

Slide 76

Slide 76 text

Flourish • Bar Chart Race を選択

Slide 77

Slide 77 text

Flourish 以下のようなインターフェースが開く

Slide 78

Slide 78 text

Flourish • 流し込むデータセットを準備 • 今回は2010年のFormula 1 ポイント数 (standings)推移 • https://en.wikipedia.org/wiki/2010_Formula_One_World_Championship • ドライバーと所属チームの情報、グランプリごとの得点数、累積値 を求める • スクレイピングして, Excel 上で ifs 関数を用いて、得点数を求める

Slide 79

Slide 79 text

Flourish • インターフェース上で, パラメータを指定する

Slide 80

Slide 80 text

Flourish • インターフェース上で, パラメータを指定する B列にドライバーごとの 国籍の国旗情報のURL C列にチーム情報 A列にドライバー名 列番号を指定する

Slide 81

Slide 81 text

Flourish • Preview ボタンを押す • 右側のコンソールで表 示形式を調整する • Export and Publish を クリックする

Slide 82

Slide 82 text

Flourish • 作成した結果 • https://public.flouri sh.studio/visualisati on/2658794/?fbclid =IwAR3r9vPw9hp- Yy9fdRVJ2dIdyIG- wZZYFXQ- TyqPG1F47j6D3Jdo J0rd3Ks

Slide 83

Slide 83 text

Bar Chart Race の使い方 • とりあえずソーシャルメディアで流行りそう • データの変動や、全体的な競争の変位を示すときには便利 • だけど、ゼミの発表でこれ使ったら先生におこられそう(なんと なくだけど)

Slide 84

Slide 84 text

D3.js

Slide 85

Slide 85 text

D3.js • Java Script ライブラリ • https://d3js.org/ • 動的な可視化で広く活用

Slide 86

Slide 86 text

Zoomable Circule • https://observablehq.com/@ d3/zoomable-circle-packing

Slide 87

Slide 87 text

Scatter Plot Matrix https://observablehq.com/@d3/scatterplot-matrix

Slide 88

Slide 88 text

Sankey Diagram https://observablehq.com/@d3/sankey-diagram

Slide 89

Slide 89 text

Data-To-Viz.com

Slide 90

Slide 90 text

Data-to-viz.com • データの可視化手法を網羅的に紹介

Slide 91

Slide 91 text

Data-to-viz.com • 可視化のパス図

Slide 92

Slide 92 text

Seaborn

Slide 93

Slide 93 text

Seaborn による可視化 (Violin Plot) • 単一のパラメータ • 複数のグループ https://python-graph-gallery.com/50-basic-violinplot-and-input-formats/

Slide 94

Slide 94 text

Seaborn による可視化 (cont.) • 複数のパラメータ https://python-graph-gallery.com/50-basic-violinplot-and-input-formats/

Slide 95

Slide 95 text

Ploty

Slide 96

Slide 96 text

Plotly を使ってみよう • https://plot.ly • Python やR で使えるビジュ アライゼーションフレーム ワーク

Slide 97

Slide 97 text

Plotly を使ってみる • https://plot.ly/Auth/login/ にアクセスする • 上部の Sign Up をクリック し, 必要な情報を記入する • Sing Up をクリックする

Slide 98

Slide 98 text

Plotly を使ってみる • API Settings 画面に遷移する • Username • API Key が取得できる. ・API Key がマスクされている ので, 必要に応じて Regenerate Key をクリックし, API key を表 示する • これと別に Confirmation Mail が届くので, クリックす る

Slide 99

Slide 99 text

3. Plotly を使ってみる • Jupyter Notebook/Google Colaboratory 上で, “!pip install plotly” する

Slide 100

Slide 100 text

3. Plotly を使ってみる • API Key を渡す

Slide 101

Slide 101 text

3. Plotly を使ってみる • Sanky Diagram を書いてみる • Plotly をインポートする • データセットを構築する • データのフローをsource と target でそれぞれ指定する • Value に値を指定する 引用; https://plot.ly/python/sankey-diagram/

Slide 102

Slide 102 text

3. Plotly を使ってみる • データの中身を print(data) で確認する

Slide 103

Slide 103 text

3. Plotly を使ってみる • グラフのタイトルを指定する • Dict で data と layout をそれ ぞれ指定し, fig に入れる • py.iplot に fig を指定する

Slide 104

Slide 104 text

3. Plotly を使ってみる • Sanky Diagram が表示される

Slide 105

Slide 105 text

3. Plotly を使ってみる • plotly.plotly と plotly.figure_factory をインポートする • Numpy を使って, 乱数 を生成し, それに基づ きデンドログラムを作 成する. https://plot.ly/python/dendrogram/

Slide 106

Slide 106 text

3. Plotly を使ってみる • 必要なパッケージをイン ポートする • データを取得する (今回は figshareから) • デンドログラムを縦方向と 横方向に作成する • ヒートマップを作成する

Slide 107

Slide 107 text

3. Plotly を使ってみる • X と Y 方向に作成したデンド ログラムを, Z 方向にヒート マップのデータを指定する • ヒートマップデータを figure に流し込む

Slide 108

Slide 108 text

3. Plotly を使ってみる • レイアウトの修正を行う • それぞれの軸方向でレイアウ トの修正を行う • py.iplot にデータを流し込み, プロットする

Slide 109

Slide 109 text

3. Plotly を使ってみる • ヒートマップ付きのデンドロ グラムを作成する

Slide 110

Slide 110 text

3. Plotly を使ってみる • インタラクティブなグラフを 作成する • グラフのズームが出来るように する • 今回は元データを取得し, それ を操作できるようなウィジェッ トを用意する https://plot.ly/python/slider-widget/

Slide 111

Slide 111 text

3. Plotly を使ってみる • 出力結果

Slide 112

Slide 112 text

3. Plotly を使ってみる • じょうろ図を書いてみる • パッケージを指定 • データセットを指定 https://plot.ly/python/funnel-charts/

Slide 113

Slide 113 text

3. Plotly を使ってみる • 図が出力される

Slide 114

Slide 114 text

実習2 • Ploty を使ってデータの可視化をやってみよう • API キーを取得する • サンプルコードが手元の環境でも動くか確かめる • 必要に応じて, 自分が可視化したいデータで確認する

Slide 115

Slide 115 text

まとめ • データのビジュアライゼーションは, データを使ってわかるこ とをより伝えるための手段 • 時と場合に応じて可視化の手法は使い分けよう • 経済学部や経営学部の場合、まだまだ2次元の棒グラフと線グラフ or 散布図が中心かもしれないけれど, ちょっとずつグラフの自由度が上 がっているけれど

Slide 116

Slide 116 text

8.4 最終レポート

Slide 117

Slide 117 text

まとめと最終報告レポート • 1組5-6名のグループを作り, そのメンバーで最終レポートを作 成します。 • データ分析組, • データ調達組, • プレゼンテーション作成組, • プレゼンテーション担当 など役割分担はお任せします。 • 第10回で, 最終レポートのプロポーサルを発表します • 発表時間10分, 質疑応答5分 • データの初期的な分析結果がまとまっているとベター

Slide 118

Slide 118 text

まとめと最終報告レポート • テーマ • 「○○のための実践的データ分析」 • 卒論や修論や博論の作成の入り口になるような、データの調達とその データの解析を, 講義で取り上げたデータセットおよび分析手法で実施 する • 分析単位はマクロ (国レベル) でもメソ (企業/産業レベル) でもミクロ (個人レベル) でも問いません • 利用できるデータセット • 特に制限なし • 利用できるツール • Tableau, Excel, Word, SQL, BigQuery, Google Colaboratory, Jupyternotebook (Python) など, 特に制限なし

Slide 119

Slide 119 text

まとめと最終報告レポート • 評価方法 • グループ内での自己評価 • グループ外からの評価 アンケートシステムをPolly で用意します。 • 評価基準 • (A.) グループ内の役割分担 (B.) データセットのユニークさおよび、それが適切に処理されているか (C.) 分析手法のユニークさおよび、それが適切に解析されているか (D.) プレゼンテーションのユニークさ (E.) 質疑応答にうまくリプライすることが出来ているか • 納品物 • プレゼンテーションに利用したファイル (Word か Powerpoint か Prezi か etc…) を, Slack のDM に代表者がアップすること

Slide 120

Slide 120 text

最終レポートのグループ分け • ランダムに学籍番号で割り振りました • とりあえず、履修している40名を振り分けています • 履修撤回後に修正する予定であります • また、履修生以外の聴講生で参加したい方がいたら、原まで Slack で DM して頂けると幸いです

Slide 121

Slide 121 text

グループ分け(学籍番号) • グループ1 • 2116158M • 2116177B • 2117278B • 2118070Y • 2118279M • 2119112H • グループ2 • 2117032A • 2117164M • 2117173K • 2118071U • 2118248M • 2118331U • 2119195S

Slide 122

Slide 122 text

グループ分け(学籍番号) • グループ3 • 2118004A • 2118139Z • 2118140H • 2119024A • 2119110U • 2119166C • グループ4 • 2117188C • 2117226Y • 2118050K • 2118180C • 2118225S • 2118247U • 2118281U

Slide 123

Slide 123 text

グループ分け(学籍番号) • グループ5 • 2115087U • 2117028C • 2117129U • 2117251Z • 2117256A • 2118216U • 2118238X • グループ6 • 2117096U • 2117151H • 2117240K • 2117254K • 2118264U • 2119109H • 2119181S

Slide 124

Slide 124 text

最終レポートの雛形 • 表紙 • イントロダクション • 先行研究 • 問い • 仮説 • 集めたデータセット • データ解析結果 • 考察とインプリケーション

Slide 125

Slide 125 text

定量分析の業務フロー 2020/7/8 125 リサーチクエス チョンを決める 必要なデータを 探す 論文データ/書誌 情報を使う 特許データ/書誌 情報を使う その他データを使う (プレスリリース /POS データ) デ ー タ の ク リ ー ニ ン グ / 接 合 を 行 う エクセル/Python/Rでグラフを描く Stata/R/Python で回帰分析する KHCoder/R/Python でテキスト分析 する R/Netdraw etc… でネットワーク分 析する 企業データを 使う

Slide 126

Slide 126 text

例.元 IIR 西口先生のネットワーク研究 • “コミュニティー・キャピタル 中国・温州人企業家ネットワー クの繁栄と限界” • http://doi.org/10.11207/taaos. 4.1_200 • データに頼らずに, 足で稼いで ネットワークの動態をインタ ビュー調査から明らかにする • 足掛け10年(!) 2020/7/8 126

Slide 127

Slide 127 text

例. 元 IIR 西口先生のネットワーク研究 • “傑出したパフォーマンスで知られる中国・温州人企業家の国 際的ネットワークは、コミ ュニティー・キャピタルに依拠する 新たな社会ネットワーク分析に適した事例であり、近 年ビッグ データ一辺倒の観のある米国の定量分析 (Fleming et al. 2007) を補完する意味で、 詳細なフィールド調査に基づく豊かな実証 的知見を提供し得る。さらに Watts 等(1998, 1999, 2003) がシ ミュレーションで数学的に立証したスモールワールドの知見が、 現実に応用可 能なのは、実効的にコミュニティー・キャピタル に支えられた社会ネットワークに限定さ れることも示唆され る。 ” 2020/7/8 127

Slide 128

Slide 128 text

あくまでリサーチクエスチョンが大切 • データはあくまでデータ • 研究の問いに合わせて必要なデータを持ってくるのが大切で、 データに合わせて研究するのは本末転倒 (そういう研究も多い けど。。。) • 数年前に比べても利用できるデータはますますリッチになって いるので、ますます、「どのような研究がしたくて」、「どの ような問いを立てている」のかが大切に。 2020/7/8 128

Slide 129

Slide 129 text

ディスカッション • どういうテーマで解析を行うか/リサーチクエスチョンは何か • 解析を行うためには、どういうデータが必要か • メンバーの役割分担 について、グループ内で(いるメンバーで)ディスカッションをしてく ださい。 Spital.chat へのリンク https://spatial.chat/s/Hara-DS-Space-2020-Summer

Slide 130

Slide 130 text

経済学のための実践的データ分析 グループ1 グループ2 グループ3 グループ4 グループ5 グループ6

Slide 131

Slide 131 text

Slide 132

Slide 132 text

Appendix. ネットワーク分析

Slide 133

Slide 133 text

ネットワーク分析な具体例1. JST/RISTEX 深堀調査 『科学的ブレークスルーとイノベーションをつなぐ研究に着目した「科学と技 術の相互作用」の明確化』 • IIR->Waseda 清水洋先生が研究代表者 • http://www.ristex.jp/examin/others/shinki-pj-result2010.html • 科学から技術に至る知識の流れを特許と論文データベースを接 合することで特定する • ケース • 青色LEDに至るまでに, どのような特許が参照されたのか後方引用関係 から特定する • Shuji Nakamura の2007 年の特許をベースに, そこから後方引用を5次 までたどり知識の流れを測定していく

Slide 134

Slide 134 text

Network (delete pendants) Source: Web of Knowledge[Derwent Innovation Index]/Web of Science Red node indicates the “Main path”. ※. △が特許, ■が論文

Slide 135

Slide 135 text

1930s 1960s 1970s 1990s 2000s 1910-2007 (1次引用すべて導入; 上位12社明記) 1980s

Slide 136

Slide 136 text

1-1. ネットワーク分析 • 無償のもの • R - https://www.r-project.org/ • KHCoder - http://khc.sourceforge.net/ • (前回の講義) • NetDraw- https://sites.google.com/site/netdrawsoftware/home • Gephi - http://oss.infoscience.co.jp/gephi/gephi.org/ • Sci2 - https://sci2.cns.iu.edu/user/index.php • Pajek - http://vlado.fmf.uni-lj.si/pub/networks/pajek/ • 有償のもの • Vantage Point

Slide 137

Slide 137 text

1-1. NetDraw • 無償のネットワーク分析 ソフトウェア • 少々古いが, その分(オン ライン上の)ドキュメン トが充実 • ダウンロードからインス トール, 簡単なネットワー クを描画するところまで 解説します 2020/7/8 137

Slide 138

Slide 138 text

1-1. NetDraw のダウンロードとインストール • Analytic Technologies から Product を選び, Ucinet 6 の Download をクリックする • EXE ファイルのダウンロード が終わったら, インストールを 行う • UCINET 6 を起動する 2020/7/8 138

Slide 139

Slide 139 text

1-1. Netdraw を用いてネットワークを描画する • UCINET 6 を起動する 2020/7/8 139

Slide 140

Slide 140 text

1-1. Netdraw を用いてネットワークを描画する • Excel でかんたんなネットワーク情報図を用意する 2020/7/8 140

Slide 141

Slide 141 text

1-1. Netdraw を用いてネットワークを描画す る • UCINET 上でスプレッドシートのアイコンをクリックする 2020/7/8 141

Slide 142

Slide 142 text

1-1. Netdraw を用いてネットワークを描画する • UCINET Spreadsheet にはりつける 2020/7/8 142

Slide 143

Slide 143 text

1-1. Netdraw を用いてネットワークを描画する • ファイル名をつけて保存する 2020/7/8 143

Slide 144

Slide 144 text

1-1. Netdraw を用いてネットワークを描画する • UCINET より Netdrawをひらく 2020/7/8 144

Slide 145

Slide 145 text

1-1. Netdraw を用いてネットワークを描画する • 先ほど作成したファイルを NetDraw より開く 2020/7/8 145

Slide 146

Slide 146 text

1-1. Netdraw を用いてネットワークを描画する • 関係性が可視化される 2020/7/8 146

Slide 147

Slide 147 text

1-2. Gephi • オープンソース版ネットワー ク分析ソフトウェア 2020/7/8 147

Slide 148

Slide 148 text

1-2. Gephi の使い方 • Sample ファイルで試してみる • Les Miserables.gexf – レミゼラブルの共起情報ファイル 2020/7/8 148

Slide 149

Slide 149 text

1-2. Gephi の使い方 • Import Report が表示されるので, OK をクリックする 2020/7/8 149

Slide 150

Slide 150 text

1-2. Gephi の使い方 • ネットワークグラフが表示される 2020/7/8 150

Slide 151

Slide 151 text

1-2. Gephi の使い方 • Layout を動かしてみる 2020/7/8 151

Slide 152

Slide 152 text

1-2. Gephi の使い方 • データセットに慣れてみる • http://oss.infoscience.co.jp/gephi/wik i.gephi.org/index.php/Datasets.html のうち “[GEXF] EuroSiS Web マップ 調査: 欧州 12 か国の「社会における科学 (Science in Society)」活動主体の Web 上での相互関係をマップしたもの。”をダ ウンロードして表示する. ・ファイルを選択し, OK をクリックする 2020/7/8 152

Slide 153

Slide 153 text

1-2. Gephi の使い方 • ネットワークグラフが表示される 2020/7/8 153

Slide 154

Slide 154 text

1-3. Sci2 • ネットワーク分析ツール • エンジンとして, Gauss や Gephi, R を利用 • https://sci2.cns.iu.edu/use r/index.php 2020/7/8 154

Slide 155

Slide 155 text

1-3. Sci2 • ダウンロード • ダウンロード前にアカウント 登録が必要 • 利用しているオペレーション システムを選択する 2020/7/8 155

Slide 156

Slide 156 text

1-3. Sci2 • ZIP ファイルがダウンロー ドされるので, 展開する • Sci2.exe をダブルクリック 2020/7/8 156

Slide 157

Slide 157 text

1-3. Sci2 • コンソールが開く • とりあえず, サンプル ファイルでネットワーク 図を書いてみる • [File] – [Load]を選択す る 2020/7/8 157

Slide 158

Slide 158 text

1-3. Sci2 • Sampledata -> socialscience -> “Florentine.nwb” を選択 し, 開くをクリックする 2020/7/8 158

Slide 159

Slide 159 text

1-3. Sci2 • 右側のData Manager から “NMB file….” を右クリック し, View をクリックする • 元データが表示される 2020/7/8 159

Slide 160

Slide 160 text

1-3. Sci2 • Visualization -> Networks -> GUESS を選択する 2020/7/8 160

Slide 161

Slide 161 text

1-3. Sci2 • ネットワーク図が表示される • Show Label をクリックして, ノード毎のラベルを表示させる 2020/7/8 161