Slide 1

Slide 1 text

一橋大学 「経済学のための 実践的データ分析」 2020秋: 9/12 9.データの可視化 9.1.データのビジュアリゼーション 9.2.tableau をつかってみよう 9.3.可視化ツール/ライブラリを使う 9.4.最終レポートのご相談 APPENDIX ネットワーク分析 一橋大学大学院経済学研究科 原泰史 yasushi.hara@r.hit-u.ac.jp

Slide 2

Slide 2 text

今日の内容 • 13:00-13:15 • プレ講義 [録画なし] • 13:15-13:35 • 9.1データのビジュアリゼー ションでできること[録画あり] • 13:35-13:40 • インターミッション[録画なし] • 13:40-14:00 • 9.2 tableau をつかってみよ う[録画あり] • 14:00-14:05 • インターミッション2[録画なし] • 14:05-14:25 • 9.3 可視化ツール/ライブラリ を使ってみる [録画] • 14:25-14:30 • インターミッション3[録画なし] • 14:00-14:50 • 9.4 最終レポートのご相談 [録画]

Slide 3

Slide 3 text

次回以降の 予定 • 10/16 10/12回 • 「経済学と機械学習」 • 10.1 機械学習を経済学で 使う • 10.2 SVMとRidgeと決定 木分析 • 10.3 スパース推定 • 10.4 因果推論 • 10/20 11/12回 • 質疑応答セッション(2) • 10/23 12/12回 • 最終レポートプロポーサル 報告会 • 詳細については9.4 で • 11/03 最終レポートの納品 日

Slide 4

Slide 4 text

9.1 データビジュアライゼーションとは?

Slide 5

Slide 5 text

可視化の意味 • わかりやすく見せる • より多くの人, あるいは伝えるべきひとに伝える • データを実直に, ありのままに伝える • データをよりわかりやすく見せる • どちらにするかは対象とするオーディエンス次第

Slide 6

Slide 6 text

これまでに使ったデータの可視化 • (マルチ)散布図 • ヒストグラム • 回帰曲線 • 回帰モデル

Slide 7

Slide 7 text

No content

Slide 8

Slide 8 text

データの見せ方 1. 表やグラフ 2. インフォグラフィック 3. ポンチ絵 4. 動画 (Youtube)

Slide 9

Slide 9 text

1. 表やグラフ • グラフ • 棒グラフ • 線グラフ • 円グラフ • 表 • 回帰分析表 • 相関係数表 • 2020年5月に公表した3つの Working Paper から、グラフや 表を抜き出して説明してみます。

Slide 10

Slide 10 text

1. 表やグラフ • 内容を読みやすくする • 色をつけてみやすくする http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2390

Slide 11

Slide 11 text

1. 表やグラフ http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2390

Slide 12

Slide 12 text

1. 表やグラフ • クロス表 • 分散分析 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2391

Slide 13

Slide 13 text

1. 表やグラフ • 集計表 • 度数分布表 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2391

Slide 14

Slide 14 text

1. 表やグラフ • 相関係数 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2391

Slide 15

Slide 15 text

1. 表やグラフ • 回帰分析 http://pubs.iir.hit-u.ac.jp/admin/ja/pdfs/show/2393

Slide 16

Slide 16 text

1. 表やグラフ • 2020年時点の(割とオールドスクールな)社会科学ワールドで生 きていくならば、とりあえずは表やグラフが「キッチリ」書け れば十分 • ここでのキッチリとは、たとえば有効数字を揃えるとか、論文誌や卒 論のフォーマットに従い表やグラフをまとめること • 二次元で表現できないことを三次元で可視化することもあるけ れど、まずは、二次元のグラフや表で見せられれば、特に問題 は無いかなとおもいます。 • 残り3つは、可視化手法の中でも比較的モダンだったり、すご く狭い世界で通用するものをご紹介

Slide 17

Slide 17 text

2. インフォグラフィック • Def. “情報、データ、知識を視覚的に表現したものである[1]。 インフォグラフィックは情報を素早く簡単に表現したい場面で 用いられ、標識、地図、報道、技術文書、教育などの形で使わ れている。また、計算機科学や数学、統計学においても、概念 的情報を分かりやすく表現するツールとしてよく用いられる。 科学的情報の可視化にも広く適用される。” • 狭義のDef. • データをフォントや画像などと組み合わせて、わかりやすく可視化し たもの • まずはみんなの目を惹くためにつくるもの

Slide 18

Slide 18 text

ナポレオン遠征 https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%83%95%E3%82%A9%E3%82%B0%E3%83%A9%E3%83%95%E3%8 2%A3%E3%83%83%E3%82%AF#/media/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Minard.png

Slide 19

Slide 19 text

2. インフォグラフィック https://public.tableau.com/en-us/s/gallery/fifa-19-top-ranked-players

Slide 20

Slide 20 text

2.インフォグラフィック(続き) https://markezine.jp/article/detail/26798 https://liginc.co.jp/news/46707

Slide 21

Slide 21 text

2. インフォグラフィック • まとめ • インフォグラフィック ≒ かっこいいフォントとかわい いイラストをつかって、数字を 思ったよりも大きなフォントサ イズで見せること • デザイン能力がいろいろな意味 で必要 • Piktochart など、自分でイン フォグラフィックを作る方法も ございます (8.3 でご紹介) • ポスター発表などでご活用頂け る可能性が • 具体例

Slide 22

Slide 22 text

3. ポンチ絵 • (政府が提案する)事業を行うと、どんな成果が期待出来るかを わかりやすく図示すること。

Slide 23

Slide 23 text

ポンチ絵(続き) • ポンチ絵の具体例 https://www.mhlw.go.jp/content/12000000/000519833.pdf

Slide 24

Slide 24 text

ポンチ絵へのツッコミ • 数量的インパクトに対する言及がない • 投資に対する政策効果が明記されていな い • どのようにPDCAが行われるのか不明確 • EBPM (Evidence Based Policy Making) • こうした政策に対して因果関係を明確にす ること (where 経済学がすごく役に立ちそ う) • データを定期的に収集することの重要性 • かといって、EBPMを推進するリスクは 「減点主義」の官僚にあるらしい 引用; https://gendai.ismedia.jp/articles/-/70122?page=2

Slide 25

Slide 25 text

とはいっても、私にもポンチ絵を書いて いた時期がありました(1.1 参照) • ポンチ絵の要件 • (〇〇党のせんせーや事務次 官が)数十秒で読んで理解で きること • しかも、内容が過不足なく明 記されていること • 「穴」がないようにすること • 色がいっぱい使われているこ と • 何よりも予算が取れること • で、どんなカッコいい ジャーナルに載るよりも、 きれいなポンチ絵が出来て いないと予算は取れない、 らしい。

Slide 26

Slide 26 text

3. ポンチ絵 • For Undergraduate Students • 中央官庁志望でも無い限り、書き方を覚えなくていいです • たぶん、民間で使う技術ではない気がします • For Graduate Students と社会人の皆様 • 中央官庁や地方自治体が、どういう力学で動いているのかを知るため にはこの上ない情報が埋まっているのがポンチ絵であります • 個人的には、ポンチ絵データを画像解析して分析したいなあとか考え ております

Slide 27

Slide 27 text

4. 動画(YoutubeやNetflix) • 分析結果や解析の結果、インフォグラフィックを動画にする • 具体例 BarChartRace • https://www.youtube.com/watch?v=OkM8PxOnaIA

Slide 28

Slide 28 text

4. 動画 (Youtube や Netflix) • Bar Chart Race の作り方は 8.3 で • https://public.flourish.studio/visualisation/2658794/?fbclid= IwAR3r9vPw9hp-Yy9fdRVJ2dIdyIG-wZZYFXQ- TyqPG1F47j6D3JdoJ0rd3Ks

Slide 29

Slide 29 text

4. 動画 (Youtube やNetflix) • Netflix; 世界の今をダイ ジェスト (Explained) • https://www.netflix.com /title/80216752 • インフォグラフィック+ナ レーション+動画というス タイル • だいたいの座学講義より わかりやすい気がしない でもない気がする

Slide 30

Slide 30 text

4. 動画 (youtube や netflix) • 中川先生のやさしい ビジネス研究 • https://www.youtube .com/channel/UCS8 9vRmX0PfWxmJWOjJ q6ZA • 研究成果や理論を動 画で解説 (日本中の大 学生が2020/5月時点 で受けているやつ)

Slide 31

Slide 31 text

ここまでのまとめ • まずは手堅く表やグラフでまとめましょう • ターゲットとする顧客に向けて表現手法は使い分ける

Slide 32

Slide 32 text

9.2 tableau を使ってみよう

Slide 33

Slide 33 text

やりたいこと • FIFA19 のデータ (レポート1で使ったもの) をtableau でいろい ろな手法を使ってビジュアライズしてみる

Slide 34

Slide 34 text

Tableau とは • “Tableau は、接続からコラボ レーションまでをスムーズに行え る、最も強力でセキュアかつ柔軟 なエンドツーエンドのデータ分析 プラットフォームです。 • データのパワーの活用を可能にし て、ビジネスをサポートします。 個人で利用できるように設計され、 エンタープライズ規模に拡張する こともできる Tableau は、アク ションを生み出すインサイトを データから引き出せる唯一の BI プラットフォームです。” https://www.tableau.com/ja-jp/products/what-is-tableau

Slide 35

Slide 35 text

Tableau のインストール • https://www.tableau.com/tft/activation にアクセスする

Slide 36

Slide 36 text

Tableau のインストール • Download Tableau Desktop をクリックする • 大学のメールアドレスを指定し, Download Free Trial をクリック

Slide 37

Slide 37 text

Tableau のインストール • exe (windows) または dmg (mac) がダウンロードされる ので, インストールを行う

Slide 38

Slide 38 text

Tableau の起動 • Windows 10 の場合

Slide 39

Slide 39 text

Tableau にデータをインポートする • 接続から, “Microsoft Excel” を選択する

Slide 40

Slide 40 text

Tableau にデータをインポートする ファイルを選択する

Slide 41

Slide 41 text

Tableau にデータをインポートする • “データ インタープリターを使用してクリーニング” をクリック

Slide 42

Slide 42 text

Tableau でデータを可視化してみる • ウインドウ下のワークシートをクリックする

Slide 43

Slide 43 text

Tableau でデータを可視化してみる • 左下の”メジャー” から, 列に age を, 行に wage をド ロップする • 合計値が表示され ているので, 右上 に合計値がひとつ プロットされてい る

Slide 44

Slide 44 text

Tableau でデータを可視化してみる • 列と行それぞれにつ いて▼をクリックし, “メジャー -> 合計値” から “ディメンジョ ン” に選択しなおす

Slide 45

Slide 45 text

Tableau でデータを可視化してみる • 右下にある値をクリックし, “除外” をクリックする

Slide 46

Slide 46 text

Tableau でデータを可視化してみる • 散布図が生成される

Slide 47

Slide 47 text

Tableau で地域ごとの選手数をプロット してみる • “ディメンジョン” をクリックし, 地 理的役割から “国/ 地域” を選択する

Slide 48

Slide 48 text

Tableau で地域ごとの選手数をプロット してみる • Nationality ごとの選手数を地図上にプロットできる

Slide 49

Slide 49 text

Tableau で地域ごとの選手数をプロット する • 右下をクリックし, マッピン グできていない国名同士を 手動で対応させる

Slide 50

Slide 50 text

Tableau で地域ごとの選手数をプロット する • 空欄だった中国 やイングランド, 韓国のデータが 埋め込まれる

Slide 51

Slide 51 text

様々な形式でプロットする • 表形式 • 箱ひげ図

Slide 52

Slide 52 text

様々な形式でプロットする • 棒グラフ

Slide 53

Slide 53 text

ツリーマップ

Slide 54

Slide 54 text

様々な形式でプロットする • パックバブル • バブルチャート

Slide 55

Slide 55 text

Wordcloud

Slide 56

Slide 56 text

今日の実習 これまでの講義で利用した • (1)Dbpedia.org ソース • 東証一部/二部/マザーズの企業概要データ • 日本の経済/経営/社会/法学者の概要データ • 日本のロック/ヒップホップ/フォークグループの概要データ • (2) FIFA19 の選手収録データ • (3) 日経NEEDS データ • 東証マザーズ • 東経2部 について, tableau を使って可視化を行いましょう

Slide 57

Slide 57 text

今日の実習 • ワードクラウド • 地域や国にマッピングしたグラフ • 棒グラフ • 線グラフ などを作成してみること

Slide 58

Slide 58 text

まとめ • 手堅くデータを可視化するには tableau が便利 • 割と導入している企業も多いみたいであります

Slide 59

Slide 59 text

Appendix: ライセンスの導入の仕方 • (一橋生と学習院生向けに)Tableau の Education 版ラ イセンスをお配りしています • 一橋生は Google Classroom を確認のこと

Slide 60

Slide 60 text

Appendix: ライセンスの導入の仕方 • メニューから[ヘルプ]-[プロダクトキーの管理]をクリックする

Slide 61

Slide 61 text

Appendix: ライセンスの導入の仕方 • [ライセンス認証] をクリックする

Slide 62

Slide 62 text

Appendix: ライセンスの導入の仕方 • [プロダクト キーを使用したライセンス認証]をクリックする

Slide 63

Slide 63 text

Appendix: ライセンスの導入の仕方 • プロダクトキーを入力し, [ライセンス認証]をクリックする

Slide 64

Slide 64 text

9.3 可視化ツール/ライブラリを使う

Slide 65

Slide 65 text

可視化の技法 • Piktochart • 8.1 でご紹介した, インフォグラ フィックを作るためのツール • Flourish • 8.1 でご紹介した, Bar Chart Race を作るためのツール • ヒートマップ • ハイライト表 • ツリーマップ • ガントチャート • Seaborn • これまでの講義で一部使用 • https://seaborn.pydata.org/ • https://seaborn.pydata.org/exam ples/index.html • Plotly • https://plot.ly/python/ • 後ほど解説。

Slide 66

Slide 66 text

Piktochart

Slide 67

Slide 67 text

piktochart • インフォグラフィック作成用サイト • https://piktochart.com/

Slide 68

Slide 68 text

ケーススタディ; (SADA)MASASHI と YOSHIKI

Slide 69

Slide 69 text

MASASHI と YOSHIKI の共通点 • 幼少期からクラシックの素養がある • MASASHI : バイオリン • YOSHIKI : ピアノ • (生き様が)ロックである • MASASHI: バンドが解散したり, 映画で負債をかかえたり • YOSHIKI: バンドが解散したり, バンドが再結成したり • 身体的故障を抱え楽器演奏ができなかった時期がある • 名曲をたくさん作っている • MASASHI: 親父の一番長い日, 道化師のソネット, 精霊流し • YOSHIKI: FOREVER LOVE, 紅, ART OF LIFE

Slide 70

Slide 70 text

Web 上でグラフなどを作成

Slide 71

Slide 71 text

完成。

Slide 72

Slide 72 text

BarChartRace と Flourish

Slide 73

Slide 73 text

BarChartRace と Flourish • よくある、棒グラフがグラフィカルに動くやつ (BarChart Race) をつくってみよう • https://app.flourish.studio/login?redirect=%2Fprojects

Slide 74

Slide 74 text

Flourish • アカウント登録を行う

Slide 75

Slide 75 text

Flourish • 可視化の技法が選べる

Slide 76

Slide 76 text

Flourish • Bar Chart Race を選択

Slide 77

Slide 77 text

Flourish 以下のようなインターフェースが開く

Slide 78

Slide 78 text

Flourish • 流し込むデータセットを準備 • 今回は2010年のFormula 1 ポイント数 (standings)推移 • https://en.wikipedia.org/wiki/2010_Formula_One_World_Championship • ドライバーと所属チームの情報、グランプリごとの得点数、累積値 を求める • スクレイピングして, Excel 上で ifs 関数を用いて、得点数を求める

Slide 79

Slide 79 text

Flourish • インターフェース上で, パラメータを指定する

Slide 80

Slide 80 text

Flourish • インターフェース上で, パラメータを指定する B列にドライバーごとの 国籍の国旗情報のURL C列にチーム情報 A列にドライバー名 列番号を指定する

Slide 81

Slide 81 text

Flourish • Preview ボタンを押す • 右側のコンソールで表 示形式を調整する • Export and Publish を クリックする

Slide 82

Slide 82 text

Flourish • 作成した結果 • https://public.flouri sh.studio/visualisati on/2658794/?fbclid =IwAR3r9vPw9hp- Yy9fdRVJ2dIdyIG- wZZYFXQ- TyqPG1F47j6D3Jdo J0rd3Ks

Slide 83

Slide 83 text

Bar Chart Race の使い方 • とりあえずソーシャルメディアで流行りそう • データの変動や、全体的な競争の変位を示すときには便利 • だけど、ゼミの発表でこれ使ったら先生におこられそう(なんと なくだけど)

Slide 84

Slide 84 text

D3.js

Slide 85

Slide 85 text

D3.js • Java Script ライブラリ • https://d3js.org/ • 動的な可視化で広く活用

Slide 86

Slide 86 text

Zoomable Circule • https://observablehq.com/@ d3/zoomable-circle-packing

Slide 87

Slide 87 text

Scatter Plot Matrix https://observablehq.com/@d3/scatterplot-matrix

Slide 88

Slide 88 text

Sankey Diagram https://observablehq.com/@d3/sankey-diagram

Slide 89

Slide 89 text

Data-To-Viz.com

Slide 90

Slide 90 text

Data-to-viz.com • データの可視化手法を網羅的に紹介

Slide 91

Slide 91 text

Data-to-viz.com • 可視化のパス図

Slide 92

Slide 92 text

Seaborn

Slide 93

Slide 93 text

Seaborn による可視化 (Violin Plot) • 単一のパラメータ • 複数のグループ https://python-graph-gallery.com/50-basic-violinplot-and-input-formats/

Slide 94

Slide 94 text

Seaborn による可視化 (cont.) • 複数のパラメータ https://python-graph-gallery.com/50-basic-violinplot-and-input-formats/

Slide 95

Slide 95 text

Ploty

Slide 96

Slide 96 text

Plotly を使ってみよう • https://plot.ly • Python やR で使えるビジュ アライゼーションフレーム ワーク

Slide 97

Slide 97 text

Plotly を使ってみる • https://plot.ly/Auth/login/ にアクセスする • 上部の Sign Up をクリック し, 必要な情報を記入する • Sing Up をクリックする

Slide 98

Slide 98 text

Plotly を使ってみる • API Settings 画面に遷移する • Username • API Key が取得できる. ・API Key がマスクされている ので, 必要に応じて Regenerate Key をクリックし, API key を表 示する • これと別に Confirmation Mail が届くので, クリックす る

Slide 99

Slide 99 text

3. Plotly を使ってみる • Jupyter Notebook/Google Colaboratory 上で, “!pip install plotly” する

Slide 100

Slide 100 text

3. Plotly を使ってみる • API Key を渡す

Slide 101

Slide 101 text

3. Plotly を使ってみる • Sanky Diagram を書いてみる • Plotly をインポートする • データセットを構築する • データのフローをsource と target でそれぞれ指定する • Value に値を指定する 引用; https://plot.ly/python/sankey-diagram/

Slide 102

Slide 102 text

3. Plotly を使ってみる • データの中身を print(data) で確認する

Slide 103

Slide 103 text

3. Plotly を使ってみる • グラフのタイトルを指定する • Dict で data と layout をそれ ぞれ指定し, fig に入れる • py.iplot に fig を指定する

Slide 104

Slide 104 text

3. Plotly を使ってみる • Sanky Diagram が表示される

Slide 105

Slide 105 text

3. Plotly を使ってみる • plotly.plotly と plotly.figure_factory をインポートする • Numpy を使って, 乱数 を生成し, それに基づ きデンドログラムを作 成する. https://plot.ly/python/dendrogram/

Slide 106

Slide 106 text

3. Plotly を使ってみる • 必要なパッケージをイン ポートする • データを取得する (今回は figshareから) • デンドログラムを縦方向と 横方向に作成する • ヒートマップを作成する

Slide 107

Slide 107 text

3. Plotly を使ってみる • X と Y 方向に作成したデンド ログラムを, Z 方向にヒート マップのデータを指定する • ヒートマップデータを figure に流し込む

Slide 108

Slide 108 text

3. Plotly を使ってみる • レイアウトの修正を行う • それぞれの軸方向でレイアウ トの修正を行う • py.iplot にデータを流し込み, プロットする

Slide 109

Slide 109 text

3. Plotly を使ってみる • ヒートマップ付きのデンドロ グラムを作成する

Slide 110

Slide 110 text

3. Plotly を使ってみる • インタラクティブなグラフを 作成する • グラフのズームが出来るように する • 今回は元データを取得し, それ を操作できるようなウィジェッ トを用意する https://plot.ly/python/slider-widget/

Slide 111

Slide 111 text

3. Plotly を使ってみる • 出力結果

Slide 112

Slide 112 text

3. Plotly を使ってみる • じょうろ図を書いてみる • パッケージを指定 • データセットを指定 https://plot.ly/python/funnel-charts/

Slide 113

Slide 113 text

3. Plotly を使ってみる • 図が出力される

Slide 114

Slide 114 text

実習2 • Ploty を使ってデータの可視化をやってみよう • API キーを取得する • サンプルコードが手元の環境でも動くか確かめる • 必要に応じて, 自分が可視化したいデータで確認する

Slide 115

Slide 115 text

まとめ • データのビジュアライゼーションは, データを使ってわかるこ とをより伝えるための手段 • 時と場合に応じて可視化の手法は使い分けよう • 経済学部や経営学部の場合、まだまだ2次元の棒グラフと線グラフ or 散布図が中心かもしれないけれど, ちょっとずつグラフの自由度が上 がっているけれど

Slide 116

Slide 116 text

9.4 最終レポート

Slide 117

Slide 117 text

まとめと最終報告レポート • 1組5-6名のグループを作り, そのメンバーで最終レポートを作 成します。 • データ分析組, • データ調達組, • プレゼンテーション作成組, • プレゼンテーション担当 など役割分担はお任せします。 • 第12回で, 最終レポートのプロポーサルを発表します • 発表時間10分, 質疑応答5分 • データの初期的な分析結果がまとまっているとベター

Slide 118

Slide 118 text

まとめと最終報告レポート • テーマ • 「○○のための実践的データ分析」 • 卒論や修論や博論の作成の入り口になるような、データの調達とその データの解析を, 講義で取り上げたデータセットおよび分析手法で実施 する • 分析単位はマクロ (国レベル) でもメソ (企業/産業レベル) でもミクロ (個人レベル) でも問いません • 利用できるデータセット • 特に制限なし • 利用できるツール • Tableau, Excel, Word, SQL, BigQuery, Google Colaboratory, Jupyternotebook (Python) など, 特に制限なし

Slide 119

Slide 119 text

まとめと最終報告レポート • 評価方法 • グループ内での自己評価 • グループ外からの評価 アンケートシステムをPolly で用意します。 • 評価基準 • (A.) グループ内の役割分担 (B.) データセットのユニークさおよび、それが適切に処理されているか (C.) 分析手法のユニークさおよび、それが適切に解析されているか (D.) プレゼンテーションのユニークさ (E.) 質疑応答にうまくリプライすることが出来ているか • 納品物 • プレゼンテーションに利用したファイル (Word か Powerpoint か Prezi か etc…) を, Slack のDM に代表者がアップすること

Slide 120

Slide 120 text

最終レポートのグループ分け • ランダムに学籍番号で割り振りました • とりあえず、履修している31名を振り分けています • また、履修生以外の聴講生で参加したい方がいたら、原まで Slack で DM して頂けると幸いです

Slide 121

Slide 121 text

グループ分け(学籍番号) • グループ1 • 1115196Z • 1117089B • 2118210X • 2118330Y • 2119270U • 2120370K • グループ2 • 1117257S • 2118179Y • 2118203M • 2119187M • 2119236U

Slide 122

Slide 122 text

グループ分け(学籍番号) • グループ3 • 2117209Y • 2117264B • 2118181A • 2118282M • 2119261X • グループ4 • 1118046H • 2117021M • 2117228M • 2118163C • 2119193Z

Slide 123

Slide 123 text

グループ分け(学籍番号) • グループ5 • 1119024X • 2115229C • 2117194U • 2117280H • 2119195S • グループ6 • 2118040U • 2118114K • 2118185H • 2118214A • 2119006C

Slide 124

Slide 124 text

最終レポートの雛形 • 表紙 • イントロダクション • 先行研究 • 問い • 仮説 • 集めたデータセット • データ解析結果 • 考察とインプリケーション

Slide 125

Slide 125 text

定量分析の業務フロー 2020/10/13 125 リサーチクエス チョンを決める 必要なデータを 探す 論文データ/書誌 情報を使う 特許データ/書誌 情報を使う その他データを使う (プレスリリース /POS データ) デ ー タ の ク リ ー ニ ン グ / 接 合 を 行 う エクセル/Python/Rでグラフを描く Stata/R/Python で回帰分析する KHCoder/R/Python でテキスト分析 する R/Netdraw etc… でネットワーク分 析する 企業データを 使う

Slide 126

Slide 126 text

例.元 IIR 西口先生のネットワーク研究 • “コミュニティー・キャピタル 中国・温州人企業家ネットワー クの繁栄と限界” • http://doi.org/10.11207/taaos. 4.1_200 • データに頼らずに, 足で稼いで ネットワークの動態をインタ ビュー調査から明らかにする • 足掛け10年(!) 2020/10/13 126

Slide 127

Slide 127 text

例. 元 IIR 西口先生のネットワーク研究 • “傑出したパフォーマンスで知られる中国・温州人企業家の国 際的ネットワークは、コミ ュニティー・キャピタルに依拠する 新たな社会ネットワーク分析に適した事例であり、近 年ビッグ データ一辺倒の観のある米国の定量分析 (Fleming et al. 2007) を補完する意味で、 詳細なフィールド調査に基づく豊かな実証 的知見を提供し得る。さらに Watts 等(1998, 1999, 2003) がシ ミュレーションで数学的に立証したスモールワールドの知見が、 現実に応用可 能なのは、実効的にコミュニティー・キャピタル に支えられた社会ネットワークに限定さ れることも示唆され る。 ” 2020/10/13 127

Slide 128

Slide 128 text

あくまでリサーチクエスチョンが大切 • データはあくまでデータ • 研究の問いに合わせて必要なデータを持ってくるのが大切で、 データに合わせて研究するのは本末転倒 (そういう研究も多い けど。。。) • 数年前に比べても利用できるデータはますますリッチになって いるので、ますます、「どのような研究がしたくて」、「どの ような問いを立てている」のかが大切に。 2020/10/13 128

Slide 129

Slide 129 text

ディスカッション • どういうテーマで解析を行うか/リサーチクエスチョンは何か • 解析を行うためには、どういうデータが必要か • メンバーの役割分担 について、グループ内で(いるメンバーで)ディスカッションをし てください。

Slide 130

Slide 130 text

THANKS yasushi.hara@r.hit-u.ac.jp

Slide 131

Slide 131 text

Appendix. ネットワーク分析

Slide 132

Slide 132 text

ネットワーク分析な具体例1. JST/RISTEX 深堀調査 『科学的ブレークスルーとイノベーションをつなぐ研究に着目した「科学と技 術の相互作用」の明確化』 • IIR->Waseda 清水洋先生が研究代表者 • http://www.ristex.jp/examin/others/shinki-pj-result2010.html • 科学から技術に至る知識の流れを特許と論文データベースを接 合することで特定する • ケース • 青色LEDに至るまでに, どのような特許が参照されたのか後方引用関係 から特定する • Shuji Nakamura の2007 年の特許をベースに, そこから後方引用を5次 までたどり知識の流れを測定していく

Slide 133

Slide 133 text

Network (delete pendants) Source: Web of Knowledge[Derwent Innovation Index]/Web of Science Red node indicates the “Main path”. ※. △が特許, ■が論文

Slide 134

Slide 134 text

1930s 1960s 1970s 1990s 2000s 1910-2007 (1次引用すべて導入; 上位12社明記) 1980s

Slide 135

Slide 135 text

1-1. ネットワーク分析 • 無償のもの • R - https://www.r-project.org/ • KHCoder - http://khc.sourceforge.net/ • (前回の講義) • NetDraw- https://sites.google.com/site/netdrawsoftware/home • Gephi - http://oss.infoscience.co.jp/gephi/gephi.org/ • Sci2 - https://sci2.cns.iu.edu/user/index.php • Pajek - http://vlado.fmf.uni-lj.si/pub/networks/pajek/ • 有償のもの • Vantage Point

Slide 136

Slide 136 text

1-1. NetDraw • 無償のネットワーク分析 ソフトウェア • 少々古いが, その分(オン ライン上の)ドキュメン トが充実 • ダウンロードからインス トール, 簡単なネットワー クを描画するところまで 解説します 2020/10/13 136

Slide 137

Slide 137 text

1-1. NetDraw のダウンロードとインストール • Analytic Technologies から Product を選び, Ucinet 6 の Download をクリックする • EXE ファイルのダウンロード が終わったら, インストールを 行う • UCINET 6 を起動する 2020/10/13 137

Slide 138

Slide 138 text

1-1. Netdraw を用いてネットワークを描画する • UCINET 6 を起動する 2020/10/13 138

Slide 139

Slide 139 text

1-1. Netdraw を用いてネットワークを描画する • Excel でかんたんなネットワーク情報図を用意する 2020/10/13 139

Slide 140

Slide 140 text

1-1. Netdraw を用いてネットワークを描画す る • UCINET 上でスプレッドシートのアイコンをクリックする 2020/10/13 140

Slide 141

Slide 141 text

1-1. Netdraw を用いてネットワークを描画する • UCINET Spreadsheet にはりつける 2020/10/13 141

Slide 142

Slide 142 text

1-1. Netdraw を用いてネットワークを描画する • ファイル名をつけて保存する 2020/10/13 142

Slide 143

Slide 143 text

1-1. Netdraw を用いてネットワークを描画する • UCINET より Netdrawをひらく 2020/10/13 143

Slide 144

Slide 144 text

1-1. Netdraw を用いてネットワークを描画する • 先ほど作成したファイルを NetDraw より開く 2020/10/13 144

Slide 145

Slide 145 text

1-1. Netdraw を用いてネットワークを描画する • 関係性が可視化される 2020/10/13 145

Slide 146

Slide 146 text

1-2. Gephi • オープンソース版ネットワー ク分析ソフトウェア 2020/10/13 146

Slide 147

Slide 147 text

1-2. Gephi の使い方 • Sample ファイルで試してみる • Les Miserables.gexf – レミゼラブルの共起情報ファイル 2020/10/13 147

Slide 148

Slide 148 text

1-2. Gephi の使い方 • Import Report が表示されるので, OK をクリックする 2020/10/13 148

Slide 149

Slide 149 text

1-2. Gephi の使い方 • ネットワークグラフが表示される 2020/10/13 149

Slide 150

Slide 150 text

1-2. Gephi の使い方 • Layout を動かしてみる 2020/10/13 150

Slide 151

Slide 151 text

1-2. Gephi の使い方 • データセットに慣れてみる • http://oss.infoscience.co.jp/gephi/wik i.gephi.org/index.php/Datasets.html のうち “[GEXF] EuroSiS Web マップ 調査: 欧州 12 か国の「社会における科学 (Science in Society)」活動主体の Web 上での相互関係をマップしたもの。”をダ ウンロードして表示する. ・ファイルを選択し, OK をクリックする 2020/10/13 151

Slide 152

Slide 152 text

1-2. Gephi の使い方 • ネットワークグラフが表示される 2020/10/13 152

Slide 153

Slide 153 text

1-3. Sci2 • ネットワーク分析ツール • エンジンとして, Gauss や Gephi, R を利用 • https://sci2.cns.iu.edu/use r/index.php 2020/10/13 153

Slide 154

Slide 154 text

1-3. Sci2 • ダウンロード • ダウンロード前にアカウント 登録が必要 • 利用しているオペレーション システムを選択する 2020/10/13 154

Slide 155

Slide 155 text

1-3. Sci2 • ZIP ファイルがダウンロー ドされるので, 展開する • Sci2.exe をダブルクリック 2020/10/13 155

Slide 156

Slide 156 text

1-3. Sci2 • コンソールが開く • とりあえず, サンプル ファイルでネットワーク 図を書いてみる • [File] – [Load]を選択す る 2020/10/13 156

Slide 157

Slide 157 text

1-3. Sci2 • Sampledata -> socialscience -> “Florentine.nwb” を選択 し, 開くをクリックする 2020/10/13 157

Slide 158

Slide 158 text

1-3. Sci2 • 右側のData Manager から “NMB file….” を右クリック し, View をクリックする • 元データが表示される 2020/10/13 158

Slide 159

Slide 159 text

1-3. Sci2 • Visualization -> Networks -> GUESS を選択する 2020/10/13 159

Slide 160

Slide 160 text

1-3. Sci2 • ネットワーク図が表示される • Show Label をクリックして, ノード毎のラベルを表示させる 2020/10/13 160