#経済学のための実践的データ分析 1.2 統計解析ソフトの比較と Notebook で重回帰までやってみよう

Slide 1

Slide 1 text

経済学のための実践的データ分析 2. python, R, Jupyter notebook 事始め/ 統計ソフトちゃんちゃかちゃん 1405教室経済学研究科原泰史 [email protected]

Slide 2

Slide 2 text

確認事項 • 電源タップは足りているでしょうか？ • Jupyter notebook はインストールできましたでしょうか？ • 前半は座学を中心にお届けするので、頑張って(ネットワーク帯域を確保しながら)ダウンロードを終わらせていただけるとありがたいです。

Slide 3

Slide 3 text

今日の内容. python, R, notebook 事始め (あるいは、統計分析ソフトちゃんちゃかちゃん) • Stata や SPSS, SAS など統計分析ソフトは多数存在します。これらのメリットや特徴について前半は説明します。 • 後半は、本講義で主に利用する jupyter notebook を用いて, python やR の基本的なコマンドについて実習を交え説明を行います。テーマは「サンクコスト」です。

Slide 4

Slide 4 text

前回のリマインド

Slide 5

Slide 5 text

Jupyter notebook とは • プログラムを実行し、実行結果を記録できるツール • 数値計算・データ解析で広く用いられている • 実行結果は notebook 形式で保存可能 • 便利なので使ってみましょう。

Slide 6

Slide 6 text

Jupyter Notebook のインストール(1) • 1. https://anaconda.com にアクセスし, Python3.7 バージョンの [Download] をクリック Windows版 Mac版ダウンロードが終わるまで待つ。

Slide 7

Slide 7 text

Jupyter Notebook のインストール(1) • 2. [Download] をクリックする

Slide 8

Slide 8 text

Jupyter Notebook のインストール (3) • “Next >” をクリックする • “I Agree” をクリックする

Slide 9

Slide 9 text

Jupyter Notebook のインストール(3) • “Next >” をクリックする • “Next >” をクリックする

Slide 10

Slide 10 text

Jupyter Notebook のインストール (4) • “Install” をクリックする

Slide 11

Slide 11 text

Jupyter Notebook の起動 (1) • スタートメニューから, Jupyter Notebook を選択する

Slide 12

Slide 12 text

Jupyter Notebook の起動 (2) • コンソールが表示される

Slide 13

Slide 13 text

Jupyter Notebook の起動 (3) • New から Python 3 を選択する

Slide 14

Slide 14 text

Jupyter Notebook の起動(4) • 1+1 を入力し, Run をクリック • “2” が出力される

Slide 15

Slide 15 text

今日の内容 (105分) 1: 統計ソフトはどれを使うべきか aka excel は最強の統計ソフトか？ 2: python を使ったデータ分析事例の紹介 3: jupyter notebook + python でデータを触って, 回帰分析を回してみよう

Slide 16

Slide 16 text

統計ソフトちゃんちゃかちゃん* ※. 1970年代から80年代初等にかけて流行した、落語や歌謡曲のサビだけをつなぎあわせたメドレー/オムニバス形式の作品のこと

Slide 17

Slide 17 text

そもそも。 • なぜこの講義は python やR on jupyter notebook and/or google colaboratory を使うのか？ • 一番の理由: 無償だから • 有償の統計分析ソフト (ex. Stata) の場合 • 学生の間は導入コストはかなり低い • が、社会人になると継続して最新バージョンを継続的に導入するコストは極めて高くなる • 仕方ないから、マスターコースやドクターコースに行けばいいじゃない

Slide 18

Slide 18 text

経済/経営学部の統計ソフトの利用状況 {一橋, 東大, 早稲田, 慶應} • 各大学のシラバスから、 • SPSS • Eviews • Stata • SAS • Python • Excel というタームが含まれている講義を抽出。 ※. R は exact matching できないので除外。 • 経済学部・経営学部/MBAの講義で、どういった統計ソフトが使われているかを調査

Slide 19

Slide 19 text

経済学部の統計ソフトの利用状況 {一橋, 東大, 早稲田, 慶應} 0 5 10 15 20 25 30 35 40 45 50 経済学部商学部社会学部経済学商学・経営学経済学部三田・経済学部経営管理研究科 (MBA) 経営管理専攻 MBA MBA 一橋大学一橋大学一橋大学早稲田大学早稲田大学東京大学慶應義塾大学早稲田大学一橋大学筑波大学 SPSS Stata SAS Eviews Python Excel

Slide 20

Slide 20 text

経済学部の統計ソフトの利用状況 {一橋, 東大, 早稲田, 慶應, 東経大} • Findings • SPSS のユーザ数は減少 • Stata で統計分析を教えるシェアは未だ高い • 早稲田謎のSAS 人気 • Python はデータサイエンス系の講義で広く登場 • 一橋大学経済学部でpython というタームが出てくるのは、本講義以外だと山田先生の講義

Slide 21

Slide 21 text

SPSS is dying Source: http://lindeloev.net/spss-is-dying/

Slide 22

Slide 22 text

SPSS is dying (cont.) • “I predict that R overtakes SPSS in yearly citations by 2020. The implications are clear: • If you use SPSS in your business or research, move to R now rather than later. • Do not ask for SPSS competences in job postings. You will scare away the good candidates. • We are doing students a disservice by teaching SPSS. Switch to JASP for simple one-off analyses and R for complex or repeated analyses. Rstudio Desktop is a highly recommended interface to R.” Source: http://lindeloev.net/spss-is-dying/

Slide 23

Slide 23 text

Data Analytics Job Market The number of data science jobs for the more popular software (those with 250 jobs or more, 2/2017). Jobs trends for R (blue & lower) and Python (orange & upper). http://r4stats.com/articles/popularity/

Slide 24

Slide 24 text

各統計ソフトの比較 1. Stata 2. SPSS 3. EViews 4. (Microsoft Office 365) Excel 幸いなことにどのソフトウェアも持っているので、実機をお見せしながら説明します

Slide 25

Slide 25 text

1. Stata • 事実上のデファクトスタンダード(だった) • (重)回帰分析やパネルデータ分析, 主成分分析など, 経済学・経営学での多変量解析はほぼ網羅している • 大学の経済学・（定量分析を行う）経営学の先生の使用率も高い • ゼミによっては基本的な分析ソフトとして指定されている場合も • 主なテキストブック

Slide 26

Slide 26 text

1. Stata ・右下のインターフェースにコマンドを打ち込む・データはexcel 経由またはsql で流し込む

Slide 27

Slide 27 text

2. SPSS • Stata 以前のデファクトスタンダード • 12年前に一橋大でマーケティングサイエンスの講義を受講したときは、SPSS が指定されていました • 現在はIBM が保有 • GUI ベースでデータの処理および解析が行えることが特徴

Slide 28

Slide 28 text

2. SPSS

Slide 29

Slide 29 text

2. SPSS

Slide 30

Slide 30 text

3. EViews • やはり一世代前に主力の統計分析ソフト • ファイナンス・時系列分析 (ARCH, GARCH, MR, AR, VAR) などに特化 • 詳しくは関連するファイナンス・計量経済学の講義で • 回帰分析など、行える分析は Stata/SPSS とほぼ同じ

Slide 31

Slide 31 text

3. EViews ・変数をExcel or SAS or Stata or SPSS 経由で取り込み・変数の長さを最初に指定して・コマンドを上のウインドウに打ち込んで、解析を行う

Slide 32

Slide 32 text

4. Excel • Microsoft Office 365 で現在は主に提供 • 生協で買うパソコンや Surface に必ず入ってるやつ • 某省庁のデータ分析はだいたい Excel で完結してたりする • (Excel を使ってビックデータの時代とか言いがち) • 記述統計や、基本的なデータの分析であればExcel で十分 • 一昔まえの「定量的な」卒論とか

Slide 33

Slide 33 text

4. Excel

Slide 34

Slide 34 text

5. SAS • 機能は充実 • 前述の通り, 講義で多数の使用例 • しかし、商用価格はかなり高い • SAS® University Edition は無償

Slide 35

Slide 35 text

まとめ名称 Stata SPSS EViews Excel 販売・提供母体 Stata IBM ライムストーンマイクロソフトインターフェース GUI (コマンドベース) GUI GUI (コマンドベース) GUI 主なメリット (経済学・経営学周りの)ユーザーが多いクリックだけでデータ解析ができる時系列解析をするときに、コマンドを書く必要がないすぐに手に入る。情報基盤センターのPCやスマホから扱えるコスト(学生編) ・イニシャルコスト 86,400円 (キャンペーン中) 124,000円 63,720円 0円 (一橋大学生は office 365 サブスクリプションあり) ・アップグレードコスト 101,520円 136,600円 49,680円 0円(一橋大学生は office 365 サブスクリプションあり) コスト(社会人編) 262,440円 310,000円 206,280円 12,744円・アップグレードコスト 172,,800円 54,900円 97,200円 12,744円

Slide 36

Slide 36 text

まとめ(2) • ランニングコストやサンクコストを考えると, 実は Excel でなんでも出来るようになるのが最適コースの可能性 • Stata や SPSS など統計ソフトは、学生の身分だと比較的安価もしくは無償で導入出来る。最新機能をキャッチアップするのは辛い。 • （会社で稟議書が通るかというと、データ関連部局でも割と怪しい。） • ちなみに、講師がIT スタートアップで働いていたときは、大学生の身分で買った Eviews やSPSS を用いて解析をしていました • ということで、Excel + 無償で導入できる R and/or Python が2019 年現時点での最適解！ • 会社によっては, Jupyter Notebook やR Studio が自由にインストールできる PC が供給されない可能性も (2019年現在は) • その場合は Google Colaboratory で。

Slide 37

Slide 37 text

2. Python を使った解析の具体例

Slide 38

Slide 38 text

はじめに • 研究ユースでの Python 活用のユースケースをご紹介 • いろいろな研究プロジェクトにコミットしていますが • SPSS オンリー • Stata + Excel (これが一番多い) • Stata + Python + Excel • Stata + SQL + Excel など, 組む先生によって使う統計ソフトは異なります.

Slide 39

Slide 39 text

研究プロジェクト • 日本企業とアメリカ企業の研究開発パフォーマンスの比較 • 特許データ、財務データ、研究開発投資データを接合することで、企業のROA, ROI が研究開発パフォーマンスによってどう説明付けられるか定量的に分析 • 一橋大学イノベーション研究センターの Working Paper として昨年発表 • Yamaguchi, Nitta, Hara, and Shimizu (2018) Staying Young at Heart or Wisdom of Age: Longitudinal. Analysis of Age and Performance in US and Japanese Firms., IIR Working Paper • 4月終わりの日経新聞で「引用」

Slide 40

Slide 40 text

No content

Slide 41

Slide 41 text

Firm Age And Profitability United States Japan

Slide 42

Slide 42 text

東証上場企業（連結、事業会社）の平均年齢（2012年時点） 42 企業数年齢 0 20 40 60 80 100 120 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 112 118 124 平均は60.5歳、中央値は63歳

Slide 43

Slide 43 text

NYSE上場企業（連結、事業会社）の年齢分布（2012年時点） 43 企業数年齢 0 5 10 15 20 25 30 35 1 8 14 20 26 32 38 44 50 56 62 68 74 80 86 92 98 104 110 116 123 129 135 142 148 155 162 168 179 206 268 平均は60.95歳、中央値は51歳 • 実は平均年齢は日本と同じ、但し中央値は12歳若い

Slide 44

Slide 44 text

総特許出願数推移(東証上場企業) 0 50000 100000 150000 200000 250000 300000

Slide 45

Slide 45 text

総特許出願数推移(新興市場企業) 0 1000 2000 3000 4000 5000 6000 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012

Slide 46

Slide 46 text

0 20000 40000 60000 80000 100000 120000 140000 160000 180000 総特許出願数推移(東証上場企業; 企業別top30) パナソニック日立製作所東芝日本電気キヤノン三菱電機富士通ソニーリコートヨタ自動車シャープセイコーエプソン富士フイルムホールディングスパナソニック電工三洋電機日本電信電話富士電機三菱重工業デンソー日産自動車新日本製鐵本田技研工業コニカミノルタホールディングス住友電気工業クボタオリンパス沖電気工業東レ川崎製鉄大日本印刷

Slide 47

Slide 47 text

0 500 1000 1500 2000 2500 3000 3500 総特許出願数推移(新興市場企業; 企業別top30) ユニバーサルエンターテインメントオンキヨー藤商事ニスカタイヨーエレックシチズン電子大井製作所元旦ビューティ工業キヤノン化成ミヨタエムケー精工エスケー化研日本マイクロニクスマーレテネックスジャストシステムデジタルミマキエンジニアリングフクダ電子日本アンテナ桂川電機シーシーアイ松本油脂製薬新コスモス電機高見沢サイバネティックスサン電子マキ製作所ハーモニック・ドライブ・システムズ綜研化学ユタカ技研ケーブイケー

Slide 48

Slide 48 text

ソニーの特許分類推移 2019/6/5 48

Slide 49

Slide 49 text

技術距離の計測 • We used technological distance as an indicator of R&D rigidity. • The technological distance construct, proposed by Jaffe (1986), was originally intended as a measure of the degree of similarity between technological investment portfolios (which Jaffe called ‘technological positions’) of two different firms. • Thus, we estimated R&D rigidity by calculating the similarity between a firm’s current and previous technological investment portfolio. The more similar a firm’s current and previous portfolios, the more rigid its R&D resource allocation. Technological distance was calculated as follows.

Slide 50

Slide 50 text

技術距離の計測 • technological position of firm i in year t • = 1 , 2 , ⋯ , • F it is 1 ☓ j vector, NP it denotes the number of patents obtained by firm i in year t and NP ijt is the number of patents obtained by firm i in field j in year t • Technological distance (P it ) between firm i’s technological position in year t (F it ) and year t-1 (F it-1 ) is obtained from • = Τ ∙ −1 ′ ∙ ′ −1 ∙ −1 ′ 1/2 • Technological distance assumes a value between 0 and 1, and it is unity if the two vectors are identical, which implies that the firm did not changes its investment profile at all between t-1 and t, and zero if the two vectors are orthogonal, which implies that the firm changed its technological position completely.

Slide 51

Slide 51 text

計算をするには… • 日本企業だと数千社, アメリカ企業でも数百社の, 複数年度間の特許数を, 技術分野 (IPC 分類) ごとに解析することが必要 • Excel でも超絶がんばれば可能だけど, たぶん徒労 • vlookup とマクロとピボットテーブルを組み合わせる • そこで, Python でデータを処理 • 先程与えられた数式を, Python でコード化をして, Panda パッケージを用いてデータを取り込み. 取り込んだ, 企業IDと出願年ごとの特許数と特許分類データに基づき, 技術距離を算出して csv ファイルに保存

Slide 52

Slide 52 text

技術距離の計測 Source: PatentsView and Derwent Innovations Index for USPTO patents, and IIP Patent Database for JPO patents. R&D Rigidity by Age (t-3, 3-year average) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 4 10 16 22 28 34 40 46 52 58 64 70 76 82 88 94 100 106 112 118 124 130 136 142 148 154 160 166 172 178 184 190 196 202 208 US JPN

Slide 53

Slide 53 text

技術距離の計測(2) • R&D Rigidity by Age (t-5, 3-year average) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127 133 139 145 151 157 163 169 175 181 187 193 199 205 US JPN Source: PatentsView and Derwent Innovations Index for USPTO patents, and IIP Patent Database for JPO patents.

Slide 54

Slide 54 text

ということで。 • 数式が与えられたときに, それに基づいてコーディングして分析出来るようになると, かなりデータサイエンスの勘所を抑えた感じにはなります。 • 千里の道も一歩から。 • 今日の残りの時間は, サンプルデータを使って Jupyter Notebook で重回帰分析までをやってみましょう。

Slide 55

Slide 55 text

3: jupyter notebook + python でデータを触って, 回帰分析を回してみよう

Slide 56

Slide 56 text

今日の notebook Google Colaboratory 版 https://colab.research.google.com/drive/1 qeYXrHXGE5yTxP5SVSvfxK9zmmXnyokD Jupyter Notebook 版 Manaba の Notebook タブに掲載

Slide 57

Slide 57 text

Exercise 1: 1+1 = 2 を計算する • Jupyter notebook の in: に, 1+1 をタイプする • 2 がout: に出力される

Slide 58

Slide 58 text

Exercise 2: 3*9-12+14/3 を計算する • Jupyter notebook の in: に, 3*9-12+14/3 をタイプする • 19.66666… がout: に出力される

Slide 59

Slide 59 text

Exercise 3(1): sin(1)+cos(2)+tan(3) を計算する Exercise 3(2): 円周率を確認する • Math パッケージをインポートする • python の場合, データ処理 etc… を円滑を行うためにはパッケージをインポートします. • ここでは, 数学関数の含まれる math パッケージをインポートして, 続いて三角関数を計算してみます • Sin(1)+cos(2)+tan(3)を計算する • ついでに, 円周率を確認する • Out に以下の通り出力されます

Slide 60

Slide 60 text

Numpy パッケージを利用してみる • NumPy • 数値の配列・行列などを効率的に処理するパッケージ • http://www.numpy.org • インポートの方法 • 先程の数学関数と同じく import numpy as np とタイプし, ライブラリをインポートする

Slide 61

Slide 61 text

Exercise 4(1): ベクトル計算をやってみる • まずはnumpy をインポート • ベクトルaとベクトルbを定義 • ベクトルaとベクトルbの中身を確認

Slide 62

Slide 62 text

Exercise 4(2): ベクトル計算をやってみる • ベクトルa の2乗を求める • ベクトルa+bの要素ごとの積を求める • ベクトルの内積を求める

Slide 63

Slide 63 text

Exercise 5: 行列演算をやってみる • 5x5 の行列cをランダムな値で作成する • 出力してみる

Slide 64

Slide 64 text

Exercise 5(2): 行列演算をやってみる • 逆行列C-1を求める np.linalg.inv(c) • 行列C*C-1 して, 単位行列E になることを確認する c.dot(np.linalg.inv(c))

Slide 65

Slide 65 text

Panda パッケージを利用してみる • pandas • Python でデータ解析を行うためのパッケージ • Excel の表やSQL を直接取り込んで処理するのにピッタリ • データ構造 • 一次元: Series • 二次元: DataFrame (※. 個人的にはよく使います) • 行タイトルや列タイトルがつけられる • 文字列と数字を excel みたいに混在出来る • インポートの方法 • import pandas as pd

Slide 66

Slide 66 text

Exercise (6): Pandas パッケージで行列を DataFrame に変換する • Pandas パッケージをインポートする • import pandas as pd • 先程作成した行列c を DataFrame に変換する • Data “F”rame になってるようにチェック • 出力する • 行番号と列番号が付いていることが確認できる

Slide 67

Slide 67 text

Exercise (6-2): 行番号と列番号を名称変更する • Pandas パッケージをインポートする • import pandas as pd • 先程作成した行列c を DataFrame に変換する • Data “F”rame になってるようにチェック • 出力する • 行番号と列番号が付いていることが確認できる

Slide 68

Slide 68 text

Exercise (6-3): 行番号と列番号を名称変更する • 行番号を変更する • df1.columns で指定 • (データフレーム名).変更箇所 • 列番号を変更する • df1.index で指定 • (データフレーム名).変更箇所 • 出力して確認

Slide 69

Slide 69 text

Exercise (7): DataFrame 内の要素を指定する • 行と列の位置を指定して, 値を取り出す • 特定の列の値を取り出す • at を用いて, 単一要素を取り出す • 特定の行の値を取り出す

Slide 70

Slide 70 text

単回帰分析を廻してみる • Y=αX+β をベタに求めてみましょう • 決定係数や係数を求める • 使うデータ • 落合博満(ロッテ, 中日, 巨人, 日本ハム) の打率(X)と年俸(Y) • データソース • https://nipponbaseball.web.fc2.com/personal/batter/ochiai_hiromitsu.html

Slide 71

Slide 71 text

Excercize (8): 単回帰のために必要なライブラリを取り込み, データを入れ込む • matplot.lib.pyplot と scipy.stats をインポートする • avg 変数と salary 変数を作成する

Slide 72

Slide 72 text

Exercise (8-2): 単回帰分析を回す • avg とsalary をそれぞれ, Numpy x, yに変換する • 回帰分析を lingregress で実施する • 回帰分析の結果を出力する (p値的に, 打率は年俸を説明できていない可能性)

Slide 73

Slide 73 text

Exercise (8-3): 単回帰分析を回す • x,y の散布図と回帰曲線をプロットして表示する • どうやら、打率は年俸を説明出来ていない様子 • Self Exercise • 打率ではない、別の変数 (Ops やホームラン数) を引っ張ってきて, 同じように単回帰を廻してみましょう

Slide 74

Slide 74 text

Exercise (8-4); 単回帰を回す alternative バージョン • statsmodels.api モジュールを使う • add_constatnt によって定数項を追加する • Excel やStata で解析したのと似たような表が出力される

Slide 75

Slide 75 text

重回帰分析を行う • サンプルデータ • Scikit-learn の住宅価格データ • ボストンの506地区について, 犯罪率や固定資産税率, 教師あたりの生徒数などの属性値と, 住宅平均価格をテーブルに • 目的変数を target, 説明変数を boston に振り分ける

Slide 76

Slide 76 text

重回帰分析を行う CRIM 町ごとの人口一人あたりの犯罪率 AGE 1940年以前に建てられた、所有者が住む建物の割合 ZN 宅地の比率。25,000平方フィート以上のゾーンで数えた値 DIS ボストンの5つの雇用中心からの距離 INDUS 町ごとの非小売業の面積比 RAD 放射状幹線道路からの距離 CHAS チャールズ川に道がつながっているか TAX 固定資産税率 NOX NOx 濃度 PTRATIO 町ごとの教師あたりの生徒数 RM 住宅あたり部屋数 B 町ごとの黒人比率 LSTAT 低階層人口の比率 MEDV 所有者が住む住宅の価値の中央値

Slide 77

Slide 77 text

Exercise(9) 重回帰分析を行う • データセットをsklearn から取り込む • データを dset に放り込む • boston に説明変数を放り込む • target に被説明変数を放り込む • 結果をアウトプットする

Slide 78

Slide 78 text

Exercise(9-2) 重回帰分析を行う • 出力結果

Slide 79

Slide 79 text

Exercise(10): VIF 値を確認する • 多重共線性のチェック • statsmodels.stats.ou tliers_influence から variance_inflation_fa ctor を使って VIF(Variance Inflation Factor) をチェックする

Slide 80

Slide 80 text

レポートのお知らせ+ 成績評価の方法

Slide 81

Slide 81 text

次回の講義. データの可用性とプライバシー • インターネットには様々な情報が掲載されています。あるいは、大学の図書館からデータベースにアクセスすれば、様々な情報を得ることが出来ます(一橋大学の場合は特に！)。 • しかしながら、データには個人情報や企業の機密情報などが含まれており、これらの適切に管理し運用することは極めて重要です。テキストブックの内容に基づき、説明を行います。

Slide 82

Slide 82 text

来週火曜日の講義 • 最初にレポートを出します • レポートの評価方法は以下の通り • Excellent • データおよび適切な分析手法に基づき、独自の視点で十分に考察がなされている • Good • データおよび適切な分析手法に基づき、独自の視点で考察がなされている • Fair • データに対して分析が行われているが、一般的な範囲での考察にとどまる • Bad • 考察がなされていない，あるいはデータの解析が十分に行われていない • Failed • 断りなく他者の見解を引用している，その他不正行為に相当する

Slide 83

Slide 83 text

成績評価(1) • 平常レポート (40パーセント; 必須) • 講義計画に示したように、複数の回で学生にはレポートを課します。レポートは Word/PowerPoint形式のメールあるいは, github 経由での提出が求められます(どの方法を採用するかは、初回の講義で決定します)。 • レポートには、(A.) 利用したデータセットとその内容, (B.) 分析の問い, (C.) 分析手法, (D.) 分析結果を明記する必要があります。ページ数や文字数は問いませんが, これらの内容が含まれており, 講義中にアナウンスする評価手法を満たす場合, 高い得点を得ることが出来ます。 • 平常点 (10パーセント) • 本講義は実習が多く含まれており, また取り扱うデータセットや内容も多彩です。そのため、受講者同士が協力する必要があります。こうした受講者の態度を評価するために、平常点を設けます。

Slide 84

Slide 84 text

成績評価(2) • 最終レポート (40パーセント; 必須) • 講義の最終回では最終レポートの報告会を行います。受講者は3名から4名から構成されるグループで、最終レポートの報告を行う必要があります(人数は受講者の人数により変更される可能性があります)。最終レポートでは、プレゼンテーションの方法を学生は自由に選ぶことが出来ます。PowerPoint 以外にも、Prezi などのアクティブプレゼンテーションツールや、他のプレゼンテーション手法を用いることが出来ます(プレゼンテーションツールについては、必要であれば講義内で説明する機会を設けます)。最終レポートでは、以下の点について評価を行います。 (A.) グループ内の役割分担 (B.) データセットのユニークさおよび、それが適切に処理されているか (C.) 分析手法のユニークさおよび、それが適切に解析されているか (D.) プレゼンテーションのユニークさ (E.) 質疑応答にうまくリプライすることが出来ているか • 最終レポートの360°グループ評価 (10パーセント) • 3. の最終レポートについて、グループの自己評価および他のグループからの評価を行います。3. で挙げた評価ポイントに基づき、グループメンバーおよび他のグループは評価を行います。

Slide 85

Slide 85 text

References (for today’s lecture) • NumPyで逆行列を求めるlinalg.invの使い方 • https://deepage.net/features/numpy-inv.html

Slide 86

Slide 86 text

THANKS [email protected]