Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rで計量経済学#1 単回帰分析
Search
TomoyaOzawa-DA
August 15, 2020
Education
670
0
Share
Rで計量経済学#1 単回帰分析
所属している研究会で扱った資料になります。
内容について間違いがある可能性もありますので、その際にはご連絡ください。
TomoyaOzawa-DA
August 15, 2020
More Decks by TomoyaOzawa-DA
See All by TomoyaOzawa-DA
Rで計量経済学#0 事前準備
tom01
0
270
Rで計量経済学#2 重回帰分析
tom01
0
210
Rで計量経済学#3 重回帰分析とバイアス
tom01
0
380
Rで計量経済学#4 操作変数法
tom01
0
2.2k
Rで計量経済学#5 プロビット・ロジットモデル
tom01
0
570
Rで計量経済学#6 パネルデータ分析
tom01
0
6k
Other Decks in Education
See All in Education
地区危機管理委員会 出前セミナー「ロータリーにおける危機管理」:膳所 和彦 氏(国際ロータリー第2720地区 パストガバナー・日田ロータリークラブ・医療法人恒心会ぜぜ医院 理事長):2720 Japan O.K. ロータリーEクラブ2026年2月16日卓話
2720japanoke
1
620
P3NFEST 2026 Spring ハンズオン「ハッキング・ラブ!はじめてのハッキングをやってみよう」資料
nomizone
0
400
Google Antigravity エージェント・フ ァーストな開発パラダイムへの招待
mickey_kubo
1
120
SL AMIGOS 教育格差と私たちの取り組み - スリランカの支援学校への支援プロジェクト:リシンドゥ リオ 氏 (別府溝部学園短期大学 ビジネス観光コース 留学生):2720 Japan O.K. ロータリーEクラブ2026年4月6日卓話
2720japanoke
0
520
(2026) Quelle(s) mathématique(s) dans la "grande" culture?
mansuy
1
100
インシデント対応
akira345
0
390
Virtual and Augmented Reality - Lecture 8 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.1k
Investigating Changes in Self-Assessed Spoken English Proficiency in a Three-Week Study-Abroad Program
uranoken
0
110
ブランチ操作 / 02-a-branch
kaityo256
PRO
0
240
「機械学習と因果推論」入門① 因果効果とは
masakat0
0
850
Information Architectures - Lecture 2 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
1.9k
バージョン管理とは / 01-a-vcs
kaityo256
PRO
1
280
Featured
See All Featured
ラッコキーワード サービス紹介資料
rakko
1
2.9M
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
330
A Modern Web Designer's Workflow
chriscoyier
698
190k
Embracing the Ebb and Flow
colly
88
5k
Paper Plane (Part 1)
katiecoart
PRO
0
6.5k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
480
The Curse of the Amulet
leimatthew05
1
11k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
170
BBQ
matthewcrist
89
10k
Music & Morning Musume
bryan
47
7.1k
The untapped power of vector embeddings
frankvandijk
2
1.7k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Transcript
R Lecture #1 Tomoya Ozawa 実証分析⼊⾨ -とりあえずやってみる-
6⽉ 応⽤的な 分析 2 Overview 5⽉ 実証分析 ⼊⾨ 7⽉ パネル
データ分析 三⽥論で実証分析出来るようになりましょう! 3回のハンズオンと1回のグループワーク/⽉ で進める予定です.
02 とりあえず やってみる 3 Goal & Agenda 01 実証分析 とは?
03 理論的補⾜ 実証分析の全体像を掴んで,分析の⾯⽩さを感じましょう!
02 とりあえず やってみる 4 Goal & Agenda 01 実証分析 とは?
03 理論的補⾜ 実証分析の全体像を掴んで,分析の⾯⽩さを感じましょう!
5 実証分析とは, 01 実証分析とは? ※1: この理論では賃⾦の差は⼈的資本の差であるとしています.教育は⼈的資本への投資と捉えることが出来るみたいです. ※仮説は疑問形で書くと良いらしいです. データを⽤いて経済学的に根拠のある仮説を検証すること 仮説に対して統計学的視点から答える. 仮説の例:
⼈的資本理論1を根拠として,”教育年数が増えると,賃⾦は増加するのでは?” 新規参⼊阻⽌効果を根拠として,”競合ブランドの多い地域には,新規参⼊が起こりづらいのでは?”
6 分析の流れ 以下の流れに沿って,分析を⾏います. 何回か分析していく中で,この流れを掴んでいきましょう. 仮説⽴て データ収集 データ 加⼯&把握 計量経済学 モデル構築
推定 解釈 01 実証分析とは?
02 とりあえず やってみる 7 Goal & Agenda 01 実証分析 とは?
03 理論的補⾜ 実証分析の全体像を掴んで,分析の⾯⽩さを感じましょう!
8 今⽇のTry 先ほど紹介した⼈的資本理論をもとにこの仮説を考えました. これから3週間ほどは,この仮説を検証していきます. とりあえず⼿を動かして分析してみましょう. ”教育年数が増えると,賃⾦は増加するのでは?”という仮説を検証していきます! 02 とりあえずやってみる
9 どうやって検証するのか? 教育年数と賃⾦の関係を直線の式で表し, その直線の傾きが正であるかどうかをデータから検証する. 教育年数 賃⾦ 賃⾦ 教育年数 傾きが正 傾きが負
02 とりあえずやってみる
10 R studioの準備 新しいプロジェクトを⽴ち上げます.(プロジェクト名は“R Lecture”) “File” -> “New Project...” ->
“New Directory” -> ”New Project”で作れます! 仮説 ⽴て 収集 把握 モデル 推定 解釈
11 データの収集 female_labor.csvというデータを使⽤します. 先ほど作った“R Lecture”フォルダに保存してください. 仮説 ⽴て 収集 把握 モデル
推定 解釈 ▼データの詳細1 ▼こんなデータのはず ▼データの⾒⽅ ・4950時間働いている⼈は,年齢は35歳, 教育年数は12年で…
12 データの把握:データの読み込み データをR studioに⼊れましょう. R Scriptを開いて,以下のコードを書いてください! 仮説 ⽴て 収集 把握
モデル 推定 解釈 # 指定したcsvファイルを読み込んで,dfという名前をつける# df <- read.csv("female_labor.csv") # dfという名前のデータを表⽰する # View(df) ・他のコードの書き⽅として,以下のようなものがあります. この場合,データ名を書かずに直接ファイルをPC上から選ぶことが出来ます. df <- read.csv(file.choose())
13 データの把握:ヒストグラム作成 今回興味のある教育年数(education)と賃⾦(hourly_wage)に どのような値が⼊っているのかグラフを作って⾒てみましょう! 仮説 ⽴て 収集 把握 モデル 推定
解釈 # dfというデータの中のeducationという列に関して,ヒストグラムを作成する # hist(df$education) ・12年間の教育を受けている⼈がかなり多いことがわかります. ・賃⾦に関しても各⾃でヒストグラムを作成してみてください!
14 データの把握:2次元プロット X軸に教育年数(education),Y軸に賃⾦(hourly_wage)をプロットして, 両者の関係性を探ってみましょう! 仮説 ⽴て 収集 把握 モデル 推定
解釈 # x軸に教育年数,y軸に賃⾦をプロットする # plot(df$education, df$hourly_wage) ・教育年数が⻑い⼈の⽅が,賃⾦が⾼い傾向にありそうですね ・実証分析に⼊る前に,このようにデータの傾向を視覚的に把握しておく ことは⾮常に⼤事です. ・では計量経済学モデルを⽤いて,統計的に分析してみましょう!
15 計量経済学モデル構築:単回帰分析 単回帰モデル(≒直線の式)で考える.データから切⽚と傾きを推定する. 傾きが > であれば1,仮説が検証されたことになる. 賃金 = + ×教育年数
+ 仮説 ⽴て 収集 把握 モデル 推定 解釈 被説明変数 ⽬的変数 説明変数 従属変数 教育年数 賃⾦ 賃金 = + ×教育年数 ・賃金 : 番⽬の⼈の賃⾦ ・教育年数 : 番⽬の⼈の教育年数 ・:教育年数が1年増加した際の賃⾦の増加分を⽰す.限界効果という. ・ :回帰式から算出された予測値と実際の値との差分を⽰す.誤差項という. ※1: 厳密には統計的に有意である必要があります. これは次回に扱います.
16 推定:単回帰分析 Rで単回帰分析を実⾏してみましょう! 仮説 ⽴て 収集 把握 モデル 推定 解釈
## 計量経済学モデル構築 ## # 被説明変数を賃⾦,説明変数を教育年数として単回帰分析を実⾏して,その結果をoutという名 前の箱に格納 # out <- lm(df$hourly_wage ~ df$education) ・lmが回帰分析をしてもらうコードになります. ・今回は分析結果にoutという名前をつけていますが,なんでもOKです. ・ 別の書き⽅もあります. out <- lm(data = df, hourly_wage ~ education)
17 解釈:単回帰分析の結果の⾒⽅ 分析結果を確認してみましょう! 結果の詳細な⾒⽅(統計的有意,決定係数)は次回解説します. 仮説 ⽴て 収集 把握 モデル 推定
解釈 # 分析結果を出す # summary(out) 推定値 統計的有意性(P値) 決定係数 ◦この結果を数式で表すと… 賃金 = −. + . ×教育年数 1年教育年数が増えると, 0.45264ドル賃⾦が上昇すると解釈出来ます ⇨ > より仮説は検証された! ◦教育年数が12年の⼈の賃⾦は 賃金 = −. + . × つまり,2.24474ドルと予測されます
18 解釈:分析結果をプロットしてみる 推定した回帰式を可視化してみましょう! 仮説 ⽴て 収集 把握 モデル 推定 解釈
# x軸に教育年数,y軸に賃⾦をプロットする # plot(df$education, df$hourly_wage) # 回帰分析結果を追加でプロットする.col = で⾊の指定をしています.# abline(out, col = "blue") 確かに, 右肩あがりの直線であることがわかります.
02 とりあえず やってみる 19 Goal & Agenda 01 実証分析 とは?
03 理論的補⾜ 実証分析の全体像を掴んで,分析の⾯⽩さを感じましょう!
20 どうやってとは推定されているのか? 誤差 ( ) の⼆乗和1が最⼩となるようなとを計算しています(最⼩⼆乗法) 最⼩⼆乗法によって推定された値 (と) を最⼩⼆乗推定量といいます. 3
賃金 = 4 + 5 ×教育年数 03 理論的補⾜ 賃金 = + ×教育年数 + 教育年数 賃⾦ 表記⽅法を抑えておきましょう! ・賃金 :番⽬のデータ ・ $ 賃金 :予測値(今回だと最⼩⼆乗法で計算された値) ・賃金 :データの平均値 6 ↔ = 賃金 − − ×教育年数 ※1: 誤差にはプラス・マイナス共にあるので,2乗和を使⽤しています. ※2: 実測値とはデータ上の値のことです. 誤差 賃金の予測値 実測値2
21 どうやってとは推定されているのか? 以下の過程をPCが⾃動でやってくれています.(PCは計算機なんです) 03 理論的補⾜ 今回の場合,誤差は以下のように表されます. = 賃金 − −
×教育年数 誤差の2乗和は…(データの個数が個あるとすると) 9 " = 9 " (賃金 − − ×教育年数 ) 誤差の2乗和を最⼩にすると を求めるために, それぞれについて微分をした2式を連⽴⽅程式として解きます. 9 " = 9 " (賃金 − − ×教育年数 ) = 9 " = 9 " (賃金 − − ×教育年数 ) = ※1: この2式を正規⽅程式と⾔います.
22 注意:相関と因果 相関関係とは⽚⽅の変数が変化すれば,もう⽚⽅の変数も変化する傾向にあること. 因果関係は2つの変数の間に原因と結果の関係があること. 因果関係を⽰すのは⼤変です. データを分析していく上で相関と因果をしっかり区別しましょう. 今回の分析結果も因果関係があるかどうかはまた別の話です. 03 理論的補⾜
23 おまけ:相関があっても因果関係は… 03 理論的補⾜ ※https://www.tylervigen.com/spurious-correlations
24 参考書:相関と因果 「原因と結果」の経済学 オススメの本です.因果関係を測定する⽅法が載っています(因果推論). データ分析の⼒ 因果関係に迫る思考法 03 理論的補⾜ 効果検証⼊⾨