Upgrade to Pro — share decks privately, control downloads, hide ads and more …

良書紹介04_効果的な現実世界のデータ収集

Avatar for ぶんちん ぶんちん
September 04, 2025

 良書紹介04_効果的な現実世界のデータ収集

Avatar for ぶんちん

ぶんちん

September 04, 2025
Tweet

More Decks by ぶんちん

Other Decks in Science

Transcript

  1. 自己紹介 ぶんちん  データサイエンティスト集会の主催  複合経営が特徴の企業(製造業)に所属  データ分析担当者だったが。。。 e ラ

    ー ニ ン グ の イ ラ ス ト ( 男 性 ) 困 っ た 顔 で 働 く 会 社 員 の イ ラ ス ト ( 男 性 ) 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやってもらったら、 成果が増えるのでは? 特に非専門家向けの データサイエンス活用教育 2
  2. 現実世界のデータ取得の難しさ 全てのデータに明確な意図を持った設計が必要 ⇒ 逆に意図しないデータは取得できない  どのようなデータを取りたいのか  どのように測定するのか  どのような条件で記録するのか

     どのくらいの期間・量のデータを記録するのか 5 データ取得は高コスト(カネ・時間・手間) ⇒ 追加・変更が困難 なんとなくで条件を決めるのは不適切
  3. 目次 1. デザインはなぜ大切か 2. 仮説を明確にする 3. デザインの大枠を選ぶ 4. 個体間のばらつき、反復、サンプリング 5.

    偽反復 6. サンプルサイズ、検出力、効果的なデザイン 7. 最もシンプルな実験デザイン―1因子完全ランダム化デザイン 8. 複数の因子をもつ実験―複因子デザイン 9. 完全ランダム化を超えて―ブロックと共変数 10.被験体内デザイン 11.測定―良質なデータをとるために 8 ここにコンセプトが集約 コンセプト ⇒ 具体的対応
  4. 大学(アカデミック)の出版社だけど キレッキレな表現  1.2 貧弱なデザインの害悪  1.2 .1 時間と金の無駄遣い 

    劣悪な実験デザインで時とエネルギーを無駄遣いするのが愚 かであることは言うまでもない. 10 地に足の着いた話が多く、表現もわかりやすい ⇒基礎統計と並行して学ぶべき本では?