Slide 3
Slide 3 text
2
性能評価⽅法
● Kaggleの常設の⼊⾨コンテスト「Spaceship Titanic」のデータセットを使う
○ https://www.kaggle.com/competitions/spaceship-titanic
● Spaceship Titanicの主な特徴
○ チュートリアル問題として有名な「Titanic」の派⽣コンテスト
○ 本家「Titanic」よりデータ数が多いが,⽋損値も多い
● ⾃作RandomForestで学習して性能を評価する
○ ⾃作RandomForestの実装コード
■ https://github.com/kakky-hacker/algorithm_sandbox
○ ⽐較対象は,scikit-learnのRandomForestClassifier
■ https://github.com/scikit-learn/scikit-learn/tree/main