Slide 3
Slide 3 text
紹介する論文
● Why do tree-based models still outperform deep learning on tabular
data?
○ 日本語タイトル「表形式データにおいて、ツリーベースモデルが依然としてディープラーニングを上
回るのはなぜか?」
○ Grinsztajn, Léo, Edouard Oyallon, and Gaël Varoquaux. "Why do tree-based models still
outperform deep learning on tabular data?." arXiv preprint arXiv:2207.08815 (2022).
○ https://arxiv.org/abs/2207.08815
● 論文の内容を抜粋して紹介 (詳しい内容を知りたい方は元論文を参照)
● サマリー
○ 表形式データに対するベンチマークを提供 (対象データで、Tree-basedモデル > NN)
○ 中規模データセットにおいて , Tree-based がNN を上回る原因は3つ
■ NNは過度に滑らかな解に偏ってしまうから
■ NNは情報を持たない変数に弱いから
■ 表形式データは回転不変性を持たないから