Slide 9
Slide 9 text
迷惑メールデータセット @UCI Machine Learning Repository
10
データセット: https://archive.ics.uci.edu/ml/datasets/spambase
4601通の英⽂メールに
関するデータセット
• ある単語がメールに占める割合
(例: business, free, address)
• email or spamの2値ラベル
• ある⽂字がメールに占める割合
(例: !, $, #)
• 連続した⼤⽂字の⻑さの平均値
• 連続した⼤⽂字の⻑さの最⼤値
• 連続した⼤⽂字の⻑さの総和