Slide 14
Slide 14 text
14
©BrainPad Inc. Strictly Confidential
実験設定
データセットとモデルの評価
データセット
● 二値分類タスク
● 以下の設定でデータセットを作成
○ Scikit-learnのmake_classificationメソッドを用いた擬似データ
○ 4種類のseed値でデータセットを作成
○ 学習データ数:300,350,400,450,500
■ LLMに入力するデータ数が異なると生成される予測モデルも異なるため
○ テストデータ数:1000
モデルの評価
● 比較には主にROC-AUCを用いた