Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ACL読み会2024@名大:SCIMON : Scientific Inspiration M...

Ryuki Ida
September 29, 2024
38

ACL読み会2024@名大:SCIMON : Scientific Inspiration Machines Optimized for Novelty

Ryuki Ida

September 29, 2024
Tweet

Transcript

  1. /14 従来の文献に基づく仮説生成の課題 • 概念間のリンクの仮説に限定 → 仮説の表現力が制限される ➔ 背景テキストに基づき,アイデアを自然言語で出力する問題設定 • 新規性が高くなるような最適化には焦点を当てていない

    ➔ 十分に新規性が高いアイデアが得られるまで反復的に生成するモデル 2024/9/30 ACL2024読み会@名大 3 COVID-19 | Drug Repurposing | BenevolentAI Platform https://www.benevolent.com/about-us/sustainability/covid-19/ (Accessed: September 26, 2024)
  2. /14 過去文献から関連情報を検索 • 入力の関連情報を訓練データセットから3種類の方法で検索 2024/9/30 ACL2024読み会@名大 7 1. Semantic Neighbors

    • 似た問題に対するアイデアに 紐づくシード用語 2. KG Neighbors • 入力のシード用語と関係を持つ 他のシード用語 3. Citation Neighbors • 引用論文のタイトル “ The retrieval results are: i1, . . . , ik” 実際のプロンプト(関連情報に関する部分)
  3. /14 反復的なアイデアの生成 • 十分に新規性が高いアイデアが得られるまで反復的に生成 2024/9/30 ACL2024読み会@名大 8 “Your idea has

    similarities with existing research as demonstrated by these j sentences: Rˆ Make sure the idea you suggest is significantly different from the existing research mentioned in the above sentences. Let’s give it another try. " 実際のプロンプト(反復に関する部分) 1. 関連研究を検索(k近傍) 2. 埋め込みの類似度を計算 3. 類似度が高い研究と異なる アイデアとなるように指示
  4. /14 人手評価 • 評価基準: アイデアの有用性 (Helpfulness/Unhelpfulness) • 背景テキストとの関連性,新規性,明確性, アイデアの合理性を基に評価 •

    GPT4を利用する手法が高い性能 • KGにより,技術的詳細さと新規性が向上 • 実際の論文との比較 • 85%のケースで,実際の論文のアイデアが より高い技術レベルと新規性を持つ • 残り15%は正解のアブストが曖昧 2024/9/30 ACL2024読み会@名大 9 FS : Few-shot. CT : Citation Neighbors KG : KG Neighbors SN : Semantic Neighbors
  5. /14 エラー分析と課題 • 一般的な提案や文脈からの直接的な引用が多い • 単純な概念の組み合わせに偏る傾向 2024/9/30 ACL2024読み会@名大 12 シード語:

    音声単位境界; コンテキスト(抜粋): ... ストリーミング音声入力に対して部分的な文翻訳 を生成する.既存のアプローチは...音声の音響単位間の境界が均一でないため,音声の音響単位が 壊れてしまう. ... 音声単位境界を識別するための休止予測モデル... 音響的特徴と言語的特徴を活用して音声単位境界を動的に予測し,スムーズな遷移を確保する手 法... 既存の研究とは異なり,音響的特性と言語的コンテキストの両方を組み合わせている... 話者 の特性、話し方のスタイル、言語の違いに適応する。 適応的音声単位境界検出(ASUBD)と呼ばれる新しい方法...関連する音響的・言語的特徴に焦点 を当てる注意機構と、過去の決定に基づいて単位境界の最適な予測を行うようにシステムを導く 強化学習の組み合わせ... 効率的な単調分割モジュール ... 音響情報を段階的に蓄積し,適切な音声単位境界を検出する.
  6. /14 所感 • 重要な問題設定だと思うので,今後使われていきそう • 困難な問題設定なので,今後の発展に期待 (Fine-tuningなしで解けるような問題設定には思えない) • 評価が凄く難しそう •

    入力の背景テキストと比較して新規性があるかどうかは良いとして, 本当の意味で新規なアイデアなのかどうかを判断するには熟練した アノテータが必要 2024/9/30 ACL2024読み会@名大 14
  7. /14 補足資料|自動評価 • ROUGE-LとBERTScoreで評価 • T5ベースのモデルがGPTベースの モデルより高い性能 • 人手評価と逆の結果になる理由 •

    GPT4の出力がT5より長いため • “In this paper, we propose a new ... for ...”のようなテンプレートの使用 2024/9/30 ACL2024読み会@名大 16