Upgrade to Pro — share decks privately, control downloads, hide ads and more …

research_students.pdf

Yuichi Sei
June 12, 2024
84

 research_students.pdf

Yuichi Sei

June 12, 2024
Tweet

Transcript

  1. IoT機器の測定誤差を考慮した効果 的なプライバシ保護 ◼ 背景  機械学習モデルの構築や統計に不可欠であるビッグデータの利用増  プライバシ保護手法が不可欠  差分プライバシ

    ⚫ Google, Apple, Microsoft等が活用している強力なプライバシ保護技術 ⚫ 真値にノイズ(誤差)加えるのが基本手法 ◼ 既存手法の課題  既に観測値には測定誤差が含まれているが、 それを無視して、プライバシ保護のためのノイズを付与 ◼ 提案手法  真値は不明だが測定誤差の分布が分かっている場合、 その情報を用いてプライバシ保護のノイズを減らす ◼ 評価結果  ノイズを平均40%程度削減
  2. 研究事例(マルチモーダル) 人体キーポイントを用いて映像に整合する楽器音を 生成するモデルの提案 ◼ 楽器演奏映像の視覚情報のみから,どんな音を演奏しているか予測 生成 提案モデルは,メルスペクトログラムに現れる 楽器の音色の特徴を学習できていた 人体キーポイントを使わない既存手法と比較すると・・・ ◼

    映像中の複雑な動きを捉えるために人体キーポイントを用いた ➢4尺度による客観評価では3尺度で勝り,本物の楽器音との類似度の面で優れていた ➢アンケートによる主観評価では,類似度や音質,全体的な好みの項目で優れていた キーポイント特徴の導入 人間の身体の部位や関節の 位置を示した特徴点
  3. 研究事例(知識表現) グラフニューラルネットワーク(GNN)を用いたコンテンツ推 薦における知識表現の検討 ◼ どのような知識表現がコンテンツ推薦に肯定的な影響を与えるか ◼ メタデータ及びテキストに基づくナレッジグラフについて検討 例)「もののけ姫」周辺のナレッジグラフ (Princess_Mononoke, director,

    Hayao_Miyazaki) (Princess_Mononoke, composer, Joe_Hisaishi) (Hayao_Miyazaki, represented_by, Studio_Ghibli) 作品に関する知識を 「主語・述語・目的語」から 構成されるトリプルとして表現 GNNによる推薦にどのような 作品知識が寄与しているか分析
  4. 研究事例(深層学習) バドミントンの試合データを用いたショットの成功確率予測 • 目的 ◦ ショットの成功と失敗の確率を予測する ◦ 選手の弱点を分析し戦術の決定や選手への指導に活用する • 手法

    ◦ ショットの種類や位置, プレイヤの情報などを含むショットのシーケンスデータを基に, 次のショットの成功と失敗の確率及び位置を予測するLSTMベースのモデルを開発 • 結果 ◦ 従来モデルを用いたシステムと比較して高い精度での失敗ショット予測が可能 ◦ 提案モデルによるショットの予測結果を可視化
  5. 研究事例(エージェント技術) ユーザが行うと予測されるレビュー文付き 化粧品提示手法の提案 ◼ ユーザがその商品を購入した際に行うと予測されるレビュー文を生成する レビュー文生成は以下の3つの情報を与えて行う ① そのユーザがその商品に対して与えると予測される特徴項目ごとの評価 ② そのユーザが他の商品に対して実際に行ったレビュー:ユーザらしさの再現

    ③ 他のユーザがその商品に対して実際に行ったレビュー:商品の特徴の再現 + → あなた ★★★★☆ 全体的にめちゃくちゃよかった! まつ⽑がすごくよく伸びてしっか りしたと思った!でも、値段が少し ⾼いのと、塗りにくくて液がついた 場所が荒れた感じがするのが気に なった。そこが改善したら⽂句なし かな あなた ★★☆☆☆ ⾊素沈着とか刺激はないのは満⾜ なんだけど私はいまいち効果を感 じず…あとちょっと匂いが気にな る。安いけど、もう買わないかなと 思った。 + ◼ 生成したレビュー文において商品の特徴やユーザらしさの一部の再現は可能  より自然でユーザらしい文章の生成や、情報の正確性が今後の課題 生成 ① ② ③ 予測されるレビュー文
  6. 研究事例 (人間らしいAI) マルチプレイヤRPGにおいて 人間らしいプレイスタイルをとるゲームAIの提案 ◼ シングルプレイでもマルチプレイヤRPGで人間らしい プレイスタイルでゲームを楽しめるような行動をAIにさせたい  プレイスタイル:=行動選択順序と定義 

    AIにはプレイスタイルを読み取らせるために ゲーム状態+行動選択順序を入力として与えることで行動 順序を把握した行動選択をさせる  識別器とエージェントは敵対的な関係で同時に学習を行う ⚫ 識別器: 人間によるエキスパートデータの判別を行う ⚫ エージェント: 識別器が生成データをエキスパートデータと 誤判定させるように学習を行う ◼ 人間らしさの評価 人間らしいプレイスタイルの例 (キャラクタAにバフをかけて敵にはデバフをかけ効 率的にダメージを与えようとするプレイスタイル)  人間プレイヤとAIとの共闘でプレイスタイル が人間らしいかを評価 提案手法が最も人間らしいプレイスタイルを実現できるという結果を得た  時系列クラスタリングによる模倣精度の評価 手法/シチュエーション 1 2 3 Behavior Cloning (BC) 0.271 0.767 0.995 提案手法 0.126 0.469 0.885 提案手法2 (BC+提案手法) 0.328 0.812 0.993
  7. 研究事例(SNS分析) 意外性のある意見がもたらす エコーチェンバー現象の分析 自身の思想に依らず興味関心を呼び起こす意見に没頭し、そ の考えのみが返ってくることにより、 意見が変化する可能性のある状況 提案のエコーチェンバー現象の検出手順 2. 意見が強化された時点と変化した時点の特定 3.

    特異性、与える感情、エコーチェンバースコアの算出 4. 提案のエコーチェンバー現象の検出 1. YouTubeからデータ収集・前処理 提案するエコーチェンバー現象 結論 • エコーチェンバー現象は強化される時だけでなく、変化 する時にも発生 →特に、意外性のあるコンテンツによって意見 が変化する 今後の展望 • YouTube以外のSNSの投稿を用いた、エ コーチェンバー現象の定義検証 • エコーチェンバー現象の定義に当てはまる社 会問題の分析 自身と似た考えを目にすることで その意見に没頭し、考えが強化される 従来の定義でのエコーチェンバー現象 動画コンテンツが与える感情の違い 意見が変化する時は強化される時に比べて、 「驚き」の感情を与える動画コンテンツが多い 図1:意見強化時と変化時の感情分布の差分 意見強化時と変化時 の感情比率の差 感情 エコーチェンバースコアの分布の違い エコーチェンバーの発生規模に関係なく、 意見が変化する事例が強化された時よりも高い頻度で発生する 図2:意見強化時の分布と意見変化時の分布の差分 分布の差 エコーチェンバースコアの分布 結果 特異性分布の違い 意見が変化する時は強化される時に比べて、 目新しい動画コンテンツであることが多い
  8. 入力 研究事例(マルチモーダル画像生成) 擬人化タスクにおけるカラーパレットを用いた条件付き画 像生成手法の挙動分析 ▪ 目標:ネコから2Dキャラクターの生成 ▪ マルチモーダル: ◼ テキストプロンプトー>拡散モデル(Stable

    Diffusion)条件画像ー>外付けネットワ ーク(特徴作成&特徴適用 ◼ プロセスに改良を施したT2I-Adapter) Stable Diffusion 出力 テキスト エンコーダー 1 girl, cat ears … 畳み込みニュ ーラルネットワー ク 画像 エンコーダー 改良した T2I-Adapter
  9. ◼ 提案手法 マスク領域の推定をモデルに行わせることでマスク入力をせずにスケッチで画像編集 研究事例(深層学習) スケッチによるマスク不要の表情差分生成手法の提案 ◼ 結果 □客観的・主観的に評価を行った結果 提案手法のスコアが既存手法のスコア を上回る結果になった

    ◼ 目的  スケッチでイラストを編集することで表情差分を簡単に作成したい 表情差分・・・顔のパーツの組み合わせで様々な表情を表現するイラスト群  スケッチによる編集にはマスク画像を作成しなければならないため大変である マスク画像・・・画像のうちどこを編集するかを白黒で表現した画像
  10.  視聴者数予測  要因分析 研究事例(深層学習) ライブ配信サイトTwitchにおける 人気配信者の要因の分析 ◼ 背景・目的 

    ゲームのライブ配信の人気が急上昇  Twitchにおける配信ごとの視聴者数を用 いて, どのような配信者・ゲームが人気を 獲得しているのか要因を分析 まずまず優れた 予測精度 ◼ 提案手法  Twitch APIとIGDB APIからデータを収集  視聴者数の予測モデルの作成  説明可能なAI手法(SHAP)を用いた要因 分析 ◼ 結果 配信タグが1, 2個でかつ, 「ミステリー」 のテーマを持つゲームを配信すると より視聴者数が増える傾向がある
  11. 研究事例(深層学習) ポジティブな単語を含んだ煽り・誹謗中傷 目的のコメント検出方法の提案 モデル Accuracy Precision Recall F1 既存手法 0.972

    0.816 0.635 0.714 提案手法 0.976 0.818 0.714 0.763 ◼ 煽り・誹謗中傷を目的としたコメントの中でも特に検出が 難しいとされるポジティブな単語を含んだコメントに着目 ▪ 提案手法 既存手法ではRecallの値が不十分であったためこの課題を 解決する為に感情分析の結果の違いやパターンマッチングを 利用した手法を新たに導入 ▪ 結果 ・Precisionの値を維持したままRecallの値が向上した ・4つ全ての評価指標において既存手法を上回った Recallの値が 大きく向上 既存手法で検出対象ではないと 予測されたコメントに着目 「これで笑える人は逆にすごいよw」 既存モデル ファインチューニングを 行ったモデル ポジティブ ネガティブ 感情分析 感情分析 文中 文末 逆に w むしろ 笑 方が ?
  12. 実験結果 ◼ 追加学習によって インターネットスラングに対する単語ベクトルが変化 ◼ 感情分析タスクでは提案手法により、 精度(Accuracy)およびマクロF1スコアが向上 → 追加学習によって インターネットスラングに対するベクトルが

    意味のある単語ベクトルとなり、 より正確なラベル推定ができるようになった 研究事例(感情分析) インターネットスラングを考慮した大規模言語モデルを用いた 感情分析手法の提案 ネット上のテキストに対する感情分析 ◼ インターネットスラング等の特殊な表現が 感情分析に影響を及ぼす → ネットスラングを考慮した感情分析モデルを作成する 提案手法 ◼ 「ユーザ辞書の追加」と「追加学習」を追加 「イヤンホホ(イヤホンのネットスラング)」に対する類義語
  13. 研究事例(深層学習) 深層強化学習を用いた 文章の言い換えによる駄洒落生成モデル ◼ 入力文と意味の近い駄洒落の自動生成を試みる ▪ 新たに CNN で構築した駄洒落らしさのスコアと 文章の意味を表したベクトルのコサイン類似度の和を

    報酬として言語モデル GPT-2 を強化学習で fine-tuning ▪ 僅かながらも駄洒落らしい表現を生成することが可能に 明日は雪が降るでしょう 明日はスノーですの GPT-2 価値関数 改善 言語ヘッ ド 入力文 生成文 入力文 入力文 次単語 報酬関数 PPO 駄洒落ならば斜線が現れる → CNN で駄洒落らしさ計算 「今日はいい天気だ」 「布団が吹っ飛んだ」 強化学習アルゴリズム PPO (Proximal Policy Optimization) で 言語モデル (GPT-2) が駄洒落らしい表現を生成できるように fine-tuning
  14. 研究事例(データマイニング) Twitterにおけるアイコン画像と攻撃ツイートの関連性 ▪ 手法 twitterAPIにてツイートを収集 →日本語用Sentence-BERTでクエリである“誹謗中傷”とツイートの 距離を算出→アイコンごとに平均を比較 ▪ 背景 「〇〇アイコンはやばい」といったTwitterアイコンに関する根拠の

    ないうわさを複数確認 ↓ 実際に調査 ユーザの効率的な収集方法や少数のツイート とアイコンを利用したシステムの作成が課題 ▪ 結果 システムの出力と実際の攻撃性の差が0.01未満であったも のは全体の約8%と低かった ▪ 実験 入力した画像をCLIPで分類 ↓ カテゴリと一致する割合とそのカテゴリの1ツイートあたり のクエリとの距離の平均を掛け合わせる→一致する割合の合 計が0.99を超えるまで ↓ 残りを最も一致する項目で補う ▪ 結果 人、イラストアイコン→攻撃性が高い アイコンをセクシーな女性にし特定のサイトへ誘導しようとし る、絵を描くユーザが多く自分の描いた絵を自虐、または無 断転載などへの怒りのツイート 電車アイコン→攻撃性が低い 貴文
  15. 研究事例(SNS分析) Twitter上の真偽不確かな投稿の判別 ▪ GCN を用いた分類モデルの構築 - ツイートとリプライをグラフ化し、判別を実行 - ツイートが「誤り」か否かの2値分類と、 ツイートが「正しい」・「誤り」・「あいまい」かの3値分類を実行

    ⇒ 2値分類・3値分類共に、6割強の精度となった ▪ 疑似グラフデータ作成によるデータ拡張 - 投稿に対するリプライの肯定・擁護/否定・反論に 着目しリプライ以下のグラフから疑似グラフデータを作成 ⇒ 投稿早期の判別に、特に有効であることが分かった * ▪ 背景・目標 - 真偽不確かな情報は「うわさ」や「デマ」と呼ばれる - 煽動や炎上 だけでなく人命を害することも ⇒ 自動で正確かつ早期に真偽不確かな投稿の種類を判別したい! * Graph Convolutional Network 投稿早期における2値分類(左)と3値分類 (右)の 拡張前後の結果比較グラフ
  16. 研究事例(深層強化学習) 深層強化学習による NetHack に関する研究 ▪ The NetHack Learning Environment (NLE)

    NetHack を基に構成された強化学習研究用の Gym 環境 ベースラインモデルの結果を提示し,初期タスクを提供 ▪ NetHack ダンジョンを探索し,アイテムを拾ったり敵を倒したりしながらダン ジョンを下るゲームであり,難易度の高いゲームである.複数回同 じ状況に遭遇する可能性が低いなど,強化学習において難しい ゲームである. 確率的な環境に対応した提案手法 2 の方が優れた結 果 学習の効率化や独自報酬の見直しが課題 ▪ 提案手法 提案手法 1 MuZero を基にした 確率的な環境に対応しない 提案手法 2 Stochastic MuZero を基にした 確率的な環境に対応する 独自報酬を追加した ▪ 結果 4000エピソードの学習後,100エピソードの評価を実行 評価の結果 ▪ 目的 NetHack を攻略できるようなエージェントを開発する ▪ MuZero Atari 2600 ゲームで最先端の性能を発揮した深層強化学習AI ▪ 報酬 提案手法2ではNLEの報酬に 独自の報酬を追加 例: ダンジョンを下りる と大きな報酬 エージェントのレベ ルが上がると正の報酬
  17. 研究事例(深層強化学習) 歩行者の交通流を加味した 深層強化学習による信号制御手法の提案 ◼ 既存の交通制御研究  強化学習による信号制への期待  歩行者の利得を軽視 ◼

    歩行者を重視した信号制御  環境内の歩行者を明確化した状態表現  横断歩道を考慮した右左折車の情報の活用  歩行者数に変化に応じた報酬関数の変更 道路状況に応じて 信号パターンを決定 歩行者の交通流を考慮して学習した 信号機(PTS1)による待機時間の削減 信号エージェント 車両1台あたりの待機時間 歩行者1人当たりの待機時間 DTS : 歩行者の交通流を考慮せずに学習させた信号機 FTS : 定周期式の安定した信号機
  18. 研究事例(深層学習技術) セマンティックセグメンテーションを利用したGAN Inversionによる 背景画像の編集手法の提案 ◼ GAN Inversion:入力画像を再現できる潜在変数 -> 画像編集 ◼

    GAN Inversion + セマンティックセグメンテーションでコンテントと スタイルを分離した柔軟な編集. セマンティック セグメンテーションで コンテントを指定 潜在変数で スタイルを指定 コンテント編集 スタイル編集 1枚の画像から多様な編集ができる 提案モデ ル コンテント:画像内で表現されている物体の形状や構造 スタイル:鉛筆画やアニメ風など絵柄や画風 参照画像 参照画像
  19. D C B E F A D C B E

    F A D C B E F A ◼ ソーシャルネットワークデータのプライバシ保護  ソーシャルネットワークデータを匿名化*することでプライバシを保護する  グラフ変更アプローチによる匿名化によってデータの安全性と有用性を高める  リンク予測を用いる場合を想定した匿名性指標による匿名化 ◼ 匿名化における課題  次数といった構造情報から個人の識別が可能 研究事例(プライバシ保護技術) ソーシャルネットワークデータのプライバシ保護 *匿名化: 個人を特定可能な情報を削除または変更し、個人の識別を防ぐこと ◼ ソーシャルネットワークデータ  ノードの集合V、エッジの集合Eからなるグラフとして表現することが可能  ユーザをノード、関係性をエッジ、友人の数を次数として示すことができる ◼ 要求される安全性を満たしつつ、 ◼ 有用性の高いデータの生成 非公開ユーザ(鍵垢) k=10 k=20 k=30 k=40 k=50 既存手法 0.933 0.856 0.786 0.728 0.677 リンク予測+既存手法 0.935 0.857 0.786 0.731 0.676 リンク予測+提案手法 0.94 1 0.86 9 0.80 8 0.75 3 0.70 6 データの有用性 低下 オリジナルのデータと匿名加工後のデータとの一致率 ◼ 既存手法における課題  非公開アカウントの存在によるエッジの欠損 3 2 2 1 1 1 欠損データ リンク予測後のデータ 匿名加工データ 2 3 3 2 1 1 3 3 3 2 2 1 リンク予測 匿名化
  20. ・危険度が平均20%減 → ポジショニング改善 ・DFが一直線上にそろう(黄) → 守りやすくなる ・ボールへのアプローチ(橙) → 攻めづらくなる *青:守備選手

    赤:攻撃選手 黄:ボール 赤いエリアほど危険度が高い 研究事例(機械学習) サッカーのポジショニング改善 ◼ DFのポジショニングを改善するモデル  「どこにいればよかったか」がわかる  遺伝的アルゴリズムを利用  ポジショニングの危険度を 評価するモデルを作成・使用(下図)  守備チーム11人の動きを同時に学習  選手の連動も反映した出力結果(右図) 元の局面 出力結果 𝐏𝐢𝐭𝐜𝐡 𝐂𝐨𝐧𝐭𝐫𝐨𝐥 × 𝐱𝐆 + 𝐒𝐱𝐀 × 𝜶 第1項:ボールを保有できる確率 第2項:プレーがゴールにつながる確率 必要な情報を細分化することで表現の質が向上
  21. 研究事例(画像生成) 音声入力による顔画像生成 ◼ Variational Autoencoder(VAE)と音声エンコーダを組み合わせて入力音声に対 応する話者の顔画像を生成  音声のみから話者の属性(性別、人種、年齢など)と表情を反映した顔画像の生成  感情ラベルを付与することで感情を反映した表情を生成

    上段 : 入力音声を発話している際 の実際の話者の顔画像。画 像の生成には不使用。 下段 : 入力音声のみから提案モデ ルによって生成された顔画像 部:提案モデル 学習フェーズ 利用フェーズ
  22. 研究事例(深層学習) モバイルUIの視覚的重要性予測 ▪ モバイルUIの視覚的重要性マップを予測するモデル  セグメンテーションと画像の特徴をバランスよく組み合わせることで性能が向上 デザイナへの リアルタイムフィードバック 🞐 アイトラッキングよりもコストが低く,

    短時間で結果がわかる 🞐 視覚的重要性によって デザインを定量的に評価できる 🞐 画面を見たときのユーザの感覚を 考慮してデザインを作成できる ▪ 本研究のフィードバックシステムは UIデザイン経験者から高評価を得た UIデザインの配色最適化 🞐 大切な要素の重要性を高めるように 配色を最適化できる ▪ 「重要性」と「読みやすさ」, 「色の調和」を両立させた最適化
  23. 研究事例(画像認識) 深層学習を用いたスポーツ画像学習モデルによるスポー ツ ピクトグラムの認識手法の提案 ▪ ファインチューニング ImageNetというデータセット内の様々な画像で学習済みのモ デルの情報を利用することで、ピクトグラム認識をしやすくす るファインチューニングという手法をとる. ▪

    目的 本研究では、ピクトグラムデザインのみが与えられた際に、 ファインチューニングを適切に活用することで、そのピクトグラ ムが何を表しているのかを正しく認識することを目的とする. どちらの評価指標においても、提案手法での 数値のほうが上回る結果となった ネファインチューニングすることで姿勢の特徴を 正しく利用することで姿勢の似ているピクトグラム についての認識精度を上げることに成功 ▪ 提案手法 競技を区別できる大きな特徴である、スポーツを行う際の 姿勢がピクトグラムのデザインとして採用される傾向がある、 ということに本研究では着目した. ▪ 評価:accuracy ピクトグラムのみで学習したモデルと、提案手法のモデルの 2つのモデルに対して画像認識を行い、ピクトグラム認識の 精度にどれほどの違いが見られるのかを実験した. 以下の表に、評価指標であるaccurayとf1-scoreの平均の 実験結果を示す.
  24. 研究事例(ソフトウェア工学) アジャイル開発プロジェクトにおける新人育成をサポートするタスク推薦システムの提案 ▪ アジャイル開発 → 要件定義からリリースまでの開発工程を 短いスパン(スプリント)で繰り返す開発 手法 ▪ トピックモデル

    → 文書の集まりの中の抽象的な「トピッ ク」を発見する自然言語処理法 →文書間の類似度を測定可能 ▪ 提案手法 トピックモデルを用いて、新人のプロフィー ルとアジャイル開発のタスクの類似度を測 定し、類似度の高い順に推薦 システムの内容 ▪ 結果 3位以内推薦率は0.803、1位推薦率は0.409 ・メンターが上位3つから新人に推薦する タスクを選ぶことで効率の良い新人育成へ ▪ メンタリング → 良く用いられる新人育成モデルの1つ → 新人と経験豊富な人(メンター)を繋ぐ ▪ 本研究の特徴 上流から下流まで幅広いタスクデータを データセットとしることで、アジャイル開 発に対応
  25. ▪ 新規性の高い生成ステージを学習データに追加しつつGANを学習 ・GAN : 複数のネットワークの敵対的学習による深層生成モデル 研究事例(ゲームステージ生成) 少数データからの多様なステージ生成 ▪ 機械学習によるゲームのステージ生成 ・機械学習によりサンプルに基づいてゲームのステージを生成

    ・ゲームのコンテンツにおいて学習に十分なサンプルの用意は高コスト ・少数のサンプルからの学習では多様なコンテンツの生成ができない 従来の手法よりも多様なステージを生成 提案手法概要 ステージ生成イメージ 提案手法 少数のサンプル 多様なステージ 平均ハミング 距離 ↑ 重複率(%) ↓ 従来手法 26.3 23.1 提案手法 35.1 0.0 Zelda環境における定量評価
  26. 研究事例(深層学習) StyleMapを用いた事前学習済みStyleGANによる画像編集 ◼ GAN Inversion  入力画像を再現する潜在変数を推定  潜在変数の編集による画像編集 ◼

    提案手法  潜在変数を空間方向に拡張 & 正則化 →再構成品質と編集品質を両立 ◼ 高品質な再構成と編集が可能に 入力画像 Old編集 再構成 Smile編集 Toon編集 ◼ 定量評価  再構成品質、編集品質ともに ベースライン(pSp)から向上
  27. 研究事例(画像認識) サッカーにおけるフィールドの位置推定モデルの提案 ◼ 画像におけるフィールドの位置推定が実現することで, フィールドの位置から得られる情報を自動的にビデオ フレームに描くことが可能になる ◼ 既存研究の課題及び新規性  他のスポーツに比べて精度が劣っている

    ➡画像中の人を消す処理を行う  様々なサイズのフィールドには対応していない ➡ネットワークの学習時に, 出力値と確率を 考慮してフィールドテンプレートの選択を行う  様々な画角から撮られた画像に対して位置推 定を行っていない ➡様々な画角・フィールドサイズで撮られた 画像におけるピッチラインの座標からデータ セットを作成して学習を行う ◼ 画像中の人を消す処理及びフィールドテンプレートの選択それぞれを行った・行わなかっ た場合の4ケースを比較したところ, フィールドテンプレートの選択及び人を消す処理を 行った場合が最も精度が高くなった 画像中の人を消している様子 作成したデータセットにおいてテンプレート が正しく変換できている例とできていない例
  28. 研究事例(データ分析) MLB試合データを用いた失点予測と継投計画の 最適化 ▪ 目的 監督の経験や勘による投手交代は非常に曖昧で、正しい判断であるかは結果からでしかわからない. 機械学習による アプローチによって、投手交代支援を行うシステム構築を行う. ▪ 提案手法

    MLBの1球ごとの投球データに対し、前処理を行なった上で5値分類と2値分類の組み合わせモデルを適用した 失点予測. 学習済みの失点予測モデルに対し、失点0に抑えてくれる確率の最も高い投手への交代を支援するシステムの構築. ▪ 結果 失点予測モデルは前処理をする前の精度と比べ、4%向上. システムでは投手交代をしたいタイミングで誰がどこに何の球種を投げるべきかを提案. 今後は精度改善のためのデータ収集と後の打者を考慮した投手交代支援を行なっていく. ベースライン / 前処理済み5値分類 / 前処理済み組み合わせモデル 4%の精度改善 失点予測モデル
  29. 研究事例(AIと人との協力) 深層強化学習による 人間補助を行う格闘ゲームAIの作成 ◼ 格闘ゲームが苦手な人をより楽しませるようAIが協力するシステムを作成  格闘ゲームに 危険予測AI と 防御AI

    の2つのAI(サポートAI)を導入  プレイヤーに自由度を持たせるために, AIには防御に着目させてHybrid Reward Architecture(HRA) によるDeep Q Networkアルゴリズムで深層強化学習を行わせる.  対戦ゲームが苦手な人にゲームを楽しんでもらうために, 手加減をしてくれるAIを用いる研究があるが, AIが 不自然な動きをする, 対戦相手の固定化, 急な強さの変化などの問題で満足できない可能性がある. ◼ 結果  AIの学習時の対戦相手に対してHPとスコア がそれぞれ6.5%, 6.4%の増加が見られた.  アンケートによる5段階評価では,サポート度合, 楽しさ,手加減AIとの比較で平均点,中央値が 3点以上と好印象  大学生の被験者15人にサポートAIを使って格闘ゲームをしてもらった  アンケートによる5段階評価では,サポート度合, サポートの非邪魔度合, 楽しさ, 手加減AIとの比較について尋ねた  しかし, サポートの非邪魔度合では, 平均点が 3点を下回ってしまい, 操作感による課題が判 明した. 行動𝒂𝒕 入力 状況𝑺𝒕 危険予測AI (HRA) 危険! 防御AI (HRA) プレイヤー 𝒔𝒕 割り込み 状況𝑺𝒕+𝟏 サポートAI 𝒔𝒕 + 𝒂𝒕
  30. 研究事例 映画における重要シーン検出 ◼ 感情分析によるポジティブ感情値を用いた重要シー ン検出の提案 ❑ 予告作成時間短縮のための、ダイジェスト自動生成を目的とする ❑ リアルタイムの感情が反映されやすいTwitterを利用し、Google Natural

    Language APIを用いて感情を推定 ❑ テレビで放映された映画6作品を対象とする ◼ ライブ配信のダイジェスト自動生 成にも応用が検討できる ◼ 感情に着目したことで、ツイート 数に着目した時とは違う特徴を持 ったシーンが検出できる
  31. 機械学習を用いた 経営コンサルタントへの問合せデータの分析 ◼ 【課題】 コールセンターの担当者が相談内容の分類をまちがえる ◼ 相談内容を自動的に経営資源に分類し、 正しいコンサルタントに渡したい ◼ 本研究では経営コンサルタントへの問合せデータ

    に対して, ◼ 自然言語処理のための新たなディープラーニングのモデルである BERT を用いて 分類を行う手 法を提案 ◼ 【評価方法】 ◼ 実際にコールセンタで分類を担当している社員に評価 理由)人 間の感覚とどれだけ差異があるのか ◼ 【結果】 ◼ ほとんどの相談においてモデルを利用して ◼ 分類した結果と人間の感覚とのずれはなかった
  32. 研究事例(深層学習) 遮蔽の影を考慮した自動着色システムの提案 ◼ 線画画像から落ち影の入った背景画像の着 色  2段階のGANネットワーク構成  STAGE2で光源ベクトルや物体のマスク画像 で影の精度を向上

     SPADEを用いたU-net構造  2通りの方法でデータセットを水増しを して実験 ◼ FIDスコアと影の方向の精度による評価 ◼ 比較的高い評価が得られた 手法 水増し方法A 水増し方法B 提案手法 64.34 65.73 Pix2pix 70.25 119.92 Pix2pixHD 65.81 65.45 SPADE 66.23 66.90 手法 水増し方法A 水増し方法B 提案手法 98.85 % 90.70 % Pix2pix 98.68 % 71.25 % Pix2pixHD 98.28 % 87.13 % SPADE 98.72 % 76.81 % 出力結果 影の方向の精度 FIDスコア
  33. 研究事例(マルチエージェント強化学習) サッカータスクでの協調行動獲得 ◼ サッカータスクでカリキュラム学習を用いて協調行動を学習  カリキュラム学習 : 段階的にタスクを難しくして学習を行う手法  複数エージェントの協調行動をカリキュラム学習を用いることで

    効果的に学習できる カリキュラム学習を行った場合 目標達成率が最も高くなった カリキュラム学習あり 弱いカリキュラム学習 カリキュラム学習なし 守備を学習したエージェントを 配置した環境でゴール率を比較 敵がいない状態、動かない敵がいる 状態でカリキュラムを組んで学習
  34. 研究事例(機械学習のセキュリティ) 機械学習のポイズニング攻撃に対する防御手法 data ◼ ポイズニング攻撃 訓練データに有害データを注入することでモデルの精度を低下 ◼ 提案防御手法 オリジナルデータを攻撃すると精度が下がるが、有害データを攻撃しても 精度は変わらないことを

    利用 ⇨ 有害データの提供元を特定 攻撃されたモデル データを集約 モデルを学習 オリジナルデータを提供 有害データを 提 供 有害データと視認できない 洗練されたデータ 攻撃者 先行研究の検出精度から 結果 が向上 攻 撃 ア ル ゴ リ ズ ム 【精度が下がる】 【精度は変化しない】 防御アルゴリズム内で攻撃実行 データを攻撃することによる精度 変化 を見ることで有害データを特定 精度変化と各データの悪影響度合い に 基づき除去するデータを決定 IoT環境
  35. 研究事例(SNS分析) コーパス間での類似語の差異に着目した隠語検出 ◼ サイバーパトロールの効率化を目指し、 ツイート(違法薬物売買等)から「隠語」を検出する  大麻の隠語例) 葉っぱ、野菜、チョコ等 ◼ コサイン類似度と2つのコーパス間(一般的な文章、

    犯罪関連文章)の単語の用途の差に着目 → 類似語から隠語を検出する仕組みを開発 評価方法 提案手法 ベースライン 手法 Precision 0.613 0.057 Recall 0.486 0.657 Accuracy 0.970 0.584 F-score 0.576 0.105 効率的なサイバーパトロール等への 貢献が期待! 提案手法により スカンク(大麻)、アイス (覚醒剤)などの隠語を検出
  36. 研究事例(知的Web技術) ナレッジグラフを用いたデータ基盤構築と課題解決の試み ◼ 課題 ◼ 学内には様々な未活用データが散在 ◼ 自転車駐輪環境が劣悪 →データ活用で駐輪環境を改善したい ◼

    異種データの活用基盤構築 ◼ 異種データを意味的な関係で結びつけ ◼ Webアプリケーションなどで データの問い合わせを可能に ◼ ナレッジグラフに基づくデータ活用 ◼ 異種データ間の関連性調査 ◼ 異種データを同一の切り口で抽出 ◼ 複数の有意な相関を発見 ◼ 欠損台数値の推定精度の向上 ◼ 意味関係による台数推定精度の向上 食堂売上高 弁当販売数 A棟前駐輪場 0.701 (0.035) 0.825 (0.006) 散在するデータ 駐輪環境 将来の 駐輪環境 ナレッジグラフを用いた データ基盤構築 Webアプリケーション等 インターフェース開発 50-70台 4/1 3限の A棟前の 異種データ間の関連性発見 台数推定精度の向上 未活用データで 駐輪場を綺麗に! 括弧内はp値 駐輪台数と食堂売上に,有意な相関を確認 50-60台 4/1 3限の A棟前の 駐輪台数は 駐輪台数は (台数はイメージ)
  37. 研究事例(IoT技術) 画像と感圧情報を用いた冷蔵庫管理システムの提案 ◼ 食材の残量や賞味期限を管理する基盤システム  食材の種類 ⚫ 画像(物体識別)と感圧情報(荷重データの照合) を用いる 

    食材の残量 ⚫ 感圧情報を用いる  同一物の検出(初回入庫時間の保存) ⚫ 食材の種類と残量、場所を用いる  3つの実験の結果、一定の精度を得る  作成した簡単なアプリの機能 ⚫ 庫内食材概要 ⚫ 庫内食材リスト ⚫ 賞味期限リスト システム全体イメージ 庫内食材概要ページ 54.7 67.4 100.0 50.0 0.0 正答率[%] 画像のみ使用した既存識別方法 画像と感圧情報を使用した提案手法 食材の種類の識別結果 ◼ 情報をデータベースで応用可能にする
  38. サブゴール、 位置、報酬 を変化させ 対照実験 研究事例(強化学習技術) 階層型強化学習におけるサブゴール設定についての考察 ◼ 階層型強化学習では、どのようにタスクを分割すればタスク全体 が効率よく学習できるのか? 

    対照実験を行いどのようなサブゴール設定ならば効率的な学習が可能な のかを検証 →適切な分割では学習効率向上、しかし分割方法によっては結果が悪化 OpenAI gym Mountaincar-v0を 改変しサブゴールの概念追加 適切な報酬・強化学習の能力に合った 設定・最適解となるサブゴールが必要 subgoal1 subgoal2
  39. 研究事例(機械学習技術) 特殊詐欺音声を対象とした韻律的特徴量の考察 ◼ 音声による詐欺検出を目指し,詐欺音声と通常音声の韻律情報を 解析し,その差異から詐欺音声の特徴を考察した. ◼ SVMで分類器を作成,詐欺音声かどうかを判別,分類した. ◼ 一般人の詐欺模倣音声と犯人の音声は異なる特徴量だった. ◼

    発話者の演技経験によって詐欺時の韻律的特徴量は変化した. 演技経験者 詐欺模倣音声と通常時の音声 分類器 学 習 実際の犯人の音声 約82%が模倣音声 として分類された 韻律情報 声の大きさ、高さ、 抑揚、etc… 詐欺かどうかで 変化すると考えられる 演技未経験者 詐欺模倣音声と通常時の音声 分類器 学 習 実際の犯人の音声 約75%が通常音声 として分類された
  40. 研究事例(深層学習) 漫画を対象とした髪領域シェーディングスタイル転写手 法の提案 ◼ 漫画の髪領域を検出し、地の色・ハイライト・陰影のテクスチャを転写 するシステム  模倣したい髪領域の地の色・ハイライト・陰影の表現(シェーディングスタイル)を 持つ漫画からデータセット作成 ⚫

    1枚の画像をマスキングしてペアを作り、回転・反転をして拡張  Pix2pixを使ってモデルを学習し、別の線画にテクスチャを転写  主観評価:約54%の人が既存自動彩色サービスよりも転写能力が高いと回答  客観評価:PSNR 16.7、SSIM 0.52 いずれも既存自動彩色サービスを上回った
  41. 研究事例(データ分析) プロサッカーチームにおける ボールリカバリーと試合状況の関係の考察 ◼ ボールリカバリーと試合状況の関係を調べ,主に守備要素が 試合に与える影響を考察する. ◼ 試合映像から手動でデータを抽出し,回帰分析で分析を行う.  2019明治安田生命J1リーグではより前線でのボールリカバリーと

    自陣に侵入させないことが重要であった.  試合の途中経過によって守備戦略を変えていることが分かった. 試 合 映 像 デ ー タ 抽 出 回 帰 分 析 攻撃方向 攻撃方向 攻撃方向 赤:試合内容が良いとき 青:試合内容が悪いとき 赤:勝ったとき 青:負けたとき 赤:勝っているとき 青:負けているとき ボールリカバリーの傾向
  42. 研究事例(深層強化学習) 複雑な環境に適応可能な深層強化学習モデル 深層強化学習は,ゲームの他にロボットなどの実機制御にも応 用できるが,実世界の複雑な環境における学習は困難 ◼ 既存研 ◼ 転移学習等による事前学習に より,学習したい環境における 強化学習を高速化

    →問題点:深層強化学習に固有の問 題(初期値依存性,探索の 偏り)や,報酬がスパース な環境への対応は困難 ◼ 世界モデルで環境をモデル化し , モデルからの出力情報のみ で学習 →問題点:環境が極めて複雑な場合, 現実的な時間,探索量で は環境のモデル化困難 進化的計算と勾配法を組み合わせたマルチタスク 深層強 化学習 ◼ 複数エージェントの探索により, 初期値依存性,探索の偏り, 報酬の獲得の難しさに対応 ◼ 複数エージェントは進化的計算も 組み合わせて高速に最適化 効率的な世界モデル構築のための再構成誤差に 基づい た内発的報酬による探索 ◼ VAEが状態画像をうまく再構成でき ない状態は,モデル化が不十分とし, 内発的報酬を与える ◼ 内発的報酬により,不確実性が高い 状態周辺からデータを重点的に集め, 効率的な世界モデル構築可能 シミュレータから実機へ の方策転移 (sim2real) 深層生成モデル(VAE)や RNNを用いた世界モデル 背景 既存研究 研究内容
  43. 研究事例(深層学習技術) 自発性を考慮した音声による感情推定のための 仮想敵対的学習を用いたモデル平滑化 ◼ 仮想敵対的学習(VAT)+自発性判別器を使って音声ベースの 感情推定(感情の度合いを推定)の精度を改善  VATにより学習データと実データの環境差に対応  音声の自発性の有無によって異なる推定器を使用

     スマートスピーカーや対話エージェントでの活躍が見込まれる 自発性 判別器 特徴量 抽出 感情 推定 感情 推定器 感情 推定器 快-不快:5 覚醒-睡眠:1 支配-服従:4 自発性有 自発性無 自発性:自発的に発話したか 例:台本を読む場合は自発性無
  44. Results Approach Existing Research • ADASIM[1]: a discrete event simulator

    that tracks vehicles traveling on map • TRAPP[2] : SUMO-based framework to provide a solution in traffic flow problem in a city with decentralized optimization tools Adaptation Plan Policy in Traffic Routing for Priority Vehicle Background • Automated Traffic Routing Problem (ATRP) in urban area • Motivating Problem in Priority Vehicle: • How to avoid traffic congestion • How to handle unexpected situation [1] Wuttke, J., Brun, Y., Gorla, A., & Ramaswamy, J. (2012). Traffic routing for evaluating self-adaptation. ICSE Workshop on Software Engineering for Adaptive and Self-Managing Systems [2] Gerostathopoulos, et al. "TRAPPed in Traffic? A Self-Adaptive Framework for Decentralized Traffic Optimization." 2019 IEEE/ACM 14th International Symposium on Software Engineering for Adaptive and Self-Managing Systems (SEAMS). IEEE, 2019. Using ADASIM: • Reduced the mean travel time 40% - 50% • Maintained adequate level of traffic congestionn Mean travel time Using SUMO: Optimizations: • There is a decrease of trip overhead by 7% • Removing the outliers data
  45. 研究事例(機械学習) 競合と比較したレビュー分析 ◼ 商品・サービスの特徴を得る手法  レビューから、競合と異なる特徴語を取得 ⚫ 機械学習の解釈手法(LIME等)を利用 ⚫ どの商品・サービスについての

    レビューかを分類する機械学習モデル から、分類に寄与する単語を取得  レビューサイトではフォローされない細かい 条件検索に寄与 現状、評価サイトでは一般的な 項目でのみ検索される 他の競合と比較して、より細かい 特徴を得ることが出来る 比較手法と比べて、より分析 に寄与する単語を取得できた 得られた単語が専門家から 見て適切かどうかを確認 結果・課題
  46. 研究事例(機械学習技術) 料理工程間の整合性を考慮する深層学習モデルを用いた料理動画か らレシピの自動生成 ◼ 提案深層学習モデル ◼ レシピ自動生成 料理動画の視覚情報からレシピを生成するモデルを学習・利用 ・ 基礎はEncoder-Decoderキャプション生成モデル

    ・ Doc2Vecでベクトル化した以前の工程情報を与えることで整合性を考慮 ・ 料理工程ごとに分割した動画をVideo-autoencodingという技術でベクトル化 ・ 2つのベクトルを結合、Decoderに渡しレシピ生成 提案モデル ニンニクを切る エビを剥く ニンニクとエビを炒める トマトとスパゲッティを加え和える 【料理工程ごとの動画】 【生成されたレシピ】
  47. 研究事例(データマイニング) グラフ理論を用いたサッカーの分析 ◼ サッカーのパスからグラフ理論の中心性を適用して 、試合においてシュートにつながるパスに関わった 選手を評価する新指標(flow+)を提案 ◼ 指標の妥当性を検証するため、メディアの記者採点 を正解データとして順位相関係数を算出し、その値 が一定以上の場合の数を比較

    ◼ 比較データは従来手法、提案手法、機械採点(通常 では取得困難なデータを用いて複雑な手法で採点) • サッカーではゴールとアシストを記録した選手に 高評価が偏る傾向 • それ以外の選手も適切に評価したい 検証結果:順位相関係数の値が0.6以上の場合の個数 • 選手評価における精度は、機械採点>提 案手法 • FWに関しては提案手法は機械採点に劣 らない性能を示した >>> 0.6=< flow+ 機械採点 全体 1 6 FW/MF 5 13 FW 11 11 MF 7 16 FW/MF/DF 3 9 FW/DF 4 9 MF/DF 5 8 DF 10 9 対象となる 試合数 30 30 ゴール、アシストを記録した選手 それ以外の選手
  48. ◼ データベースのプライバシを保証するための指標やアルゴリズム  データベースに対して匿名化*を行うことでプライバシを保護できる  ダミーレコード追加手法による匿名化を行うことでプライバシを保護しつつも データベースの有用性も保証できる  事実上の多様性を考慮することにより個人のプライバシはさらに保護される 研究事例(プライバシ保護マイニング)

    個人情報活用のためのプライバシ保護 * 匿名化: ある個人を一意に推定されないようにするプライバシ保護手法の一つ 仮名 性別 年齢 年収(円) A W 25 400万 B M 32 600万 性別 年齢 年収(円) W 25 400万 W 25 580万 M 32 600万 M 32 420万 オリジナルデータ 匿名化データ プライバシが保護されている 上にデータマイニングにも使 える! 匿名化 分析
  49. 研究事例(知的Web技術) Linked Dataを用いた俯瞰的な多肢選択式問題自動生 成 ◼ 俯瞰的な問題とは Answerを中心として広い関連知識を含み, 全体像をとらえさせるような内容の出題とする。 カリキュラム情報 単元,

    出題形式の指定 俯瞰的な多肢選択式問題 (Question Graph, Choices) ユーザ (学習者/出題者) 問題生成・出題 システム ◼ システム ◼ 俯瞰度を考慮しない問題の例 問題グラフ Answer ⻄洋哲学 influenced A. 孔⼦ B. モーゼ C. ゼノン D. ソクラテス 選択肢 問題として単純な内容になる ◼ 俯瞰度を考慮した問題の例 (提案) A. ヘラクレイトス B. カール・マルクス C. ラッセル D. ソクラテス 問題グラフ 選択肢 ◼ 俯瞰的なQuestion Graph生成手法  意味的な距離を考慮した問題グラフ抽出  既存技術 Linked Data 構造化されたデータ同士をリンクさせる技術である。 Wikipedia等のグラフデータから部分グラフを抽出 して問題に利用する。 小さな規模のグラフでかつ なるべく俯瞰度が高くなる ように抽出する 問題として様々な概念を含みより横断的な内容になる
  50. 多様度・類似度を考慮した 画像ドメイン変換 ◼ CycleGANを用いた、ドメイン別変換精度の検証 ◼ 「多様度」、「非類似度」という2つの指標を提案 ◼ 各ドメインを、2つの指標から精度分析 男性→女性 猫→犬

    成功例 失敗例 変換前後が比較的類似していると成功する…? 形状を変えようとすると失敗する…? 成功条件をもっと詳細に知りたい… よくわからない… 指標の妥当性確認 様々なドメインを用意し、実験により 変換の失敗と成功を整理していく 【非類似度】良好な結果となる区間が存在する 【多様度】高すぎると変換が困難になりやすい 結論
  51. 研究事例(ゲーム理論) プロのPK戦は最適戦略に従うか? ◼ ゲーム理論の代表的手法Minimax法を用いてPK戦におけるキッカーの 最適戦略を求めた  GKの利得表から期待利得最小領域をキッカーの最適戦略とする ◼ 実際のプロの戦略と比較し、ズレの存在を確認 ◼

    ズレの要因を調査 L C R L 0.397 0.098 0.098 C 0.197 0.857 0.197 R 0.075 0.075 0.472 GKの利得表 キッカーの 最適戦略 GKの期待利得 プロの戦略 キッカーの 最適戦略 ・ ・ ポジション: ストライカー ・ ・ スコア差:優勢 ナショナル チーム ・ 全17個のデータ項目の選手の戦略に対して Χ二乗検定によってプロの戦略との有意差を 有意水準1%で検定した その結果ズレは 国籍 スコア差 の影響示唆
  52. 研究事例(マルチエージェントシミュレーション) 金融機関の合併に関するシステミックリスクの分析 ◼ 金融機関が合併した際の倒産リスクを調査 ◼ 既存研究のモデルにのれん項目追加 インターバンクネットワーク ➀市況悪化で金融機関が破綻 ②破綻した 金融機関の

    影響で連鎖 破綻が発生 40%の 最頻値 3行 10%の 最頻値 0行 市場性資産価格40%下落の場合で, 破綻数の最頻値が変化 5行以上の多数行の破綻は減少せず 10%の 最頻値 0行 40%の 最頻値 2行 合併前の金融 機関破綻数の 分布 合併後の金融 機関破綻数の 分布 本研究のバランスシート のれんの導入により 既存研究と比較し企業 の保有するブランドやノ ウハウの金額を計上 有価証券項目に ➀市場性資産価格を半年間 下落させるケース ②1stepで損害を与えるケース により破綻する金融機関数を調査
  53. 研究事例(推薦システム) Twitter分析によるアニメの人気度の推定 ◼ 放映中のアニメの実況ツイートを収集し、以降の次回話数や 最終話の人気(盛り上がり)を予測するシステム  人気の指標にGoogleトレンドの人気度を使用 1.実況ツイートを収集 はいクソー 二度と見ないわ

    2.特徴量を抽出 ワロタww 頭おかしなるで… 3.人気度の予測 ツイート数 実況ユーザ数 人気度 前話、前々話との差 このアニメ段々面白く なりそうだよ~ マジ? チェックしなきゃ このアニメ後半失速 するかも… う~ん、見られる時間 少ないし切ろうかな… 喜び 安らぎ 好き 厭 哀れ 恥 怒り 怖い 驚き 昂ぶり POSITIVE NEUTRAL NEGATIVE ML-ask
  54. データ収集 研究事例(推薦システム) ゲームPVの音響特徴量を用いたデジタルゲームの推薦システム ◼ ゲームPVの音響特徴量を用いて, ユーザの嗜好に合ったゲームを推薦  デジタルゲームのPVの音響特徴量を解析  推薦に有効な音響特徴量を分析

     協調フィルタリングを用いた従来の推薦を音響特徴量を用いて改良 STEAM 自作データベース 推薦システム ユーザ PVの 音響特徴量 を格納 ユーザ嗜好との 類似度を計算 推 薦 推 薦 要 求 音楽的な嗜好を使った 新しい推薦を実現 音 響 特 徴 量 収 集
  55. 研究事例(機械学習) 光源を意識したイラストの自動彩色 ◼ 設定した光源位置に適した陰影付けをして線画を自動彩色  ディープラーニングにより線画の自動彩色  法線ベクトルを設定することで光源位置に適した陰影づけ  陰影の色と地の色の二色でイラスト風に描画

     評価実験 ⚫ 彩色結果と写真との陰影領域を比較した結果、実験環境において簡単な線画は約84%、複雑 な線画は約69%の精度で現実に即した陰影付けができることを確認 ⚫ 彩色結果から光源位置を被験者が判断できるかを調査した結果、簡単な線画は69%、複雑な 線画は54%の成功率を確認 法線ベクトルを RGBで表現 既存サービス を使用 陰影付け結果から 陰影の範囲選択 法線ベクトルから 陰影を計算 光源が 手前側 の真上 光源が 真左 光源が 真上
  56. 研究事例(エージェント技術) 韻律情報を用いた非タスク指向型 対話エージェントにおける応答方法の提案 ◼ 韻律情報を解析し、その差異から感情を推定し応答を決 定する  SVR(サポートベクター回帰)によって識別機を作成、対話者の音声 から感情を推定する。 

    推定された感情によって、対話者に適した応答を決定、出力する。 また巨人が 勝ったよ☺ 良かったですね 残念でしたね また巨人が 勝ったよ 韻律情報 声の大きさ、高さ、抑揚、 etc… 話者の感情により変化す ると考えられる
  57. ◼ オートエンコーダとDNNによる任意話者の声質変換  声質変換:入力音声を目標とする話者の声質に変換  オートエンコーダで圧縮した入力話者の特徴量をDNNで目的話者の 特徴量へ変換 <声質変換システム> ・ (スパース)オートエンコーダ

    ・ Deep Neural Networks 研究事例(ディープラーニング) 任意話者の声質変換 誰の声でも 目標の声に 変換できる! やるねぇ やるねぇ Input 圧縮した特徴量 はDNNの入力へ Output ・ 少ない訓練データで ・ 短い時間で 声質変換できる!!
  58. 研究事例(知的Web技術) 音楽情報処理のための楽曲LOD生成・分析基盤の構築 ◼ 楽曲特徴量などのデータ収集や分析が簡単に行えるシステム  楽曲特徴量の解析~LOD化を自動で行う楽曲LOD生成・分析基盤を構築  楽曲推薦,演奏支援,自動作曲アプリケーションの開発に活用可能 YouTube動画の URLを入力

    楽曲LOD生成 楽曲LOD (Virtuoso) DBpedia 楽曲LOD自動構築システム 楽曲特徴量 解析 楽曲情報 取得 RDF化 楽曲推薦 演奏支援 select ?s ?p ?o where { … } SPARQLクエリを発行 音楽分析 自動作曲 <解析する楽曲特徴量> Tempo, Key, Mode, Zero crossing rate, Roll off, Brightness, RMS energy, Low energy データ追加 結果取得 アプリケーションへの活用
  59. 研究事例(ソフトウェア工学) PHPアプリの設定値ミス検知 ◼ アプリケーションの設定値参照時,型不一致ミスによるバグが発生[1] ◼ 参照時の型不一致を検知する手法・検知ツール『Mis.Config』の開発  手法はコントロールフローグラフ・シンスライシングを用いて実現  精度実験で,実アプリの設定値に型不一致を発生させ,検出率を調査

     対象とした型間の変更の精度,適合率100%・再現率100% 設定ファイル上 では文字列型 [1]Bug in error reporting configuration, The Joomla! Forum, https://forum.joomla.org/viewtopic.php?t=708552 入力 Mis.Config Java コ ン ト ロ ー ル フ ロ ー グ ラ フ 生 成 シ ン ス ラ イ シ ン グ 結 果 の 出 力 設 定 フ ァ イ ル 中 の 型 特 定 正 規 表 現 リ ス ト プ ロ グ ラ ム 中 の 型 特 定 正 規 表 現 リ ス ト 出力 ソースコード上は 整数型!
  60.  Twitter投稿時に期待する反応(リプライ・いいね・RT)を機械学習で識別 ⚫ 平均F値64.4%の精度で識別可能  他のユーザからの期待しない反応をミュートするシステム  S  S

     S  S  S  S  S  S ⚫ 内容を伏せた警告表示により,閲覧の取捨選択が可能に 研究事例(データマイニング) ツイート分類によるうざレス検知と自動ミュート カレー屋の親子丼おいしかった!! 被害者 @Kashitsuki @Kashituki カレー屋で親子丼頼む やつおる?しかもマズそう うざレスおじさん @ozisann 従来までは:リプライは閲覧不可避 提案手法なら: 期待しない、リプライを警告表示 期待しない、いいね・RTは非表示 このツイートはあなたにとって不愉 快な内容である可能性が高いと判 定されました。 うざレスおじさん @ozisann 機械学習分類器(SVM) 特徴表現を基に8項目に分類 見ずに済んだ いいねを期待
  61. 研究事例(知的Web技術) 社会課題解決に向けた循環型LOD構築システム ◼ 社会課題解決に役立つLOD(Linked Open Data)を持続的に生成  データ収集,LOD化,欠損値推定,可視化のサイクルを繰り返す  放置自転車を題材にLOD生成実験を行い,未観測台数を約70%の精度で推定

    SNS 行政 データ収集 LOD化 Bayesian Network 可視化 欠損値推定 問題意識 の向上 未観測データを 確率的に推定 統一形式で Web上に公開 ソーシャルに データ収集 放置自転車LOD LODの活用 都市設計, 撤去活動支援など が期待できる
  62. 研究事例(知的Web技術) Linked Dataを用いた日本酒-ワイン間の関連性抽出 ◼ Linked Data内の日本酒-ワイン間の関連性を抽出するシステム  日本酒&ワインのLinked Data化 

    Linked Data内の無数の繋がりから意外性のある繋がりを抽出&可視化 探索イメージ アンジェリーナ・ジョリーと関連する 日本酒があるのか!! Virtuoso ・Wikipedia ・日本酒 ・ワイン ・アニメの聖地 ・姉妹都市 探索エージェント
  63. 研究事例(エージェント技術) レシピ入替えを行うグループ向け献立推薦システム ◼ レシピ間の共起度・類似度から,献立とレシピの相性を計算して,献立の レシピを入替え ◼ グループのメンバーの嗜好に合わせ,レシピ入替えを行った献立をグル ープ向けに推薦 様々な好み グループのメンバ

    • 複数人に一つの 献立を推薦したい • みんなが納得する 献立を見つけたい • メンバの様々な好み を献立に取り入れたい グループ全体の嗜好を 反映した献立推薦 献立推薦 嫌いなレシピを 入れ替えることで 献立のバランスを 崩したくない レシピ間相性度の計算 献立・レシピ間相性度の計算 レシピ入替え 献立バランスの良いレシピ入替え!!
  64. 研究事例(エージェント) 時系列データ解析に基づく犬の行動認識 ◼ 犬の加速度データを取得し,行動を推定するシステム  飼い主の知りたい犬の行動を調査  波形に着目した最新の指標であるDTW-Dを適用  11種類の行動に関して平均で75.1%のF値

    入力 出力 飼い主 愛犬(ゆず) センサ装着の様子 行動認識システム 加 速 度 デ ー タ 最 近 傍 探 索 類 似 度 比 較 デ ー タ を 分 割 加 速 度 デ ー タ 正 解 ラ ベ ル 付 与 デ ー タ を 分 割 行 動 推 定 訓 練 フ ェ ー ズ 推 定 フ ェ ー ズ
  65. 研究事例(エージェント) 映画の人物関係の推定 ◼ 一階述語論理と確率推論を組み合わせたMarkov Logic Network(MLN)を用いて映画の登場人物の人物関係を推定  1975〜1999年の映画25作品から人物の好意関係を抽出 ◼ 映画を通して現実世界を知る工学的手法の提案

     人物関係と社会指標の比較 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 安定関係 インフレ率 r=0.81(P=0.003) 社会指標と比較 高い相関を示す 結果となった 映画脚本 入力 出力 好意関係 (精度70%) y 1 y 4 y 7 y 2 y 5 y 8 y 3 y 6 y 9 述語論理へ変換 MLNによる推論
  66. 研究事例(機械学習) 決定木を用いた炎上分析 ◼ Twitterを対象とした 炎上分析&予測  提案手法: 価値観のずれによる炎上を可視化  決定木により

    炎上予測モデルの構築に成功 ◼ ここが嬉しい  炎上防止(マーケティング)に利用  有名人のイメージ改革 図1: 提案手法概要 世間の極性 炎上する 炎上する 世間の極性 発言の極性 炎上しない 炎上しない 炎上しない ≦0.08 0.08< ≦-0.4 -0.4< Nega Posi Even 図2: 炎上予測モデル AKB 2.トピック抽出 園田の事件、絶対に許せない 園田は暴力セクハラ野郎 園田監督、国の恥、クビにして 3.世評抽出 園田監督は人間性の素晴らしい、立派な人だ 発言(入力): N多数 4.世評可視化 P 1.極性抽出 炎上予測 5.世評数値化 6.決定木モデル化
  67. 研究事例(データマイニング技術) 希少性に基づく意外レシピ推薦 ◼ 投稿型レシピサイトから指定した料理の意外性 のあるレシピを推薦する  食材の希少度と一般度から食材の意外度を算出 ⚫ 希少度・・・その料理内での出現数の逆数 ⚫

    一般度・・・レシピ全体での出現数  食材の意外度からレシピの意外度を算出  アンケートによりレシピの意外性評価は約60% システムの有用性評価は約70%  それらを利用したWebサービスを公開 希少度のみ 一般度 希少度 + コーフーミンチ 熟味酢 きゅうり りんご 例) ハンバーグの意外食材 いつもの味に飽きた… でも新しい料理に挑戦 するのは敷居が高い… Webサービス
  68. 研究事例(自己適応システム) 自動清掃ロボットの機能拡張 ◼ 自己適応のメカニズム(MAPEループ) を利用したRoombaの機能拡張  課題:小物類やゴミなどのオブスタクル移動 ⚫ オブスタクル移動のAndroidアプリを実装 

    制約:組込みプログラムを変更できない ⚫ システムに外付けするMAPEループの特徴 移動できるようになった オブスタクル Roombaのソフトウェア 計画 分析 監視 実行
  69. 研究事例(知的Web技術) Human Pose Guide Ontology(HPGO)を用いた 人物画像のポーズ分類 ◼ 画像を解析し、ポーズごとに自動分類するシステム  コンピュータビジョン技術により、画像内人物のポーズ推定を行う。

     HPGOが内包する人体構造の制約条件によって、ポーズ推定結果を補正、 分類精度を高める。 任意の「指定した ポーズ」の画像を 見たいなぁ… 人体構造を分析し、 指定されたポーズに合致した 画像を検索 人体構造の制約を考慮することで 精度向上に成功
  70. 研究事例(エージェント技術) 音楽推薦システム ◼ 音楽推薦システム: 携帯端末上でのコンテキスト情報(場所) を用いた音楽推薦アプリケーション  独自の‘renso’ relationを提案し、複数のAlignmentを組んで音楽推薦 ⚫

    邦楽でも洋楽でも推薦できる  幾つの問題を解決 ⚫ Cold Start Problem ⚫ SerendipityとAccuracyのバランス  端末対応 ⚫ 携帯(iOS、Android)、タブレット、パソコン
  71. ◼ タイムラグに対して自己適応するC/S型オンラインゲーム  ヘテロ(異種混合)な環境では, 事前に各システム特性を把握するのは困難!  リアルタイム性の高いオンラインゲームの クオリティは,通信遅延によるタイムラグに 大きく左右される 

    提案MAPEループ構成パターンにより, 公平で快適なオンラインゲーム環境を提供を目指す ⚫ タイムラグの状況に応じた,振る舞いに変更 ⚫ ゲーム進行における矛盾の回避 ⚫ 事前に想定できないシステム特性に対応 研究事例(自己適応システム) 自己適応オンラインゲーム 図1. タイムラグによる矛盾発生問題 図2. 本提案MAPEループ構成パターン E M A P M A M A クライアント1 クライアント2 クライアント3 サーバ 計画に基づき, サーバコントロール 矛盾検知 適応計画 原因を分析し, サーバに報告 Player A画面 ①攻撃! ②移動 Player Aの得点ならず (①より②が先に処理反映) Player B ④攻撃はゲームに まだ反映されてない 矛盾! ③すぐにゲーム に反映 [節政10] Player Aの タイムラグが 大きい場合 ※自己適応システム:実行時に動作環境が変化する状況において, 環境に適した構成・振る舞い変更を,動的にソフトウェア自身が 行うことができるシステム
  72. ◼ 行政機関のシステムは、法令を遵守している必要があるため,法 令からシステムに必要な機能要求を適切に抽出することが重要 そのため・・・ 研究事例(要求工学) 法令からの半自動的機能要求抽出  UMLのユースケースの概念を用いて条 文を要約するツールを実装 

    機能要求を表現する記述を予め定義し た3種類のテンプレートを作成し、どのテ ンプレートで抽出すべきかを示唆するツ ールを実装  実際の法令から機能要求を抽出する実 験を行った結果,高い精度(90%超)で 抽出できることを確認 法令からの機能要求の抽出手順
  73. 研究事例(エージェント) 震災時の避難行動推薦エージェント ◼ ユーザの状況や目的に応じた避難行動を推薦するエージェント  Twitterから震災関連の情報を抽出して,行動の推薦に利用する  推薦後もエージェントがユーザを見守り, 状況に応じて推薦結果を動的に変更する 

    推薦候補の行動を動的に評価することで, リアルタイムな推薦処理を実現 行動ネットワーク 構築 避難オントロジ 更新 エージェント リポジトリ 行動ネットワーク 避難オントロジ イベント抽出 状況変化を検知 行動抽出 ・ ・ ユーザ 推薦サーバ 推薦端末
  74. 研究事例(エージェント) UAVとUGVを利用した障害物撤去 UGVが撤去方法に異常を検知した時,UAVに再プランニングを依頼する UAVとUGVが協力して遭遇した障害物を撤去する 障害物 UGV UAV 観察 撤去方法を導出 撤去方法

    1.UGVが障害物を発見 2.UGVがUAVに協力を依頼 3.UAVが障害物周辺を観察 4.協力して撤去方法を導出 ・ UAV:撤去方法を導出 ・ UGV:撤去方法の修正を依頼 5.UGVが撤去する ・必要なUGVに協力を依頼 依頼 (UAV:Unmanned Air Vehicle, UGV:Unmanned Ground Vehicle)
  75. 研究事例(知的Web) メディア情報の比較支援システム ◼ 異種メディアの比較をサポートするシステム  メディア情報の事象情報をCRFを用いて自動抽出 ⚫ 抽出精度(F値): 事象 74.7%

    | 事象間の関係: 87.4%  Linked Dataとして構造化し事象ネットワークを自動構築  事象ネットワークの可視化  事象ネットワークの注目ポイントの自動推定 ◼ 本研究の嬉しさ  多角的な観点から情報把握の容易化 e.g. 重要事象/希少事象/偏向報道の発見  メディア情報LODとしての2次利用 事象ネットワークの可視化例
  76. 研究事例(機械学習) GAを用いたシステムトレード ◼ 株・為替を対象とした自動売買  遺伝的アルゴリズム(GA)により遺伝子の パラメータを変化、売買ルールを進化させる  利益を出すルールの探索ではなく、 損失を出さないルールを探索

    ⚫ 利益が従来比2倍に(fit0→fit3)  相場による売買戦略の切替手法も提案 ⚫ 利益が更に1.4倍に(fit3→hyb) 株式:136銘柄の6年間の売買結果[万円] 為替:17通貨ペアの6年間の売買結果[万円]
  77. 研究事例(ソフトウェア工学) ソフトウェアの再利用に関する研究 ◼ 既存ソフトウェアを再利用しやすい状態に整理する → 階層化された要求モデルである「ゴールモデル」を使って整理 → ツールが自動で、共通ゴール(必ず再利用)と 可変ゴール(要求に応じて再利用)を判別 A

    D 共通ゴール C 可変ゴール と B E と F 提案手法 実装ツール 0 searching in the search field(A) by user name(B) AND AND by words(C) searching friends (D) by name(E) AND AND by e-mail address (F) GM1 GM2 「ゴール名の類似度」だけでなく、 「ゴールモデルの構造上の特性」も用いて判別精度が向上 新ゴール G 新システム 既存システム
  78. 研究事例(エージェント) オントロジーを用いた衣服検索 ◼ ユーザの嗜好に基づいた 衣服検索システム  ECサイト上の閲覧履歴を用いて ユーザの嗜好を推定 ⚫ 共通デザインの出現頻度から

    デザインに関する嗜好を推定  服飾オントロジーを構築 ⚫ ユーザの嗜好を インスタンスとしてマッピング ⚫ 概念間類似度判定により ユーザの嗜好に近い衣服を提示  デザインの推定機能も提案 ⚫ 衣服名を基にデザインの一部を特定 ⚫ 特定出来ないデザインには画像特徴 量を利用して推定
  79. 使用した 使用しなかった 研究事例(エージェント) 作曲からの嗜好抽出と素材推薦 ◼ ループシーケンサ型の作曲システム  断片素材を組み合わせて作曲  作曲中に利用した素材のタグを収集

    ◼ 嗜好をユーザ間で共有し,協調作曲  他ユーザの作風を参考に作曲できる ◼ インタフェース  作曲者の嗜好をタグクラスタで可視化  嗜好に基づいた素材推薦が可能 4ビート 開始感 8ビート 開始感 2beat 緊張感 作 曲 ループシーケンサ画面 素材選択画面 推薦 エージェント 断片素材 タグ
  80. 研究事例(知的Web) アノテーションを用いた動画シーンラベリング ◼ ニコニコ動画の重要シーンに要約情報(ラベル)を付加  特徴語を抽出 ⚫ タグの抽象度の差を利用 ⚫ タグごとの特徴語を抽出

     特徴語の意味的カテゴリを推定 ⚫ 共起情報を効率よく推定に利用 ⚫ 既存手法の最大830倍の処理速度  意味情報をラベルに利用 ⚫ 特徴語とその意味情報をラベルに付加 ⚫ 特徴語を知らなくても理解しやすいラベル タグの抽象度の差による特徴語抽出 意味情報が付加されたラベル
  81. 研究事例(自己適応システム) 設計言語拡張による自己適応システム構築手法 ◼ Architecture Description Languageを活用した動的再構成  構成変更可能部分と変更による影響をモデリングし,ADLを拡張  設計言語を実行時に解析し自動的に適応案を生成するフレームワーク

    ◼ 適応フレームワークによるWebシステムの管理 Application Transaction Display Receipt Transfer Balance Inquiry Logging Security Authentication Auth.Per Session Auth.Per Request Encryption GUI PC Interface Mobile Interface Onetime Password Graphical Text Telephone Service Database ConnectToBankDB Connect toMainDB Connect toSubDB ConnectTo OthrBank ②軽量な処理に切り 替え・ 必須でない機能の取り 外し ①変更可能を判断し 動的に切り 替え ①故障の発生 → 自律的に適応プランを生成し再構成,サービスを継続 ②やむなき構成変更による性能低下 → 必須な機能以外を取り外し対処 0 1000 2000 3000 4000 5000 6000 提案手法 通常システム Response Time (msec) Time Elapsed ①故障の発生 ( 適応を開始) Adaptation ②性能の低下を検知 Adaptation
  82. 研究事例(ソフトウェア工学) モデル検査のための外部環境構築 ◼ モデル検査  状態を網羅的に検査  検証対象と外部環境モデルが並行動作 ◼ 外部環境モデルの問題点

     設計が困難,不要な状態が発生 ◼ 不要な状態探索削減可能な外部環境モデルの提案  起こり得ない状態をOCLで記述,不要な状態探索を削減 ◼ サッカーロボットの攻撃の振舞い検証に適用  不要な状態(e.g.オフサイド発生後の探索)を22%~40%を削減 検証対象 外部環境モデル 設計対象 外部環境=設計対象外 利害関係者 ハードウェア 本研究の対象 検証対象の大規模化 検証不可能 状態爆発 Verification robot ball_take:bool pass:bool off_side_line:int x,y:int pass():void take_passs():void move():void shoot(): OCL記述例(サッカーロボットの攻撃シーンにおいて,オフサイド発生後の振る舞いは起こり得ない) context: Verification_robot inv:¬((off_side_line > y ) && ball_take ==true && pass==true) オフサイド発生後の不要な探索を削除 OCL記述を違反する場合,Promelaの例外処理を用いて探索を停止
  83. 研究事例(エージェント) 拡張現実を用いた植物推薦 ◼ Green Thumb-Phone: 携帯端末上での拡張現実を用いた植物 推薦アプリケーション  環境データを取得し、植裁スペースに適した植物を推薦 ⚫

    決定木を利用して、100種類以上 の植物を推薦可能  拡張現実を用いて3DCGにより 視覚的に確認 ⚫ Android携帯端末上に実装  植物の専門家の評価から、約70%の 精度で正しく推薦できることを確認
  84. 研究事例(知的Web) 意見抽出による評判比較システム ◼ 商品・サービスの評判を可視化するシステム  レビューサイトから評判を自動抽出 ⚫ ジャンルを問わない意見抽出手法 ⚫ 辞書を用いず、教師あり学習

    (CRF, SVM)による意見抽出の 自動化  シーソーGUIなどによる比較結果の可視化 肯定意見が多く、 否定意見が少ない ほど浮上する 肯定意見が多ければ 右へ、否定意見が 多ければ左へ移動 抽出した意見を表示
  85. コンテンツDB 研究事例(知的Web) マイクロブログを用いた評判動向分析ツール ◼ Twitterの「つぶやき」から様々な物事に対する評判の傾向と 評判を変化させた原因を抽出 ◼ センチメント分析、チャンキングを活用 ◼ 政党支持率、TVドラマの視聴率の分析で一定の精度を確認

    twitter キーワード入力 ②重回帰分析による 評価表現の特定 ③変化点の抽出 コンテンツの収集 ④チャンキングによる トピック抽出 日本語評価 極性辞書 p/n判定 ①評価情報の抽出 センチメント分析 感情表現辞書 解 析 対 象 切 り 分 け 変化点,トピック取得 <評判調査システム> ユーザ 評価情報DB 回帰係数入力
  86. 研究事例(知的Web) 未知性・意外性を考慮したコンテンツ推薦 ◼ 未知性・意外性のあるコンテンツを推薦するシステム  コンテンツ投稿型SNSで有効な推薦手法 ⚫ イラスト投稿型SNS「Pixiv」上で実証実験  未知性(Novelty):興味に合っているが

    まだ見たことのないコンテンツ →有力投稿者を探し出し、有力投稿者 のブックマーク情報を利用  意外性(Serendipity):興味に近いが、 推薦されるとは思っていないコンテンツ →2種類(ユーザ・コンテンツベース)の 共起度を用いて類似タグを抽出・除去  3次元インタフェースにより推薦結果を表示
  87. 研究事例(エージェント) 高齢者外出支援エージェント エージェントサーバ 未登録 障害 GPS 測位 障害 障害 わんわん!

    近傍障害 情報の通知 投稿 未登録障害 情報の投稿 •高齢者の見守り •障害情報の管理 •行動予測に基づく障害通知 •回避行動や嗜好学習 •障害情報の共有 実験風景
  88. 研究事例(自己適応システム) ◼ 状況変化に応じて自らの構成や振舞いを自発的に変更するソフトウェア  ソフトウェアが自分自身の目的を管理  実行状況を監視し、予期せぬ変化を検出  変化した状況において当初の目的を達成する変更計画を策定 

    変更計画に基づき、ソフトウェア構成や振舞いを変更 ◼ システムの不具合、過負荷、外部からの攻撃等に自律的に対処 環境変化2 従来システム システムアーキ テクチャ(固定) if then if then 処理A’ 想定外の環境変化に弱い 処理A 目的を管理した柔軟な アーキテクチャ変更 環境変化1 要求 A 要求 A 環境変化1 環境変化2 環境変化2 環境変化1 予期しない環 境変化 設計者 環境を想定 し,具体的な 処理を実装 self-adaptive システム 目的 A システムアーキテクチャ(変動) 目的管理 目的記述, 部品を用い た実装 環境変化2 環境変化1 部品 1 部品 部品 1 部品 2 部品 3 部品 4 要求 A 要求 A 環境変化2 環境変化1 設計者 代替目的 A’ 予期しない 環境変化
  89. 研究事例(エージェント技術) 商品口コミ情報収集分析エージェント ◼ 携帯電話のカメラで商品のバーコードをスキャン ◼ インターネットから商品のメタデータを取得 ◼ 関連するブログ情報を収集、分析 ◼ 商品の口コミ情報をリアルタイムでユーザに提示

    ブログ上の評判 (ポジティブ・ネ ガティブ)を集計 ブログを収集した後、オントロジーを参照してブログの中身を解析し 店舗でバーコードをスキャンすると ブログで話題 になっている関 連商品を提示 有用なブログ 記事(口コミ情 報)を表示
  90. 研究事例(エージェント技術) ショッピング支援エージェント 「牛乳を買い忘れてませんか?」 「近くの◦◦ストアで買えますよ」 位置情報 「お店から割引クーポン が発行されました!」 ユーザ ショッピング支援エージェント GPS携帯

    状況に応じたメッセージの通知 在庫情報 買物メモ 屋外 ユーザプロファイル ユーザ行動履歴 個人向け広告配信 状況の自動認識 情報家電 購買履歴 広告情報 店内 家庭内 POSレジ