Slide 1

Slide 1 text

株式会社 Gunosy Gunosy Tech Lab 関 喜史 2020年6月8日 JSAI 2020 インダストリアルセッション Gunosyのニュース推薦システムを 支える研究開発

Slide 2

Slide 2 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 2 プロフィール 東京大学工学部卒業、同大学院工学系研究科博士後期課程修了。博士(工学)。 2011年度未踏クリエイター。 大学院在籍中にGunosy(グノシー)を共同開発し、2012年当社を共同創業。 創業期からニュース配信ロジックの開発を担当。 現在は研究開発に従事し推薦システムを中心としたウェブマイニング、 機械学習応用、自然言語処理応用を専門とする。 株式会社Gunosy Gunosy Tech Lab 上席研究員 共同創業者 関 喜史(Yoshifumi Seki)

Slide 3

Slide 3 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 3 Gunosyにおける研究開発体制と方針 ● 社員2名+アルバイト1名 ● 1名はこの春から社会人博士として学生兼務 — 会社から学費などの支援あり — 社会人でも博士号取得を目指せる~推薦システムの研究エンジニアが経 験したこと - Gunosiru(グノシル) ● https://gunosiru.gunosy.co.jp/entry/career-doctor ● 研究開発チーム立ち上げ4年目 ● 2019年のGunosy研究開発チームの振り返りとこれから - Gunosyデータ分析 ブログ — https://data.gunosy.io/entry/research-development-2019 ● 2019年度はトップ会議に通すこともできるようになってきた ● KDD2019, Recsys2019, WI2019 ● 今年もいろいろ投稿中 論文投稿数をKPIに会社の中長期課題に取り組んでいる

Slide 4

Slide 4 text

(C) Gunosy Inc. All Rights Reserved. 直近の研究内容について

Slide 5

Slide 5 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 5 消費の多様性とユーザエンゲージメントの分析 幅広い情報消費を促進することがどのようにユーザ・サービスに寄与するのかを明らかにした い (JSAI2019 / ABCSS2019 / DEIM2020で発表・国際会議投稿中 ) ● 消費アイテムの多様性とサービスのアクティビティとの関 係を長期的に分析 ● ユーザがクリックした記事の内容の違いを定量化 ● サービスでのクリック数や離脱率と比較し影響を測る ● 人気度に対する多様性指標を提案 ● 人気なものへの消費の偏りが近年指摘されている ● 人気な記事を読んだ比率を指標として提案 ● それぞれの指標を用いて離脱率の予測 ● それぞれの指標が離脱の予測に寄与していることを確 認

Slide 6

Slide 6 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 6 双極空間埋め込みを利用したニュース推薦システム 省スペースでの埋め込み表現を活用したオンライン学習可能な推薦システム (DEIM2020で発表・優秀インタラクティブ発表賞 国際会議投稿中) ● 双極空間埋め込みは低次元で高精度な埋め込みができる ○ 自然言語処理、グラフなどで成果を上げている ○ ニュース推薦はリアルタイム性が求められるので、低次元の埋め込みの場合 計算負荷が小さくなるメリットがある ● 双極空間推薦におけるオンライン学習の枠組みを提案 ○ ID埋め込みの場合新しいアイテムへの評価ができない ○ オンライン学習のアルゴリズムを提案し、有効性を確認 ● A/Bテストで有効性を確認 ○ 各種KPIの改善がみられた

Slide 7

Slide 7 text

(C) Gunosy Inc. All Rights Reserved. JSAI2020での発表について

Slide 8

Slide 8 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 8 OS-12 広告とAI 広告関連研究の議論と国内での広告研究が活発になることをめざしてオーガナイズドセッショ ンを企画しました(今、裏番組でやっています)

Slide 9

Slide 9 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 9 生存時間分析を活用した広告停止予測 広告運用効率化のために効果の悪い広告の停止を予測する (OS-12 広告とAIで発表: すでに終了しています) ● 広告クリエイティブの運用は多くが手動で行われている ○ 機械学習を使って効率化したい ○ 効果の悪い広告の停止に着目 ● 生存時間分析を活用して広告の停止を予測する ○ ハザード関数ベースの損失関数 ○ N日後に止まる確率を予測できる ● 売上ベースの損失関数、停止の種別のモデル分割を提案 ○ 予測性能の改善を確認 ○ 直感にあったパフォーマンスの違いを確認

Slide 10

Slide 10 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 10 ニュース消費傾向からみる選挙争点分析 ニュースの読まれ方から世論調査の結果を予測できるか? J-5 Webインテリジェンス: 社会データ分析(2) このあとです! ● メディアの情報提供・情報消費がユーザに与える影響を知りたい ○ よい推薦システムを作りたい ○ 良さとはなにか? - 情報は意思決定のために使う ○ 人の意思決定にどのような影響を与えているか? ● 選挙争点分析を対象にする ○ 選挙の意思決定については数多くの研究がある ○ こうした過去の知見とユーザ行動ログを照らし合わせることで、サービスが ユーザに与える影響を明らかにしたい ● 世論調査をGround Truthとして、各種エンゲージメント指標との関係を分 析

Slide 11

Slide 11 text

(C) Gunosy Inc. All Rights Reserved. PAGE | 11 まとめ ● サービスを良くするためには多くの課題があるが、重要な課題ほど結果を 短期で得るのは難しい ● 現場レベルではどうしてもコストパフォーマンス重視になる ● 答えがある問題のほうが優先度があげられがち ● 論文投稿という短期ゴールによって中長期課題への取り組みを行い、知 見を増やす ● 解くのが難しい問題を解けるレベルまで落とす ● 事例を増やすことで、他の問題にも展開しやすくする ● 難しい問題を解くカルチャーを作っていく ● 論文も書けるチームではなく論文を書けるチームを作る ● 論文投稿を第一に置いた組織作り ● 事業影響よりも問題の難しさを重視 ● 会社のビジョンがしっかりしていれば、変なことにはならない(と信じてい る) よいサービスをつくるための中長期課題に研究開発として取り組んでいます

Slide 12

Slide 12 text

情報を世界中の人に最適に届ける