Slide 1

Slide 1 text

編集業務の生産性向上へ向けた serverlessなアプローチ -JAWS DAYS 2018- 落合隆文 株式会社朝日新聞社 情報技術本部 開発部 [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 2

Slide 2 text

自己紹介 • 落合 隆文(おちあい たかふみ) • 2007年4月入社 • 情報システム部、工程管理部で新聞製作システムの開発運用を担当し たのち、2015年に開発部へ異動 • 開発部ではデジタルサービスを担当。最近ではCMS(コンテンツ管理 システム)の開発や研究開発チーム「ICTRAD」でのプロトタイプ開 発を担当 • 趣味:スキー、散歩、python [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 3

Slide 3 text

今日話すこと • 朝日新聞デジタルの編集者向けに開発したサー バーレスな記事・画像検索システムについて • その他、現在行っている機械学習を取り入れた編 集作業の効率化への取り組みについて [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 4

Slide 4 text

朝日新聞デジタルの編集者向けに開発したサー バーレスな記事・画像検索システムについて [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 5

Slide 5 text

[email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 6

Slide 6 text

[email protected] Copyright 2018 The Asahi Shimbun Company. 今回はココの話をします

Slide 7

Slide 7 text

きっかけ [email protected] Copyright 2018 The Asahi Shimbun Company. • 写真のない新聞記事をデジタル配信すると、 一覧に見出しだけで表示される • 写真のある記事の方が注目されやすいため、 写真をセットにして配信したい • しかし、探すのに手間がかかる という話を編集者から聞き、研究開発チームの 作業として、記事の内容を解析して写真を提案 するプロトタイプを開発

Slide 8

Slide 8 text

[email protected] Copyright 2018 The Asahi Shimbun Company. サービス化 • プロトタイプの評価を経て、編集者向けの記事と画像の検索システムとして 社内公開することに • プロトタイプはEC2で構築していたが、このタイミングでインフラについて 検討しはじめる • デジタル配信は24時間体制で行われている • 今後も色々なプロトタイプを製作し、ニーズのあるものはサービス化してい きたい。運用保守に時間を取られることは避けたかった

Slide 9

Slide 9 text

[email protected] Copyright 2018 The Asahi Shimbun Company. サービス化 • プロトタイプの評価を経て、編集者向けの記事と画像の検索システムとして 社内公開することに • プロトタイプはEC2で構築していたが、このタイミングでインフラについて 検討しはじめる • デジタル配信は24時間体制で行われている • 今後も色々なプロトタイプを製作し、ニーズのあるものはサービス化してい きたい。運用保守に時間を取られることは避けたかった →そこでサーバーレス

Slide 10

Slide 10 text

[email protected] Copyright 2018 The Asahi Shimbun Company. https://aws.amazon.com/jp/solutions/case-studies/asahi-shimbun/ 構成

Slide 11

Slide 11 text

良かったこと① • 少人数でも機能開発に集中できる →フロントがマネージドサービスなので、運用負荷が低い →スケールに悩まない →インフラに使う時間が減り、機能開発に集中できる • 安い(フロント部分のコストはEC2の99%減) • 早い(2時間もあれば新環境をデプロイできる) • マイクロサービス化できる →記事検索APIを他のシステムにも機能提供するなど、柔軟な対応ができるよう になった [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 12

Slide 12 text

• 編集者のニーズをくみ取りながら一緒に機能を作っていく、提案型の業務 スタイルに変わってきた • 分析したデータを見ながらサービス改善の話ができるようになってきた • データ活用を念頭に置いて開発できた(クリックログがそのまま機械学習 用のデータにもなる、etc ) [email protected] Copyright 2018 The Asahi Shimbun Company. 良かったこと②

Slide 13

Slide 13 text

制約はあります きつかったもの • Lambdaの容量制限 • Elasticsearch Serviceで辞書を利用できない • 、、、etc →制約に合わせる必要はあるが、得られるメリットの方が大き いというのが実感 →推論部分の構成や運用はまだ試行錯誤の段階だが、機械学習 の活用でもサーバーレスのメリットを得られるようにしていき たい [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 14

Slide 14 text

現在行っている機械学習を取り入れた編集作業 の効率化への取り組みについて [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 15

Slide 15 text

研究への取り組み [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 16

Slide 16 text

[email protected] Copyright 2018 The Asahi Shimbun Company. 今度はココの話をします

Slide 17

Slide 17 text

自動校正の研究 [email protected] Copyright 2018 The Asahi Shimbun Company. • 日々の編集作業で蓄積された記事の修正履歴を学習 <同音異義語・動詞> 校正前:東京(品川)と名古屋の間は2027年に開業、名古屋から大阪までは45年に伸びる予定だ。 校正後:東京(品川)と名古屋の間は2027年に開業、名古屋から大阪までは45年に延びる予定だ。 <同音異義語・名詞> 校正前:県警は8日、熊谷署に100人体制の捜査本部を設置。 校正後:県警は8日、熊谷署に100人態勢の捜査本部を設置。 <助詞、他の名詞への代替案> 校正前:医療の進歩により、がんがなった後も以前と変わらぬ人生を送れる人が増えている。 校正後:医療の進歩により、がんになった後も以前と変わらぬ人生を送れる例が増えている。

Slide 18

Slide 18 text

見出しの自動生成の研究 [email protected] Copyright 2018 The Asahi Shimbun Company. • 上と下、どちらが人間の書いた見出しでしょう? 1.日比谷図書館を千代田区に移管 都教委が正式合意 2.「上司がパワハラ」海自事務官が提訴 3.子育て応援施設、空き店舗に移転 和歌山ぶらくり丁商店街 4.晩秋の風物詩「松の腹巻き」 鶴岡 1.都、区と正式合意 日比谷図書館の千代田区移管 2.海自事務官、パワハラ提訴佐世保「ストレスで休職」 3.空き店舗に子育て拠点 和歌山の商店街に明日オープン NPOの施設、移転 4.松も冬支度、幹に「腹巻き」 鶴岡

Slide 19

Slide 19 text

研究体制 [email protected] Copyright 2018 The Asahi Shimbun Company. • 株式会社レトリバと共同研究(朝日新聞社のエンジニアを派遣) • 国際学会にも論文を投稿するなど、学術研究にも取り組んでいる 今後は研究成果の実用化もテーマになってくる

Slide 20

Slide 20 text

研究体制 [email protected] Copyright 2018 The Asahi Shimbun Company. • 株式会社レトリバと共同研究(朝日新聞社のエンジニアを派遣) • 国際学会にも論文を投稿するなど、学術研究にも取り組んでいる 今後は研究成果の実用化もテーマになってくる →そこでサーバーレス

Slide 21

Slide 21 text

その他の取り組み [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 22

Slide 22 text

相撲力士認識アプリ • 「あれ、このスポーツ選手の名前何だっけ?」と 思ったとき、すぐ情報が得られたら面白いのでは ないかという会話からプロトタイプ開発がスター ト • 巡業や稽古に行って力士の写真30994枚を撮影。 30時間かけて分類し学習データを作成 • (Rekognitionが東京リージョンで使えていたら こんなに苦労しなかったかも・・・・) [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 23

Slide 23 text

クイズ生成 • 時事問題クイズにニーズがありそうだが、人手で問題を作るのが大変 で試せていないというビジネス部門の声を聞き、自動でクイズを作れ ないか実験 【例】 インターネットで音楽を配信する「ストリーミング」サービスの世界最大手、スポティ ファイは28日、米証券取引委員会に上場申請したと発表した。______に上場する。最近 の取引から試算した株式時価総額は最大226億ドルで、写真・動画共有アプリを手がけ る米スナップ以来の大型上場となる。 ______に入るのは? ①ナスダック ②ロンドン株式市場 ③シカゴ・マーカンタイル取引所 ④ニューヨーク証券取引所 [email protected] Copyright 2018 The Asahi Shimbun Company.

Slide 24

Slide 24 text

まとめと今後 • 編集業務の生産性向上への取り組みとして記事画像検索システムをサー バーレスで開発。システム運用等の負荷が軽減され、少人数でも機能開 発に集中することができた • 推論部分の構成や運用はまだ試行錯誤の段階だが、機械学習の活用でも サーバーレスのメリットを得られるようにしていきたい • 学術研究からプロトタイプアプリの開発まで幅広く取り組んでいるが、 ニーズのあるものを素早くサービス化する為にも、サーバーレスを有効 に活用していきたい [email protected] Copyright 2018 The Asahi Shimbun Company.