Upgrade to Pro — share decks privately, control downloads, hide ads and more …

編集業務の生産性向上へ向けたserverlessなアプローチ

 編集業務の生産性向上へ向けたserverlessなアプローチ

2018年3月10日
JAWS DAYS 2018
朝日新聞社ではコンテンツのデジタル化に力を入れるとともに、編集作業の生産性向上に取り組んでいます。今回は、生産性向上の一環として開発した朝日新聞デジタルの編集者向け記事・画像検索システムについて、導入背景や内製でのサーバーレス開発で実践したことをご紹介します。また、朝日新聞社が現在行っている機械学習を取り入れた編集作業の効率化への取り組みについてもお伝えします。

Takafumi Ochiai

March 08, 2018
Tweet

Other Decks in Technology

Transcript

  1. 自己紹介 • 落合 隆文(おちあい たかふみ) • 2007年4月入社 • 情報システム部、工程管理部で新聞製作システムの開発運用を担当し たのち、2015年に開発部へ異動

    • 開発部ではデジタルサービスを担当。最近ではCMS(コンテンツ管理 システム)の開発や研究開発チーム「ICTRAD」でのプロトタイプ開 発を担当 • 趣味:スキー、散歩、python [email protected] Copyright 2018 The Asahi Shimbun Company.
  2. きっかけ [email protected] Copyright 2018 The Asahi Shimbun Company. • 写真のない新聞記事をデジタル配信すると、

    一覧に見出しだけで表示される • 写真のある記事の方が注目されやすいため、 写真をセットにして配信したい • しかし、探すのに手間がかかる という話を編集者から聞き、研究開発チームの 作業として、記事の内容を解析して写真を提案 するプロトタイプを開発
  3. [email protected] Copyright 2018 The Asahi Shimbun Company. サービス化 • プロトタイプの評価を経て、編集者向けの記事と画像の検索システムとして

    社内公開することに • プロトタイプはEC2で構築していたが、このタイミングでインフラについて 検討しはじめる • デジタル配信は24時間体制で行われている • 今後も色々なプロトタイプを製作し、ニーズのあるものはサービス化してい きたい。運用保守に時間を取られることは避けたかった
  4. [email protected] Copyright 2018 The Asahi Shimbun Company. サービス化 • プロトタイプの評価を経て、編集者向けの記事と画像の検索システムとして

    社内公開することに • プロトタイプはEC2で構築していたが、このタイミングでインフラについて 検討しはじめる • デジタル配信は24時間体制で行われている • 今後も色々なプロトタイプを製作し、ニーズのあるものはサービス化してい きたい。運用保守に時間を取られることは避けたかった →そこでサーバーレス
  5. 制約はあります きつかったもの • Lambdaの容量制限 • Elasticsearch Serviceで辞書を利用できない • 、、、etc →制約に合わせる必要はあるが、得られるメリットの方が大き

    いというのが実感 →推論部分の構成や運用はまだ試行錯誤の段階だが、機械学習 の活用でもサーバーレスのメリットを得られるようにしていき たい [email protected] Copyright 2018 The Asahi Shimbun Company.
  6. 自動校正の研究 [email protected] Copyright 2018 The Asahi Shimbun Company. • 日々の編集作業で蓄積された記事の修正履歴を学習

    <同音異義語・動詞> 校正前:東京(品川)と名古屋の間は2027年に開業、名古屋から大阪までは45年に伸びる予定だ。 校正後:東京(品川)と名古屋の間は2027年に開業、名古屋から大阪までは45年に延びる予定だ。 <同音異義語・名詞> 校正前:県警は8日、熊谷署に100人体制の捜査本部を設置。 校正後:県警は8日、熊谷署に100人態勢の捜査本部を設置。 <助詞、他の名詞への代替案> 校正前:医療の進歩により、がんがなった後も以前と変わらぬ人生を送れる人が増えている。 校正後:医療の進歩により、がんになった後も以前と変わらぬ人生を送れる例が増えている。
  7. 見出しの自動生成の研究 [email protected] Copyright 2018 The Asahi Shimbun Company. • 上と下、どちらが人間の書いた見出しでしょう?

    1.日比谷図書館を千代田区に移管 都教委が正式合意 2.「上司がパワハラ」海自事務官が提訴 3.子育て応援施設、空き店舗に移転 和歌山ぶらくり丁商店街 4.晩秋の風物詩「松の腹巻き」 鶴岡 1.都、区と正式合意 日比谷図書館の千代田区移管 2.海自事務官、パワハラ提訴佐世保「ストレスで休職」 3.空き店舗に子育て拠点 和歌山の商店街に明日オープン NPOの施設、移転 4.松も冬支度、幹に「腹巻き」 鶴岡
  8. 研究体制 [email protected] Copyright 2018 The Asahi Shimbun Company. • 株式会社レトリバと共同研究(朝日新聞社のエンジニアを派遣)

    • 国際学会にも論文を投稿するなど、学術研究にも取り組んでいる 今後は研究成果の実用化もテーマになってくる
  9. 研究体制 [email protected] Copyright 2018 The Asahi Shimbun Company. • 株式会社レトリバと共同研究(朝日新聞社のエンジニアを派遣)

    • 国際学会にも論文を投稿するなど、学術研究にも取り組んでいる 今後は研究成果の実用化もテーマになってくる →そこでサーバーレス