$30 off During Our Annual Pro Sale. View Details »

NIKKEI Tech Talk #4 日経電子版のバックエンド開発全般の紹介/nikkei-...

NIKKEI Tech Talk #4 日経電子版のバックエンド開発全般の紹介/nikkei-tech-talk-20230216-1

Nikkei Tech Talk #4 で発表した際の資料です。日経電子版のバックエンド開発全般の紹介です。
https://nikkei.connpass.com/event/272705/

More Decks by 日本経済新聞社 エンジニア採用事務局

Other Decks in Technology

Transcript

  1. #nikkei_tech_talk 自己紹介  3 • Osamu Takayasu • 2015年中途入社 • API-Backendチーム兼技術企画G

    所属 • 5時おき&在宅勤務で朝活が充実 ◦ 筋トレ・ラン・読書・英語・Podcast
  2. #nikkei_tech_talk Client システム概要図 5 iOS/Android iOS/Android Web ・・・ CDN BFF

    API Backends API Gateway Nikkei App Paper Viewer BFFs ・・・ Nikkei ID Payment Search Paper Image ・・・ CMS Message (Mail/Line /Push) Data Ads ・・・
  3. #nikkei_tech_talk 記事をユーザーに届けるまで 11 CMS群 CMS 編集ツール 記事格納システム parse CMSのAPIから取得した JSONをS3に保存。メタ

    データの付与、変換処理 をして”Article”に変換に してRDBに保存 feed “Article”をElasticsearch 用のJSONに変換し、メタ データをつけて返却する API Elasticsearch 記事 企業情報 imgIX(CDN) S3 記事 メタデータ 画像 画像用proxy SearchAPI SearchAdmin APIGW BFF 同義語辞書 CDN
  4. #nikkei_tech_talk 記事データを紹介 12 • 記事データは約400項目 ◦ title, body, display_time, images,

    … • 電子版の創刊から12年かけて継ぎ足されている ◦ 「表示する媒体や画面別の表示用データ」 ◦ 「表示する媒体や画面別の記事を選択する検索用データ」 ◦ 「保存可・不可など制御用」など
  5. #nikkei_tech_talk 記事データに関する課題 13 • 記事データを管理しきれていない • 主な原因 ◦ サーバーサイドで記事データを作るが、クライアント側の 使われ方を知る機会が少ない

    ◦ 電子版Web、アプリ以外に様々なクライアントがいる ◦ 記事データを作成・編集する関係システムが、 CMS/API-Backend/BFF と複数ある
  6. #nikkei_tech_talk 記事データのvalidation 14 CMS群 CMS 編集ツール 記事格納システム parse CMSのAPIから取得した JSONをS3に保存。メタ

    データの付与、変換処理 をして”Article”に変換に してRDBに保存 feed “Article”をElasticsearch 用のJSONに変換し、メタ データをつけて返却する API Elasticsearch 記事 企業情報 SearchAPI SearchAdmin APIGW BFF 同義語辞書 CDN • 赤線の記事データを受け渡す境界でvalidateしたい • validationを実装、整備中 ◦ rest_frameworkやjsonschemaを利用 • エラーを検知してslackに通知したり、ログ送信したりしてデー タの確認、及び修正対応
  7. #nikkei_tech_talk 手積みシステム 17 ES 記事 企業情報 S3 記事 メタデータ 画像

    SearchAPI APIGW BFF CDN CMS群 CMS 手積み システム 記事の並び順定義ファイルを取得
  8. #nikkei_tech_talk その他の記事表示ロジック 18 • AI推薦 ◦ 協調フィルタリングやランキングなどを用いた記事レコメンド • MyNews ◦

    ユーザーが登録した条件に応じた記事一覧 • ユーザー検索 ◦ 同義語辞書、重複記事排除、クエリ変換、企業データ付与 • 分類ごと(ex: 経済/マーケット/地域...)の記事一覧表示ロジック
  9. #nikkei_tech_talk アクセス・配信の規模感 20 • 月間2億PV • API基盤へのアクセス: 2,500 req/sec •

    Push ◦ 数十万~数百万ユーザー宛 ◦ Push通知直後のアクセス: 数万 req/sec
  10. #nikkei_tech_talk 負荷を捌く工夫 21 • 稼働インスタンス数: 全体で300台以上 ◦ API基盤は約60台 • CDNのキャッシュヒット率は80~90%程度

    ◦ JWTを利用したFastlyレイヤーでの権限判定 ◦ 記事更新時のタイムリーなcache purge ◦ Pushによるspike時は個人別のデータアクセスを減らす
  11. #nikkei_tech_talk 日経のイメージ 23 • 日経 = エンジニアリング のイメージはまだなさそう • カジュアル面談でお話すると、「こんなに内製開発していると

    は思っていなかった」というお声をいただく • 入社した後でさえ「こんなに内製開発・・(以下略」
  12. #nikkei_tech_talk 内製開発とは 24 • 開発チームが以下の構成 ◦ チーム全員が社員か、一部が準委任契約の社外メンバー • なぜ/何を/どうやって開発するかを社員が意思決定 •

    エンジニアが事業ドメインを理解し、能動的に動ける • 内製開発ではない例 ◦ 社員のコードレビューなしにソースコードがマージされる ◦ 請負開発で社員は要件定義のみ。コードは書かない
  13. #nikkei_tech_talk 日経での内製開発 25 • 日経電子版では内製開発を実施 • エンジニアの関わり方 ◦ 企画/調査・データ分析/要件定義/設計/開発/テスト ◦

    各人のモチベーション・スキル・状況に応じて、上記の全 部もしくは一部に携わる ◦ 1on1などでコミュニケーションしながら進める