Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

手が足りない!兼業データエンジニアに必要だったアーキテクチャと立ち回り

Avatar for zinkosuke zinkosuke
November 30, 2025

 手が足りない!兼業データエンジニアに必要だったアーキテクチャと立ち回り

アーキテクチャConference 2025 (https://architecture-con.findy-tools.io/2025) での登壇資料です。

「データドリブン」が当たり前になった現代。クラウドやSaaSが日々進化していますが、データ基盤開発にはまだまだ泥臭い作業がつきものです。データエンジニアが1人しかいない、SREが兼業でやっている──そんなリソース不足の現場でどのようにデータ活用を推進するのか。本セッションでは、弊社サービス「Liny」で構築したログ・データ基盤について失敗談や今後の展望を添えてお話しいたします。

Avatar for zinkosuke

zinkosuke

November 30, 2025
Tweet

Other Decks in Programming

Transcript

  1. 2 ©Social Databank, Inc. 自己紹介 神 光佑 / zinkosuke ソーシャルデータバンク株式会社

    技術本部 エンジニアリング部 プラットフォーム課 課長 川下り (ラフティング) 未経験からSES (オラクルとエクセル) フリーランス freee (データ基盤チーム) ソーシャルデータバンク (SRE) 2015年 ~ 2016年 ~ 2018年 ~ 2021年 ~ 2023年 ~
  2. 3 ©Social Databank, Inc. 自己紹介 神 光佑 / zinkosuke ソーシャルデータバンク株式会社

    技術本部 エンジニアリング部 プラットフォーム課 課長 川下り (ラフティング) 未経験からSES (オラクルとエクセル) フリーランス freee (データ基盤チーム) ソーシャルデータバンク (SRE) 2015年 ~ 2016年 ~ 2018年 ~ 2021年 ~ 2023年 ~
  3. 12 ©Social Databank, Inc. 数字で見る 8740 万人 総友だち数 21428 件

    契約アカウント数 2億 6395万通 月間送信メッセージ数 ※2024年9月時点 0.61 2.10 4.62 10.10 17.21 18.99 19.73 1期 2期 3期 4期 5期 6期 7期 売上推移(億円) (OEM含む)
  4. 13 ©Social Databank, Inc. • ECS ◦ サービス数 約100 (約500タスクが常駐)

    ◦ 1日に出るログの量 約2TB • Aurora MySQL ◦ スナップショットのサイズ 約60TB (2クラスター合計) ◦ 最大数百億レコード • DynamoDB ◦ テーブル数 約40 ◦ 最大数百億レコード (約30TB) • Elasticache Redis ◦ クラスター数 約20 システムの規模
  5. 24 ©Social Databank, Inc. • 任意のタスクを個別で実行できるように ◦ 1つのタスクで1つのことをやる ◦ 「ここだけ直したい」を実現

    • Use Caseを切り離す ワークフローエンジンに依存しない 手オペで苦しまないための設計
  6. 28 ©Social Databank, Inc. • 再実行を前提にする • 冪等性があっても、無駄な再計算は避ける • 上書き対象を指定可能にする

    • 取り直せないデータは上書き禁止を明示する スキップ・上書きのオプションを用意する 手オペで苦しまないための設計
  7. 31 ©Social Databank, Inc. 日付は「期間」として受け取る • 日付の条件はfromとtoで指定する • 以下のような条件は柔軟性が低下 ◦

    dt = ‘YYYY-MM-DD’ のような等価比較 ◦ INTERVAL ‘1’ HOUR のような固定の期間 • 一括処理しやすくする (常に正解とは限らない) 手オペで苦しまないための設計
  8. 34 ©Social Databank, Inc. • 最小権限の手オペ用ロールを用意する • 「もう取れないデータ」を保護する ◦ 取り直せないデータはバケットを分離

    ◦ バージョニング • よくある作業はワークフローとして用意する 手オペミスに備える 手オペで苦しまないための設計
  9. 39 ©Social Databank, Inc. • データエンジニア経験者は自分だけ • Python経験者は社内で数人 • AWSを日常的に触っていないメンバーも多い

    • 自分を含め、Kubernetes本番運用経験はない • いつか来る仲間も、おそらく兼業になる 私の状況はこんな感じでした 引き継ぎ先を確保できない
  10. 40 ©Social Databank, Inc. • 「手オペで苦しまないための設計」が活きる! ◦ 1つのコマンドとして実装できる • シンプルなワークフローエンジンを選ぶ

    • 開発がローカルで完結しない問題への対応 いつかくる仲間に優しい設計 覚えることをできるだけ減らす
  11. 43 ©Social Databank, Inc. 開発がローカルで完結しない問題への対応 • クラウド環境を全く使わずに開発は難しい • 手元のコンテナからAWSを触る? ◦

    環境の切り替えを楽にしたい • 開発・検証環境は有限 ◦ 環境の譲り合いによる待ち時間を避けたい いつかくる仲間に優しい設計
  12. 54 ©Social Databank, Inc. • 基盤がある程度整ったら「対人」がメイン ◦ 利用者に伴走してデータの価値を体感してもら うことが重要 •

    要望が多い == データが活用されている! • 最終的にはデータのセルフサービス化 ◦ 多様なデータの出口 理想 データの民主化は永遠に
  13. 55 ©Social Databank, Inc. • 基盤がある程度整ったら「対人」がメイン ◦ 利用者に伴走してデータの価値を体感してもら うことが重要 •

    要望が多い == データが活用されている! • 最終的にはデータのセルフサービス化 ◦ 多様なデータの出口 現実 データの民主化は永遠に 手が足りませんでした
  14. 56 ©Social Databank, Inc. • 存在のアピールとSQL書ける人口を増やす • BIとしてのスプレッドシートを受け入れる ◦ “スプシ運用”のコストを下げる

    • Redashの先のBIを決める (WIP) • メタデータで生成AIに備える 手が足りないなりにできることは? データの民主化は永遠に
  15. 60 ©Social Databank, Inc. • セールスチームは多少リッチなBIよりスプレッド シートを求めている (説) • 自由度の高さは魅力

    BIとしてのスプレッドシートを受け入れる データの民主化は永遠に このCSV、毎週出してほしいです!
  16. 64 ©Social Databank, Inc. • BIを変えるだけではデータは民主化されない ◦ 見た目や細かな使い心地は重要 ◦ 権限管理

    • AIとの親和性を考えていきたい ◦ SQLを書かない世界 Redashの先のBIが決まらない データの民主化は永遠に
  17. 67 ©Social Databank, Inc. • メタデータ拡充は必須 ◦ カラムの説明だけではもう足りない ◦ ドキュメントやコードベースも管理の対象

    • メタデータを集約し、人間や生成AIが簡単に使え るハブが必要 ◦ SageMaker(旧Datazone)?Openmetadata? メタデータで生成AIに備える データの民主化は永遠に
  18. 69 ©Social Databank, Inc. まとめ ★★★★★ ワークフローエンジンに依存しない ★★★★☆ スキップ・上書きのオプションを用意する ★★★★☆ 日付は「期間」として受け取る ★★★★★ 手オペミスに備える ★★☆☆☆ シンプルなワークフローエンジンを選ぶ

    ★★★☆☆ Merge Compose filesで環境を明示する ★★★★☆ 実験用データベースを用意する ★★★☆☆ dbtのprofileで環境を明示する ★★★☆☆ dbtのテーブル名にプレフィックスをつける ★★★★★ 存在のアピールとSQL書ける人口を増やす ★★★☆☆ BIとしてのスプレッドシートを受け入れる ★★☆☆☆ Redashのクエリ結果をスプシに連携する ★★★★☆ メタデータで生成AIに備える 手オペで苦しまないための設計 いつかくる仲間に優しい設計 データの民主化は永遠に