Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ディープラーニングを推さない ハカルスやり方
Search
Hacarus Inc.
September 14, 2018
Programming
0
1.5k
ディープラーニングを推さない ハカルスやり方
•ハカルスがディープラーニングを推さない理由
• スパースモデリング紹介
• データサイエンティストとソフトウェア開発者引き 継ぎ
Hacarus Inc.
September 14, 2018
Tweet
Share
More Decks by Hacarus Inc.
See All by Hacarus Inc.
GitLab CI/CD で C#/WPFアプリケーションのテストとインストーラーのビルド・デプロイを自動化する
hacarus
0
1.2k
QA4AIに則ったMLOpsツールの活用
hacarus
0
680
0から協働ロボット外観検査システムを3ヵ月で具現化した軌跡
hacarus
0
240
ワンちゃんの健康を願う皆様に送る 犬心電図AI解析プロダクト紹介_AWS DevDay2022
hacarus
0
190
犬の心電AI解析プロダクト開発奮闘記 _クラウドからハード開発までてんこ盛り
hacarus
0
1.7k
ExplainableAIの概要とAmazon SageMaker Clarifyでの実装例
hacarus
0
970
AWS Step Functions を用いた非同期学習処理の例
hacarus
0
1.2k
Dashでmyダッシュボードを作ろう ーpytrendsで見るコロナの感染拡大時期ー
hacarus
0
1.4k
Interpretable Machine Learning: モデル非依存な解釈手法の紹介
hacarus
0
1k
Other Decks in Programming
See All in Programming
CEDEC 2025 『ゲームにおけるリアルタイム通信への QUIC導入事例の紹介』
segadevtech
3
970
Constant integer division faster than compiler-generated code
herumi
2
690
KessokuでDIでもgoroutineを活用する / Go Connect #6
mazrean
0
110
兎に角、コードレビュー
mitohato14
0
150
TanStack DB ~状態管理の新しい考え方~
bmthd
2
330
CSC305 Summer Lecture 06
javiergs
PRO
0
100
LLMOpsのパフォーマンスを支える技術と現場で実践した改善
po3rin
8
980
私の後悔をAWS DMSで解決した話
hiramax
4
130
Terraform やるなら公式スタイルガイドを読もう 〜重要項目 10選〜
hiyanger
13
3.2k
Scale out your Claude Code ~自社専用Agentで10xする開発プロセス~
yukukotani
9
2.6k
STUNMESH-go: Wireguard NAT穿隧工具的源起與介紹
tjjh89017
0
380
コンテキストエンジニアリング Cursor編
kinopeee
1
700
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Designing for Performance
lara
610
69k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Navigating Team Friction
lara
189
15k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
How to Ace a Technical Interview
jacobian
279
23k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
1k
Producing Creativity
orderedlist
PRO
347
40k
Testing 201, or: Great Expectations
jmmastey
45
7.6k
Statistics for Hackers
jakevdp
799
220k
Facilitating Awesome Meetings
lara
55
6.5k
Transcript
ディープラーニングを推さない ハカルスのやり方 2018-09-14 CTO Night KANSAI @ ヤフー株式会社 大阪 GFO
木虎 直樹 (きとら なおき) •株式会社ハカルス CDO •2011年頃から機械学習やデータ分析に関わる •バックグラウンド • ソフトウェアエンジニア
• インフラエンジニア
ハカルスとは • ライフサイエンス・産業分野 x AI • スパースモデリングを軸としたデータ解 析 • アドバイザー
• 東北大学・大関真之准教授 • 滋賀大学・河本薫教授
今日お話したいこと •ハカルスがディープラーニングを推さない理由 •スパースモデリングの紹介 •データサイエンティストとソフトウェア開発者の引き 継ぎ
ディープラーニングの問題 •学習に大量のラベル付きデータが必要 • 自動運転では数百万枚の画像や数千時間の動画 •大量の計算機資源が必要 • ハードウェアコストが高い • エネルギー消費量が多い •ブラックボックス
• なぜその結果が得られるのかわからない ディープラーニングの問題ではないけれど…… •コストパフォーマンス • その 1パーセントポイントの改善に意味があるか
スパースモデリング 物事のスパース性に着目してデータ構造などをモデ ル化する手法 単一のアルゴリズムではない スパース性: 物事を本質的に特徴づける要素は僅かであるという性質 x 1 + 2x
2 = 4 スパース性を仮定すれば解ける
スパースモデリングの応用例 •画像復元 •ノイズ除去 •移動体検知 •特徴量選択 •etc.
ハカルスでの事例 ドローン空撮画像による建物壁面の補修箇所の検知 (株式会社アイ・ロボティクス)
ハカルスでの事例
データサイエンティストからソフトウェ ア開発者への引き継ぎで起こる問 題
チーム構成 •データサイエンティスト • 京都 • 仙台 •ソフトウェア開発者 • フィリピン
ツール •Daily meeting, Sprint planning meeting • Google Hangouts (Meet)
• Zoom •その他のコミュニケーション • Slack • Backlog •開発 • Python • Git • Docker • Jupyter Notebook の実行環境
前提 最初にあったのは Jupyter Notebook とそれらから使 われるコード データサイエンティストはソフトウェア開発のプロ フェッショナルではない trial error
成果物
実装したアルゴリズムをどんな形で引き継ぐか •最初 • コードをコピペ •あるべき • パッケージ化 + Internal PyPI
• Git submodule
モジュールやクラス、メソッドが第三者の利用を考え られていない •ソフトウェア開発者との共同作業でリファクタリング •パッケージ化することでデータサイエンティストの 意識に変化も
パフォーマンスが考慮されていない •実機での動作を確認しやすい仕組みを作る •%prun 使ってプロファイリング
ユニットテストがない •ユニットテストを書く •テストを意識した設計に •パフォーマンスを意識するために実行時間を出力 するようにしておくのもあり
クラスやメソッドの使い方がわからない •pydoc •Jupyter Notebook で使い方を例示
今日お話したこと •ハカルスがディープラーニングを推さない理由 •スパースモデリングの紹介 •データサイエンティストとソフトウェア開発者の引き 継ぎ