Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
法人データの取得と活用 #kazaneya / 20230425
Search
風音屋 (Kazaneya)
PRO
April 25, 2023
Research
4
1.3k
法人データの取得と活用 #kazaneya / 20230425
風音屋30分リサーチ#1「法人データの取得と活用」の資料となります。
法人データ利用を検討する際の参考資料としてご活用ください。
風音屋 (Kazaneya)
PRO
April 25, 2023
Tweet
Share
More Decks by 風音屋 (Kazaneya)
See All by 風音屋 (Kazaneya)
大学生はAIをどう活用しているのか? 次世代人材に向けたテクノロジー教育最前線 #devsumi / 20240216
kazaneya
PRO
3
2.5k
アナリティクスエンジニアのキャリアとデータモデリング 〜資料「30分でわかるデータモデリング」を読む前に知ってほしいこと〜 / 20240116
kazaneya
PRO
15
6.2k
データマネジメント入門 - DX推進を支えるデータ基盤の重要性 / 20240125
kazaneya
PRO
12
3.6k
2023サンフランシスコ出張報告 〜ダッシュボードが自動生成される時代に、 データ人材に求められる働き方を考える〜 #DataEngineeringStudy / 20231212
kazaneya
PRO
6
4k
データ分析の授業における Google Cloud の活用事例 #GoogleCloud #GoogleCloudNext / 20231116
kazaneya
PRO
2
770
300万テーブルのデータ流通を支えるエンジニアリング #GoogleCloud #GoogleCloudDay / 20230523
kazaneya
PRO
12
5.4k
風音屋TechTalk#4 ChatGPTを業務利用しているデータエンジニア3名の座談会 #kazaneya / 20230426
kazaneya
PRO
4
1.9k
デジタル庁が手がける データ標準とオープンデータ / 20230118
kazaneya
PRO
3
350
メタデータ・マネジメント入門 / 20221205
kazaneya
PRO
5
3.2k
Other Decks in Research
See All in Research
文化が形作る音楽推薦の消費と、その逆
kuri8ive
0
200
ニューラルネットワークの損失地形
joisino
PRO
36
18k
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
4
770
Weekly AI Agents News! 11月号 プロダクト/ニュースのアーカイブ
masatoto
0
200
クロスセクター効果研究会 熊本都市交通リノベーション~「車1割削減、渋滞半減、公共交通2倍」の実現へ~
trafficbrain
0
290
Human-Informed Machine Learning Models and Interactions
hiromu1996
2
520
Tietovuoto Social Design Agency (SDA) -trollitehtaasta
hponka
0
3k
尺度開発における質的研究アプローチ(自主企画シンポジウム7:認知行動療法における尺度開発のこれから)
litalicolab
0
360
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
250
20241115都市交通決起集会 趣旨説明・熊本事例紹介
trafficbrain
0
700
最近のVisual Odometryと Depth Estimation
sgk
1
310
【NLPコロキウム】Stepwise Alignment for Constrained Language Model Policy Optimization (NeurIPS 2024)
akifumi_wachi
2
220
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Raft: Consensus for Rubyists
vanstee
137
6.7k
Gamification - CAS2011
davidbonilla
80
5.1k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
0
94
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Speed Design
sergeychernyshev
25
670
Imperfection Machines: The Place of Print at Facebook
scottboms
266
13k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
8.3k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Building Applications with DynamoDB
mza
91
6.1k
Transcript
法人データの取得と活用 2023-04-25 *オリジナル資料は2022年に作成 株式会社風音屋 横山翔(@yuzutas0 / ゆずたそ) 風音屋30分リサーチ #1
免責事項 ・本資料の利用により発生したいかなる損害に対しても資料作成者はその責任を負いかねます。 ・社名が提示されていないケーススタディやシステム構成については、 原則的に複数企業の事例を踏まえたダミー情報となります。 特定企業の情報公開や称賛・批判を意図するものではありません。 ・用語やツールの紹介は厳密ではありません。 ご自身や所属チームでの理解・解釈が紹介内容と異なる場合は、適宜読み替えていただけると幸いです。 ・本資料に記載されている会社名・製品名などは、一般に各社の登録商標または商標、商品名です。 資料内では ©,
®, ™ マーク等は省略させていただいております。 2 (要するに)ケチつけないでね& お互いにルールを守ろうね
横山翔(@yuzutas0 / ゆずたそ) 風音屋 代表取締役 慶應義塾大学にて金融・計量経済学を専攻。リクルートやメルカリにてデータ活用を推進、外資ITを経て、現職。 広告配信の最適化や店舗営業のインセンティブ改善など、データ分析によって数億円規模のインパクトを創出。 100社のデータ経営を実現して各産業の活性化に貢献すべく日々奮闘中。 3 主な登壇・発表 ・Pythonのカンファレンス
PyCon JP 2017 ベストトークアワード優秀賞 ・翔泳社主催 Developers Summit 2018 Summer ベストスピーカー賞 ・Google主催 Google Cloud Day 2021 ・日本統計学会 第16回春季集会 主な執筆・出版 ・ITmedia「データ基盤 大解剖」(連載記事) ・技術評論社『実践的データ基盤の処方箋』 ・技術評論社『Software Deign 2020年7月号 - ログ分析特集』 ・『データマネジメントが30分でわかる本』
風音屋を支えるアドバイザー制度 ・お客様:気軽に相談するだけで多くの知見が集まり、最短で困りごとを解決できる。 ・風音屋:専門家を招集することで、課題解決の速度と品質を向上しながら、自社のノウハウを強化する。 ・専門家:副業感覚で気軽に参加して自分の考えを述べる。他の専門家の考えを聞くことで学びになる。 専門書の著者、技術コミュニティの運営者、GoogleやAmazonの出身者など。NDA締結済み。 4 困りごと 依頼主 議題 議題
議題 風音屋 気軽に相談 論点を分解 依頼者を匿名化 議題 専門家 スケジュールとテーマが マッチした議題に参加 ↓ ノウハウ提供や ディスカッション ↓ 互いの希望がマッチする場合は 追加調査・開発を一部委託 気軽に相談 支援を募集
「風音屋30分リサーチ」とは 5 本格的なリサーチには 金額、期間、労力が必要 方向性を決めるだけなら 2割の情報で十分かも… 詳しい人たちにカジュアルに質問して、その回答をスライドにまとめたら 全員のトータル時間「30分」でそれっぽい資料ができるのでは? コスト リターン
解決案 ・TakeだけでなくGiveを意識:協力者に完成資料を優先提供 + 可能な範囲で外部公開して社会に還元 ・あくまで参考資料に留めるべき:風音屋と接点のない専門家や会社の意見を取り込みにくいため 注意事項
今回のお題:法人データの取得と活用 6
協力 ・臼井 琴美:一般社団法人 日本データマネジメント・コンソーシアム(JDMC) 事務局 ・北野 信高:株式会社帝国データバンク 営業企画部 課長 ・辻中 仁士:株式会社ナウキャスト 代表取締役CEO
・長谷川 亮:デジタル庁 デジタル社会共通機能グループ(風音屋アドバイザー) ・山田 直史:コミュニティ BQ Fun 運営(風音屋アドバイザー) ・前側 将:コミュニティ BIツール研究所 運営(風音屋アドバイザー) ・竹信 瑞基:株式会社風音屋 代表取締役(共同代表) ※順不同・敬称略 ※2022年の資料作成当時のプロフィール情報となります。 7
目次 • 法人データの取得と活用の全体像 • 法人データの活用について ◦ 法人データによって実現できること ◦ 活用例:メールアドレスから企業名を自動反映 •
法人データの取得について ◦ 公共機関によるデータ提供 ◦ 民間企業によるデータ販売 ◦ 名寄せのID ◦ システム構成例 8
法人データの取得・活用の全体像 社内データだけではなく社外データを掛け合わせることで法人マスタを作り、 様々なデータ活用施策に展開することができる 9 社内データ 社外データ 法人マスタ データ活用 データ活用 データ活用
法人データによって実現できることの例① 【営業、マーケ】 ・状況分析&アプローチで使われることが多い。 ・例:市場視点/自社視点でのホワイトスペース分析。参入エリアやカテゴリの検討、接触シェアの推定。 ・例:ターゲットリスト作成。ターゲット選定。リード顧客のランク判定。 ・主に、市場分析では産業系レポートを中心に参照し、販売計画への接続時に個社データを参照する。 【カスタマーサポート】 ・顧客企業の財務や人事異動にもとづく個別サポート提供が可能となる。 【法務】 ・法人間での契約時における信用調査が典型的なユースケース。
・金融や不動産といった事業領域では、評点による与信調査が行われている。 10
法人データによって実現できることの例② 【経理】 ・法務と同じく、取引先管理での用途がメイン。 ・今だとインボイス制度の対応がホット。 【購買】 ・取引関係のデータがあれば、競合の商流を参考にして、仕入れ先の開拓&交渉を行える。 【顧客提供システム】 ・入力されたメールアドレスから所属企業名を自動で反映。次ページでサンプルを紹介。 【社内業務システム】 ・MDM(マスターデータ管理)の構築・導入や、上記で紹介してきた各作業を自動化するために利用。
・取引先データを名寄せするには整理された法人データが必要となる。 ・取引先データの親子関係を紐付けて連結与信を行う、グループ会社のランク判定を変える、など データがリッチになるとシステムで実現できることは増える。 11
活用例:メールアドレスから企業名を自動反映 Forcasの資料請求ページ(https://www.forcas.com/document/ ) 12
公共機関によるデータ提供の例① 【国税庁 法人番号公表サイト】 ・国内企業におけるマスターデータの拠り所と言える。 ・主に「法人番号」「本店所在地」「商号または名称」が結合キーとなる。 ・あくまで国内データなので海外企業との取引がある場合は別途データ整備が必要となる点に注意。 ・WebAPIで履歴を含めて無料で取り放題。不祥事後に社名変更で信用調査をすり抜けようとするケースや 契約当時の旧社名が社内データベースに残っているケースなど、履歴が必要な場面があるので助かる。 ・デジタル庁のレジストリカタログサイトにて、CSV形式(UTF-8)で一括ダウンロード可能。 https://catalog.registries.digital.go.jp/rc/dataset/
【経産省 gBizINFO】 ・決算公告(官報)と連携し、法人に紐づく資格や特許等を公開している。 ・公的な情報に限られているため、営業や販促の用途に対して、必ずしも網羅性は高くない。 ・truestar社がSnowflakeのMarketplaceで分析しやすい形式のデータを再配布している。 ・BQ FUNがBigQueryのAnalyticsHubで分析しやすい形式のデータを再配布している。 データの取得/加工処理はオープンソースとしてGitHubにて公開されている。 (別のDWHで分析する場合のSnowflakeやBigQueryの位置付けは後ページで解説) 13
公共機関によるデータ提供の例② 【EDINET】 ・有価証券報告書を閲覧できる。 ・あくまで証券市場向けの情報で、営業や販促の用途に対して、必ずしも網羅性は高くない。 ・バフェットコードがデータを整形して販売している。 ・デジタル庁のレジストリカタログサイト(前頁)にて、XBRL形式で一括ダウンロード可能。 【日本年金機構 事業所検索システム】 ・事業所単位で保険の加入状況を参照できる。 ・決算とは別の視点で企業規模や状態を推定できる。
・雇用状況を把握するための参考情報の1つ。 ・あくまで保険の加入状況であり、雇用形態によっては人数にカウントされない点に注意。 ・意図的にデータ統合や横断集計ができない作りになっている。 【RESAS(地域経済分析システム)】 ・地域や産業単位でのマクロ統計を参照可能。 ・RESASのマクロ統計と本社取引データを元に、事業所単位の取引データを推定している研究事例もある。 ・例:筑波大学、帝国データバンク https://www.tdb.co.jp/knowledge/trading/new10.html 14
公共機関によるデータ提供の例③ データカタログ横断検索システム 15 風音屋TeckTalk #3「デジタル庁のデータ標準やオープンデータの民間活用を考えよう」登壇資料
民間企業によるデータ販売の例① 独自のカテゴリ分けや付加情報を売りにしているケースが多い。 【NTTタウンページ】 ・800万社の企業情報を独自に収集。店舗名、ジャンル、電話番号、URLなど。 ・店舗やクリニックなどローカルなデータが豊富。電話番号の取得時にデータが登録される。 ・対象地域を限定してデータ購入することを想定しているように見える。 【東京商工リサーチ】 ・400万社の企業情報と与信向けの評点を保有している。 ・中小/零細企業にも強いというブランドイメージを築いている。 【帝国データバンク】
・国内シェア1位の信用データベースで、120年間の調査実績がある。 ・調査員が現地訪問や電話で146万社を定期的に調査し、取引銀行や得意先まで確認している。 ・近年は倒産予測だけではなく成長予測や商流推計にも注力している。 上記3社のデータは、次ページ以降のSaaSにバンドルされているケースもある。 16
民間企業によるデータ販売の例② 【FORCAS】 ・法人番号、会社HP情報、メールアドレスのドメインといった情報を取得できる。 ・Salesforceと連携して利用している企業が多い。 【ユーソナー(旧ランドススケイプ)】 ・企業の業種や売上高に加えて、法人ごとのIPアドレスをマスタ化している。 ・CRM、SFAといった周辺サービスとの連携を売りにしている。 【リスクモンスター】 ・与信管理や営業支援サービスを提供。 ・他の大手に比べて安価で、データを取り放題できるプランもある。
・全件を取得してデータ結合するのは難しいが、検索条件次第で個別に名寄せできるケースあり。 【Quick】 ・50年分の企業情報(特に決算書)を抑えており、日経平均株価の算出に用いられている。 ・個々の企業を見るためのデータなので、時系列やエリア別など、横断での集計が苦手。 17
民間企業によるデータ販売の例③ 【ゼンリン】 ・地図情報に紐付いている。 ・建物や建物内のテナントごとにIDが発番されている。 ・面積や路線価を組み合わせることが可能。 【Sansan】 ・名刺やメール署名など人事情報データとの紐付けが可能で、担当者レベルの顧客管理を実現できる。 ・名刺を教師データとした名寄せエンジンを提供している。用途特化だがデータソースとしては強力。 ・インボイス対応や帝国データバンクとの連携など、ユーザーが欲しい施策を着実に実施している。 【musubu】
・法人営業に特化したサービスで、営業管理機能やメール配信機能を備えている。 ・各企業の支店データも存在しているのでDMにも使いやすい。 【HRogリスト】 ・100以上の求人サイトから毎週データを取得している。 ・求人募集情報による絞り込みに加えて、採用媒体への出稿金額まで予測している。 18
民間企業によるデータ販売の例④ 【Pacific Epoch】 ・snowflakeのmarketplaceに日本のクレジットカード利用データを提供している。 ・上場企業の銘柄コードが結合キーとなる。 ・ボタン1つでリクエストできるが、そこから契約交渉が始まるので、気軽に使えるわけではない。 【各カード会社、ナウキャスト】 ・クレジットカード利用のデータを提供している。 ・ローデータ提供のケースは少なく、業種別統計等の提供がメイン。 【Dun
& Bradstreet (D&B)】 ・グローバル大手。世界の企業を一意に識別できる企業コード「D-U-N-S Number」を開発・管理。 【クレディセイフ、エクスペリアン】 ・グローバル大手。海外企業の調査データを提供している。 19
名寄せのID 主に国内企業では法人番号、グローバルではD-U-N-S Numberを使うのが一般的と言える。 【法人番号】 ・日本国内の法人を一意に識別できる13桁の番号。国税庁が指定、公表、通知。 ・地方公共団体や人格のない社団・財団であっても各届出書の提出時に発番される。 【D-U-N-S Number】(参考: https://www.tsr-net.co.jp/service/online/get-a-duns-number/index.html) ・世界の企業を一意に識別できる9桁の企業コード。Dun
& Bradstreet (D&B) が開発・管理。 ・日本企業については東京商工リサーチが管理し、約400万社に発番している。新規申請は有料。 ・国際連合(UN/EDIFACT)、国際標準化機構 (ISO)、欧州委員会 (EDIRA)等で利用されている。 ・WEBサービス開発会社だと、Apple Developerへの法人登録時に求められる。 20 法人番号 ・日本企業 ・530万件 D-U-N-S Number ・グローバル ・4億件 400万件 400万件
構成例:SnowflakeやBigQuery経由でデータを統合する SnowflakeやBigQueryでオープンデータや外部データを入手し、別のDWHで分析する場合、 SnowflakeやBigQueryはデータソースの入手経路の1つに位置付けられる 21 データ活用 データ活用 データ活用 経産省 gBizINFO ◯◯銀行
為替データ Google Analytics Snowflake BigQuery 自社DB S3 データソース 入手経路* ・システム構成によっては Staging Areaや踏み台サーバと呼ぶこともある。 ・グローバルではこの層のストレージ( S3等)をデータレイクと呼ぶ。 例:レイクハウスアーキテクチャにおけるデータレイクは主にここを指す。 データレイク層 データマート層 自社のデータ基盤
構成例:MDMを経由して法人データを利用する 基幹システムとデータ分析環境の両方で使うような場合は、 MDM(マスターデータ管理)システムを経由して各システムに連携する。 22 国税庁 法人番号一覧 MDMシステム 基幹システム 分析システム 配布用
データ オリジナル 保存 経産省 gBizINFO MDMについては『データマネジメントが30分でわかる本』を参照。 例: ・MDM製品を新規に導入する ・社内向けの管理システムを構築する ・S3などのストレージをマスタデータの置き場とする ・スプレッドシートで配布する
まとめ:法人データの取得・活用の全体像(再掲) 社内データだけではなく社外データを掛け合わせることで法人マスタを作り、 様々なデータ活用施策に展開することができる 23 社内データ 社外データ 法人マスタ データ活用 データ活用 データ活用
データ人材を積極採用中! 一緒に法人データを活用していきましょう。 お手本となるような成功事例を作って登壇・出版を目指せる環境です。 24 データアナリスト データエンジニア データコンサルタント 法人データを マーケ分析に活かして ビジネス成長を
加速させましょう! 法人データを システムに自動連携して 世の中から非効率な業務を 撲滅させましょう! 法人データの 活用プロジェクトを 立案・推進して 成功に導きましょう!
資料作成の助っ人、求む! ・外部に発信できていない資料やノウハウが、まだまだ社内に山積みです。 ・資料作成&情報発信を手伝ってくださる方(副業・フリーランス可)を募集しております。 ・記事「ゆずたそ流スライドデザインTips集」をベースに、スキルアップできるようレビューします。 25