Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
データ横丁
January 23, 2026
270
0
Share
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
遠藤尚也/ノーテック企業でデータのこと全般
データ横丁
January 23, 2026
More Decks by データ横丁
See All by データ横丁
データモデリング通り #5オンライン勉強会: AIに『ビジネスの文脈』を教え込むデータモデリング
datayokocho
0
340
第6回(最終回) 「メタデータ通り」 リアル開催
datayokocho
1
180
第5回 メタデータ通り_オンライン 検討会
datayokocho
0
30
【みずたに】情報とは何か
datayokocho
0
330
データ横丁・新年LT大会:ご発表者、ご参加者へのご案内
datayokocho
0
910
第4回 「メタデータ通り」 リアル開催
datayokocho
0
220
第3回 「メタデータ通り」 Zoom開催
datayokocho
0
40
第2回 メタデータ通り#1Meetup _資料
datayokocho
0
310
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
510
Featured
See All Featured
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2.1k
Leo the Paperboy
mayatellez
7
1.8k
WENDY [Excerpt]
tessaabrams
11
38k
The Curse of the Amulet
leimatthew05
1
13k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
How to Think Like a Performance Engineer
csswizardry
28
2.6k
Prompt Engineering for Job Search
mfonobong
0
330
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
430
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
KATA
mclloyd
PRO
35
15k
Abbi's Birthday
coloredviolet
2
7.9k
Transcript
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~ 遠藤尚也/ノーテック企業でデータのこと全般 データ横丁・新年 LT大会 2026 ~
所属先:某ノーテック企業(エンジニアもデザイナーもいない) 事業内容:医療用機器の輸出入、卸売および販売、研究開発および製造 理化学機器の輸出入、卸売および販売、研究開発および製造 上記機器のメンテナンス業務 美容器具の輸出入、卸売および販売、研究開発および製造 医薬部外品、化粧品の卸売および販売、研究開発および製造 医療用施設内テレビ用コンテンツ配信業務 1/14 データ横丁・新年 LT大会
2026 ~
化石は簡単に嘘をつく 2/14 データ横丁・新年 LT大会 2026 ~
この3体の恐竜の共通点って何だと思いますか? 3/14 データ横丁・新年 LT大会 2026 ~ mesozoniaオリジナルイメージ(https://mesozonia.com/iguanodon-fukugemmisu/)
同じ化石から作られた復元図 4/14 データ横丁・新年 LT大会 2026 ~
「化石は簡単に嘘をつく」理由 ①記録の不完全性:地球上の生物のごく一部しか化石と して残らない。 ②解釈の難しさ:発見された化石の断片から生物全体の 姿や生態を推測するのは容易でない。 ③堆積学的・地質学的プロセス:化石は形成された後、 地殻変動や浸食などによって破壊されたり、元の場所か ら移動したりすることがある。 5/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく!? 6/14 データ横丁・新年 LT大会 2026 ~
私の日常 その① 分析するデータがない。 データマイニングする前にデータ自体をマイニングしないといけない。 7/14 データ横丁・新年 LT大会 2026 ~
私の日常 その② 基幹システムからダウンロードしたデータにユニークキー(主キー)がない。 同じ顧客に複数のコードが採番されているし、まとめる親コードもない。 8/14 データ横丁・新年 LT大会 2026 ~ 出庫先コード
出庫先名 SH-33834 (医)◦◦◦皮ふ科CL SH-A4464 (医)◦◦◦皮【XT】 SH-24464 (医)◦◦◦皮ふ科CL 得意先コード 得意先名 T-A4424 ••••皮ふ科【XTRAC】 T-24424 ••••皮ふ科 T-04424 ••••皮ふ科【振替】 ※データはダミーです。
どうなって目の前のようなカタチで残ったのか? ↓ 現在の社内の人間の言動を観察する ↓ データの成り立ちを推測する ↓ 分析に必要な要素を補う 9/14 データ横丁・新年 LT大会
2026 ~
基幹システムのデータを観察して気づいたこと/解決策 ・注文単位での区別がしやすい ・顧客が複数のマスタに紐付いている ・1回の注文では、同じ顧客マスタが使われている ↓ 『注文された製品が指定の場合に届いて請求にまわる』 ことが最優先 ↓ 個々の注文を超えて紐付けるマスタデータの整備が必要 10/14
データ横丁・新年 LT大会 2026 ~
まとめ データのクセは、組織の価値観の写し鏡 ⚫FAXからの入力ミスも、名寄せの放棄も、そのとき に現場が最優先した仕事が作ったカタチ ⚫データの歪みは「欠陥」ではなく、そのデータを生 み出した組織の優先順位の記録 ⚫「正しい」カタチのデータを上書きするのではなく、 “何を守ってきたか”を理解してクリーニングする 11/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく? ↓ 私たちの思い込みが騙らせる & データは簡単には語らない 12/14 データ横丁・新年 LT大会 2026 ~
もしもノーテック企業がユーザーになって Garbage のようなデータを in してきても 彼らには悪気も敵意も邪心もありません。 なので使えるデータをすくい取るだけでなく 価値観も汲み取ってもらえるとうれしいです。 13/14 データ横丁・新年
LT大会 2026 ~
Garbage in, garbage out. Yet one person’s garbage is another
person’s GOLD. 14/14 データ横丁・新年 LT大会 2026 ~