Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
データ横丁
January 23, 2026
0
150
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
遠藤尚也/ノーテック企業でデータのこと全般
データ横丁
January 23, 2026
Tweet
Share
More Decks by データ横丁
See All by データ横丁
第6回(最終回) 「メタデータ通り」 リアル開催
datayokocho
0
2
第5回 メタデータ通り_オンライン 検討会
datayokocho
0
15
【みずたに】情報とは何か
datayokocho
0
220
データ横丁・新年LT大会:ご発表者、ご参加者へのご案内
datayokocho
0
780
第4回 「メタデータ通り」 リアル開催
datayokocho
0
200
第3回 「メタデータ通り」 Zoom開催
datayokocho
0
25
第2回 メタデータ通り#1Meetup _資料
datayokocho
0
280
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
420
メタデータ通りの趣旨と進め方
datayokocho
0
410
Featured
See All Featured
SEO for Brand Visibility & Recognition
aleyda
0
4.4k
Navigating Weather and Climate Data
rabernat
0
140
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
980
Google's AI Overviews - The New Search
badams
0
930
Fireside Chat
paigeccino
42
3.8k
New Earth Scene 8
popppiees
1
1.7k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Bash Introduction
62gerente
615
210k
Embracing the Ebb and Flow
colly
88
5k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.5k
Transcript
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~ 遠藤尚也/ノーテック企業でデータのこと全般 データ横丁・新年 LT大会 2026 ~
所属先:某ノーテック企業(エンジニアもデザイナーもいない) 事業内容:医療用機器の輸出入、卸売および販売、研究開発および製造 理化学機器の輸出入、卸売および販売、研究開発および製造 上記機器のメンテナンス業務 美容器具の輸出入、卸売および販売、研究開発および製造 医薬部外品、化粧品の卸売および販売、研究開発および製造 医療用施設内テレビ用コンテンツ配信業務 1/14 データ横丁・新年 LT大会
2026 ~
化石は簡単に嘘をつく 2/14 データ横丁・新年 LT大会 2026 ~
この3体の恐竜の共通点って何だと思いますか? 3/14 データ横丁・新年 LT大会 2026 ~ mesozoniaオリジナルイメージ(https://mesozonia.com/iguanodon-fukugemmisu/)
同じ化石から作られた復元図 4/14 データ横丁・新年 LT大会 2026 ~
「化石は簡単に嘘をつく」理由 ①記録の不完全性:地球上の生物のごく一部しか化石と して残らない。 ②解釈の難しさ:発見された化石の断片から生物全体の 姿や生態を推測するのは容易でない。 ③堆積学的・地質学的プロセス:化石は形成された後、 地殻変動や浸食などによって破壊されたり、元の場所か ら移動したりすることがある。 5/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく!? 6/14 データ横丁・新年 LT大会 2026 ~
私の日常 その① 分析するデータがない。 データマイニングする前にデータ自体をマイニングしないといけない。 7/14 データ横丁・新年 LT大会 2026 ~
私の日常 その② 基幹システムからダウンロードしたデータにユニークキー(主キー)がない。 同じ顧客に複数のコードが採番されているし、まとめる親コードもない。 8/14 データ横丁・新年 LT大会 2026 ~ 出庫先コード
出庫先名 SH-33834 (医)◦◦◦皮ふ科CL SH-A4464 (医)◦◦◦皮【XT】 SH-24464 (医)◦◦◦皮ふ科CL 得意先コード 得意先名 T-A4424 ••••皮ふ科【XTRAC】 T-24424 ••••皮ふ科 T-04424 ••••皮ふ科【振替】 ※データはダミーです。
どうなって目の前のようなカタチで残ったのか? ↓ 現在の社内の人間の言動を観察する ↓ データの成り立ちを推測する ↓ 分析に必要な要素を補う 9/14 データ横丁・新年 LT大会
2026 ~
基幹システムのデータを観察して気づいたこと/解決策 ・注文単位での区別がしやすい ・顧客が複数のマスタに紐付いている ・1回の注文では、同じ顧客マスタが使われている ↓ 『注文された製品が指定の場合に届いて請求にまわる』 ことが最優先 ↓ 個々の注文を超えて紐付けるマスタデータの整備が必要 10/14
データ横丁・新年 LT大会 2026 ~
まとめ データのクセは、組織の価値観の写し鏡 ⚫FAXからの入力ミスも、名寄せの放棄も、そのとき に現場が最優先した仕事が作ったカタチ ⚫データの歪みは「欠陥」ではなく、そのデータを生 み出した組織の優先順位の記録 ⚫「正しい」カタチのデータを上書きするのではなく、 “何を守ってきたか”を理解してクリーニングする 11/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく? ↓ 私たちの思い込みが騙らせる & データは簡単には語らない 12/14 データ横丁・新年 LT大会 2026 ~
もしもノーテック企業がユーザーになって Garbage のようなデータを in してきても 彼らには悪気も敵意も邪心もありません。 なので使えるデータをすくい取るだけでなく 価値観も汲み取ってもらえるとうれしいです。 13/14 データ横丁・新年
LT大会 2026 ~
Garbage in, garbage out. Yet one person’s garbage is another
person’s GOLD. 14/14 データ横丁・新年 LT大会 2026 ~