Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
Search
データ横丁
January 23, 2026
0
92
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
遠藤尚也/ノーテック企業でデータのこと全般
データ横丁
January 23, 2026
Tweet
Share
More Decks by データ横丁
See All by データ横丁
第5回 メタデータ通り_オンライン 検討会
datayokocho
0
6
【みずたに】情報とは何か
datayokocho
0
170
データ横丁・新年LT大会:ご発表者、ご参加者へのご案内
datayokocho
0
720
第4回 「メタデータ通り」 リアル開催
datayokocho
0
190
第3回 「メタデータ通り」 Zoom開催
datayokocho
0
18
第2回 メタデータ通り#1Meetup _資料
datayokocho
0
270
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
390
メタデータ通りの趣旨と進め方
datayokocho
0
400
Featured
See All Featured
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
Accessibility Awareness
sabderemane
0
47
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
AI: The stuff that nobody shows you
jnunemaker
PRO
2
240
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
62
The Language of Interfaces
destraynor
162
26k
Writing Fast Ruby
sferik
630
62k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
110
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
120
Building Adaptive Systems
keathley
44
2.9k
[SF Ruby Conf 2025] Rails X
palkan
0
740
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
100
Transcript
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~ 遠藤尚也/ノーテック企業でデータのこと全般 データ横丁・新年 LT大会 2026 ~
所属先:某ノーテック企業(エンジニアもデザイナーもいない) 事業内容:医療用機器の輸出入、卸売および販売、研究開発および製造 理化学機器の輸出入、卸売および販売、研究開発および製造 上記機器のメンテナンス業務 美容器具の輸出入、卸売および販売、研究開発および製造 医薬部外品、化粧品の卸売および販売、研究開発および製造 医療用施設内テレビ用コンテンツ配信業務 1/14 データ横丁・新年 LT大会
2026 ~
化石は簡単に嘘をつく 2/14 データ横丁・新年 LT大会 2026 ~
この3体の恐竜の共通点って何だと思いますか? 3/14 データ横丁・新年 LT大会 2026 ~ mesozoniaオリジナルイメージ(https://mesozonia.com/iguanodon-fukugemmisu/)
同じ化石から作られた復元図 4/14 データ横丁・新年 LT大会 2026 ~
「化石は簡単に嘘をつく」理由 ①記録の不完全性:地球上の生物のごく一部しか化石と して残らない。 ②解釈の難しさ:発見された化石の断片から生物全体の 姿や生態を推測するのは容易でない。 ③堆積学的・地質学的プロセス:化石は形成された後、 地殻変動や浸食などによって破壊されたり、元の場所か ら移動したりすることがある。 5/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく!? 6/14 データ横丁・新年 LT大会 2026 ~
私の日常 その① 分析するデータがない。 データマイニングする前にデータ自体をマイニングしないといけない。 7/14 データ横丁・新年 LT大会 2026 ~
私の日常 その② 基幹システムからダウンロードしたデータにユニークキー(主キー)がない。 同じ顧客に複数のコードが採番されているし、まとめる親コードもない。 8/14 データ横丁・新年 LT大会 2026 ~ 出庫先コード
出庫先名 SH-33834 (医)◦◦◦皮ふ科CL SH-A4464 (医)◦◦◦皮【XT】 SH-24464 (医)◦◦◦皮ふ科CL 得意先コード 得意先名 T-A4424 ••••皮ふ科【XTRAC】 T-24424 ••••皮ふ科 T-04424 ••••皮ふ科【振替】 ※データはダミーです。
どうなって目の前のようなカタチで残ったのか? ↓ 現在の社内の人間の言動を観察する ↓ データの成り立ちを推測する ↓ 分析に必要な要素を補う 9/14 データ横丁・新年 LT大会
2026 ~
基幹システムのデータを観察して気づいたこと/解決策 ・注文単位での区別がしやすい ・顧客が複数のマスタに紐付いている ・1回の注文では、同じ顧客マスタが使われている ↓ 『注文された製品が指定の場合に届いて請求にまわる』 ことが最優先 ↓ 個々の注文を超えて紐付けるマスタデータの整備が必要 10/14
データ横丁・新年 LT大会 2026 ~
まとめ データのクセは、組織の価値観の写し鏡 ⚫FAXからの入力ミスも、名寄せの放棄も、そのとき に現場が最優先した仕事が作ったカタチ ⚫データの歪みは「欠陥」ではなく、そのデータを生 み出した組織の優先順位の記録 ⚫「正しい」カタチのデータを上書きするのではなく、 “何を守ってきたか”を理解してクリーニングする 11/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく? ↓ 私たちの思い込みが騙らせる & データは簡単には語らない 12/14 データ横丁・新年 LT大会 2026 ~
もしもノーテック企業がユーザーになって Garbage のようなデータを in してきても 彼らには悪気も敵意も邪心もありません。 なので使えるデータをすくい取るだけでなく 価値観も汲み取ってもらえるとうれしいです。 13/14 データ横丁・新年
LT大会 2026 ~
Garbage in, garbage out. Yet one person’s garbage is another
person’s GOLD. 14/14 データ横丁・新年 LT大会 2026 ~