Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
アノテーション作業書作成のGood Practice
Search
Cierpa & Company
PRO
October 30, 2025
Technology
1
480
アノテーション作業書作成のGood Practice
Search Engineering Tech Talk 2025 Autumn (
https://search-tech.connpass.com/event/370754/
) での発表資料です。
Cierpa & Company
PRO
October 30, 2025
Tweet
Share
More Decks by Cierpa & Company
See All by Cierpa & Company
Cierpa&Co._Culture Deck_202510
cierpa0905
PRO
0
3.8k
Other Decks in Technology
See All in Technology
アジャイル社内普及ご近所さんマップを作ろう / Let's create an agile neighborhood map
psj59129
1
140
身近なCSVを活用する!AWSのデータ分析基盤アーキテクチャ
koosun
0
2k
Service Monitoring Platformについて
lycorptech_jp
PRO
0
310
なぜインフラコードのモジュール化は難しいのか - アプリケーションコードとの本質的な違いから考える
mizzy
60
20k
AS59105におけるFreeBSD EtherIPの運用と課題
x86taka
0
130
ABEMAのCM配信を支えるスケーラブルな分散カウンタの実装
hono0130
4
1k
新しい風。SolidFlutterで実現するシンプルな状態管理
zozotech
PRO
0
130
未回答質問の回答一覧 / 開発をリードする品質保証 QAエンジニアと開発者の未来を考える-Findy Online Conference -
findy_eventslides
0
300
SRE視点で振り返るメルカリのアーキテクチャ変遷と普遍的な考え
foostan
2
320
「データ無い! 腹立つ! 推論する!」から 「データ無い! 腹立つ! データを作る」へ チームでデータを作り、育てられるようにするまで / How can we create, use, and maintain data ourselves?
moznion
8
4.6k
AWS re:Invent 2025 で頻出の 生成 AI サービスをおさらい
komakichi
2
120
JavaScript パーサーに using 対応をする過程で与えたエコシステムへの影響
baseballyama
1
110
Featured
See All Featured
Navigating Team Friction
lara
190
15k
Practical Orchestrator
shlominoach
190
11k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
253
22k
Bash Introduction
62gerente
615
210k
Documentation Writing (for coders)
carmenintech
76
5.1k
Thoughts on Productivity
jonyablonski
73
4.9k
How to Ace a Technical Interview
jacobian
280
24k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
アノテーション作業書作成のGood Practice Presenter: Kampersanda Search Engineering Tech Talk 2025 Autumn
© Cierpa&Co., Inc. ⽒名 • 神⽥ 峻介 / Kampersanda (Kanda
→ K and A → K & A → K ampersand A) 経歴 • 特別研究員@理研AIP (2018〜2021) • シニアリサーチエンジニア@LegalOn Technologies (2021〜2024) • ソフトウェアエンジニア@Cierpa&Co. (2024〜) (ここ2年くらい検索技術勉強会のスタッフもやってます) About me
© Cierpa&Co., Inc. ESG領域におけるアノテーションは専⾨性の⾼い作業 ⾮専⾨家によるアノテーションの40%が誤ラベルだった事例あり* ESG領域におけるデータセット構築の難しさ GHG削減取り組みに 該当する? *⾚部ら, ESGデータセット構築におけるHuman-in-the-Loop全⾃動パイプラインの構築.
YANS2025 引⽤元: ヤマダ電機グループ Integrated Report 2018 (P4)
© Cierpa&Co., Inc. ⾼品質なデータセット作成には専⾨性が必要 しかし、専⾨家のリソースは限られる 限られた⼈員で運⽤可能なフローの構築が必須 ESG領域におけるデータセット構築の難しさ (cont.) 専⾨家 ⾮専⾨家
考え得る⼈員体制
© Cierpa&Co., Inc. 持続可能なアノテーションには定義や⼿順を記載した作業書の品質が重要 本発表では、実⽤に向けた作業書作成のためのGood Practiceを紹介 アノテーション作業書の重要性 ⼀貫性の無いラベル 頻発する質問 掛かり過ぎる
作業時間 ※ 2つのデータを⾒⽐べ「該当」「⾮該当」をラベリングするタスクを想定
© Cierpa&Co., Inc. 曖昧な定義は「⼀貫性の⽋如」と「質問の頻発」を招く あらゆるケースを網羅した「完全な定義」を⽬指したくなるが... • ルールが際限なく複雑化する • アノテーターの認知負荷が爆発 •
判断に時間がかかりコストが増⼤ • ルールの⽭盾管理が困難に Practice 1 ‒ 定義の複雑化を「仕組み」で回避する
© Cierpa&Co., Inc. 記事を読み、「⼈権問題」に関連する 内容が含まれていると思えば「該当」 を選んでください。そうでなければ 「⾮該当」を選んでください。 簡単な定義 以下の基準をすべて確認し、判断してください。 1.
深刻な⼈権侵害(必須):「児童労働」「強制労働」「⼈⾝売 買」「拷問」に明確に⾔及している場合は「該当」。 2. 差別‧ハラスメント:「⼈種」「性別」「宗教」「出⾝」に基 づく差別やハラスメントに関する記述がある場合は「該当」。 例外: ただし、それが「ダイバーシティ&インクルージョン (D&I)」のポジティブな取り組みとしてのみ⾔及されている 場合は、「⾮該当」(「労働慣⾏」トピックとする)。 3. コミュニティ‧先住⺠の権利:「⼟地の強制収⽤」「先住⺠の 権利侵害」に⾔及している場合は「該当」。注意: 「地域への 寄付」「対話の実施」といったポジティブな活動は「⾮該 当」。 4. ガバナンスとの重複: 主題がガバナンス(例:CEO辞任)で あっても、その発端となった事象がルール2(例:差別的発 ⾔)に抵触する場合は「該当」。 5. … 複雑化した定義 (例)ニュース記事が「⼈権問題」に「該当」か「⾮該当」かを判別する どこまで作り込めば「完全な定義」は完成する?
© Cierpa&Co., Inc. 1. ワークフローの修正 • 定義を簡潔に保ち、判断が難しい事例は「別フロー」で処理する • (例)⾮専⾨家で判別できない事例は専⾨家へ(Practice 2)
2. 問題の単純化 • ⼀つのタスクで全てを満たそうとしない • (例)完璧に識別するのを⽬指さず、⽬的を単純化する(Practice 3) 過度な複雑化に繋がりそうな場合は「仕組み」で対処する
© Cierpa&Co., Inc. 判別困難な事例は必ず発⽣する(例: ⾼すぎる専⾨性、データ不備...) 「逃げ道」がない場合 • 時間の消費: 無益に悩み、⼿が⽌まる •
品質の低下: 主観的な判断でラベル付け 解決策: 「分からない」ラベルを導⼊ • 困難な事例のスキップとエスカレーションが可能に • 無理な誤ラベルの付与を回避 Practice 2 ‒ 「分からない」を⽤意する
© Cierpa&Co., Inc. 「分からない」が実現する効率的なワークフローの例 ⼀次アノテーション (⾮専⾨家) データセット ⼆次アノテーション (専⾨家) 分からない
分かる 分かる 分からない 専⾨家のリソースを、難しい判断が要求される事例に集中投下できる
© Cierpa&Co., Inc. 複数の要件を満たそうとすると、定義が複雑化しアノテーション難易度は上がる Practice 3 ‒ 少なくとも満たすべき要件を定義する 適合率も再現率も100%を 達成する定義の作成は可能?
➔ 「これだけは絶対に達成したい」という最⼩の機能要件を明らかにする
© Cierpa&Co., Inc. Case A: 「明らかに該当」なものを判別したい • 例: 絶対に外さないアイテムだけを推薦したい •
定義: 部分的にも⾮該当な事例は「⾮該当」(適合率重視) Case B: 「少しでも該当」なものを判別したい • 例: 不良品を絶対に⾒逃したくない • 定義: 部分的にも該当な事例は「該当」(再現率重視) 難しい事例をどちらに倒すか決めるだけで、判断は容易になる システムが「少なくとも満たすべき要件」はどちらか?
© Cierpa&Co., Inc. ルール: 1事例あたり〇〇秒以上悩んだら「分からない」を選ぶ 2つの利点 1. 品質の担保 a. 「⻑時間悩む事例」はそもそも判別不能
b. 無理な判断によるノイズの混⼊を防ぐ 2. コスト‧⼯数の管理 a. ムダな思考時間を強制的にカット b. 1件あたりの最⼤時間が決まり、⼯数⾒積もりが容易に Practice 4 ‒ 思考時間の上限を設定する
© Cierpa&Co., Inc. 本⽇の4つのGood Practice 1. 定義の複雑化を「仕組み」で回避する 2. 「分からない」を⽤意する 3.
少なくとも満たすべき要件を定義する 4. 思考時間の上限を設定する 「運⽤可能なアノテーションフロー」を作ろう! まとめ シェルパ‧アンド‧カンパニー株式会社では、エンジニアやインターン シップを絶賛募集中です!是⾮お声がけ下さい!