Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理 @ クックパッド / nlp at cookpad
Search
himkt
July 07, 2019
Technology
1
530
自然言語処理 @ クックパッド / nlp at cookpad
https://connpass.com/event/135387/
himkt
July 07, 2019
Tweet
Share
More Decks by himkt
See All by himkt
Linformer: paper reading
himkt
0
550
RoBERTa: paper reading
himkt
1
350
NLP SoTA 勉強会 / ner_2019
himkt
2
1.4k
Interpretable Machine Learning 6.3 - Prototypes and Criticisms
himkt
2
170
ニューラル固有表現抽出 / Neural Named Entity Recognition
himkt
3
760
ニューラル固有表現抽出器を実装してみる / PyNER
himkt
6
2.1k
Spacyでお手軽NLP / NLP with spacy
himkt
0
1k
Deep Learning Book 10その2 / deep learning book 10 vol2
himkt
2
200
ふわふわ系列ラベリング / ner 2018
himkt
5
850
Other Decks in Technology
See All in Technology
「れきちず」のこれまでとこれから - 誰にでもわかりやすい歴史地図を目指して / FOSS4G 2025 Japan
hjmkth
1
300
ガバメントクラウド(AWS)へのデータ移行戦略の立て方【虎の巻】 / 20251011 Mitsutosi Matsuo
shift_evolve
PRO
2
200
LLM時代にデータエンジニアの役割はどう変わるか?
ikkimiyazaki
6
1.3k
速習AGENTS.md:5分で精度を上げる "3ブロック" テンプレ
ismk
6
1.4k
OCI Network Firewall 概要
oracle4engineer
PRO
2
7.9k
技育祭2025【秋】 企業ピッチ/登壇資料(高橋 悟生)
hacobu
PRO
0
100
[Keynote] What do you need to know about DevEx in 2025
salaboy
0
170
衛星画像超解像化によって実現する2D, 3D空間情報の即時生成と“AI as a Service”/ Real-time generation spatial data enabled_by satellite image super-resolution
lehupa
0
160
AIツールでどこまでデザインを忠実に実装できるのか
oikon48
6
3.4k
E2Eテスト設計_自動化のリアル___Playwrightでの実践とMCPの試み__AIによるテスト観点作成_.pdf
findy_eventslides
2
620
ビズリーチ求職者検索におけるPLMとLLMの活用 / Search Engineering MEET UP_2-1
visional_engineering_and_design
1
120
20201008_ファインディ_品質意識を育てる役目は人かAIか___2_.pdf
findy_eventslides
2
630
Featured
See All Featured
Producing Creativity
orderedlist
PRO
347
40k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
KATA
mclloyd
32
15k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Thoughts on Productivity
jonyablonski
70
4.9k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
870
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
The Pragmatic Product Professional
lauravandoore
36
6.9k
Transcript
自然言語処理 @ クックパッド 研究開発部 リサーチエンジニア Makoto Hiramatsu <
[email protected]
>
/ 9 自己紹介 ! 平松 淳 (Makoto Hiramatsu) ! @himkt
(Twitter/GitHub) ! 2019 年新卒 (2018 年 5 月 ~ 内定者アルバイト) ! 自然言語処理してます ( nlpaper.challenge の運営をしています ) 2
None
国内レシピ 310 万品+ 月間利用者 約 5,500 万人 海外レシピ 241 万品+
月間利用者 約 4,100 万人
/ 9 クックパッドの R&D ! 最高のデータ環境 (DWH がすごい) ! おおよそすべてのデータが1箇所に集約されている
! 自由にクエリを投げてデータを解析できる! ! 自分で作ったアプリケーション,プロダクション環境まで ! Dockerfile を書く -> Hako (コンテナ管理システム) でデプロイ ! (https://github.com/eagletmt/hako) 5
/ 9 クックパッドの R&D (NLPer 目線) ! サービスで実際に使う機能をつくる ! クックパッド本体
+ さまざまなサービス ! 専門知識を持ったアノテータさんが常駐している ! タスクを思いついた! GitHub issue 作成 アノテーション ! 基礎レベルの解析も大事にしていく雰囲気があります ! スタッフが使える形態素解析の辞書管理ツール ! 継続的改善への取り組み: MeCab の辞書再学習 6
クックパッドの自然言語処理 アプリケーション (レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 形態素解析 固有表現抽出 文脈レベル 格解析 同義表現認識 -
同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 構文レベル 単語レベル
格解析 同義表現認識 - 同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 アプリケーション
(レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 クックパッドの自然言語処理 形態素解析 固有表現抽出 文脈レベル 構文レベル 単語レベル 基礎解析 × R&D! ✅ 大量トラフィックを捌ける ✅ 形態素解析より高段の言語解析ができる
大規模サービスの言語解析基盤に知見があるかた おしゃべりしたいです クックパッドの自然言語処理に興味をもってくださったかた ぜひぜひお気軽にお声がけください