Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理 @ クックパッド / nlp at cookpad
Search
himkt
July 07, 2019
Technology
580
1
Share
自然言語処理 @ クックパッド / nlp at cookpad
https://connpass.com/event/135387/
himkt
July 07, 2019
More Decks by himkt
See All by himkt
Linformer: paper reading
himkt
0
640
RoBERTa: paper reading
himkt
1
420
NLP SoTA 勉強会 / ner_2019
himkt
2
1.5k
Interpretable Machine Learning 6.3 - Prototypes and Criticisms
himkt
2
200
ニューラル固有表現抽出 / Neural Named Entity Recognition
himkt
3
840
ニューラル固有表現抽出器を実装してみる / PyNER
himkt
6
2.2k
Spacyでお手軽NLP / NLP with spacy
himkt
0
1.1k
Deep Learning Book 10その2 / deep learning book 10 vol2
himkt
2
210
ふわふわ系列ラベリング / ner 2018
himkt
5
880
Other Decks in Technology
See All in Technology
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
インフラが苦手でも大丈夫! 紙芝居 Kubernetes -WWGT 10周年編-
aoi1
1
350
個人最適 から 全体最適 へ AI情報共有会・AIギルド・AI-DLC で進める カンリーの組織展開
rfdnxbro
0
1.4k
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
2
210
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
210
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.8k
サプライチェーンセキュリティの空白地帯 - 信頼できる”依存性”の未来を考える
rung
PRO
2
670
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
240
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
180
Databricks における 生成AIガバナンスの実践
taka_aki
1
300
タクシーアプリ『GO』の実践的データ活用
mot_techtalk
2
130
Claude Codeを組織で使いこなす— サーバサイドAIエージェント運用の実践知
techtekt
PRO
0
200
Featured
See All Featured
A better future with KSS
kneath
240
18k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
170
The Curse of the Amulet
leimatthew05
1
13k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
130
Code Reviewing Like a Champion
maltzj
528
40k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
190
Skip the Path - Find Your Career Trail
mkilby
1
140
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
320
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
Transcript
自然言語処理 @ クックパッド 研究開発部 リサーチエンジニア Makoto Hiramatsu <
[email protected]
>
/ 9 自己紹介 ! 平松 淳 (Makoto Hiramatsu) ! @himkt
(Twitter/GitHub) ! 2019 年新卒 (2018 年 5 月 ~ 内定者アルバイト) ! 自然言語処理してます ( nlpaper.challenge の運営をしています ) 2
None
国内レシピ 310 万品+ 月間利用者 約 5,500 万人 海外レシピ 241 万品+
月間利用者 約 4,100 万人
/ 9 クックパッドの R&D ! 最高のデータ環境 (DWH がすごい) ! おおよそすべてのデータが1箇所に集約されている
! 自由にクエリを投げてデータを解析できる! ! 自分で作ったアプリケーション,プロダクション環境まで ! Dockerfile を書く -> Hako (コンテナ管理システム) でデプロイ ! (https://github.com/eagletmt/hako) 5
/ 9 クックパッドの R&D (NLPer 目線) ! サービスで実際に使う機能をつくる ! クックパッド本体
+ さまざまなサービス ! 専門知識を持ったアノテータさんが常駐している ! タスクを思いついた! GitHub issue 作成 アノテーション ! 基礎レベルの解析も大事にしていく雰囲気があります ! スタッフが使える形態素解析の辞書管理ツール ! 継続的改善への取り組み: MeCab の辞書再学習 6
クックパッドの自然言語処理 アプリケーション (レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 形態素解析 固有表現抽出 文脈レベル 格解析 同義表現認識 -
同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 構文レベル 単語レベル
格解析 同義表現認識 - 同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 アプリケーション
(レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 クックパッドの自然言語処理 形態素解析 固有表現抽出 文脈レベル 構文レベル 単語レベル 基礎解析 × R&D! ✅ 大量トラフィックを捌ける ✅ 形態素解析より高段の言語解析ができる
大規模サービスの言語解析基盤に知見があるかた おしゃべりしたいです クックパッドの自然言語処理に興味をもってくださったかた ぜひぜひお気軽にお声がけください