Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理 @ クックパッド / nlp at cookpad
Search
himkt
July 07, 2019
Technology
1
450
自然言語処理 @ クックパッド / nlp at cookpad
https://connpass.com/event/135387/
himkt
July 07, 2019
Tweet
Share
More Decks by himkt
See All by himkt
Linformer: paper reading
himkt
0
250
RoBERTa: paper reading
himkt
1
260
NLP SoTA 勉強会 / ner_2019
himkt
2
1.2k
Interpretable Machine Learning 6.3 - Prototypes and Criticisms
himkt
2
120
ニューラル固有表現抽出 / Neural Named Entity Recognition
himkt
3
580
ニューラル固有表現抽出器を実装してみる / PyNER
himkt
6
1.9k
Spacyでお手軽NLP / NLP with spacy
himkt
0
900
Deep Learning Book 10その2 / deep learning book 10 vol2
himkt
2
150
ふわふわ系列ラベリング / ner 2018
himkt
5
840
Other Decks in Technology
See All in Technology
「ふりかえりのふりかえり」をふりかえり、実のあるふりかえりにする
naitosatoshi
0
220
SIEMを用いて、セキュリティログ分析の可視化と分析を実現し、PDCAサイクルを回してみた
coconala_engineer
0
220
4年前、あるじゃん老害エンジニアLT合戦に登壇、米国西海岸コンピュータ歴史博物館体験記の続編
toshi_atsumi
0
200
検証を通して見えてきたTiDBの性能特性
lycorptech_jp
PRO
6
3.4k
人間の尊厳、幸福、アクセシビリティ / 第116回「WEB TOUCH MEETING」アクセシビリティSP
nulabinc
PRO
2
180
Autonomous Database Cloud 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
14
35k
コードを書く隙間を見つけて生きていく技術/Findy 思考の現在地
fujiwara3
24
5.2k
マルチアカウント環境への発見的統制の導入
ch1aki
1
1.3k
巨大なテーブルのテーブル定義を無停止で安全に誰でも変更できるようにする / Table-definitions-for-huge-tables-can-be-modified-by-anyone-safely-and-non-disruptively
freee
1
740
**強い**エンジニアのなり方 - フィードバックサイクルを勝ち取る / grow one day each day
soudai
61
18k
オーナーシップを持つ領域を明確にする
konifar
11
2.6k
エンタープライズ環境下での Active Directory の運用 TIPS
tamaiyutaro
1
1.6k
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
61
6.7k
Web development in the modern age
philhawksworth
202
10k
Teambox: Starting and Learning
jrom
128
8.4k
Producing Creativity
orderedlist
PRO
336
39k
Optimizing for Happiness
mojombo
370
69k
Large-scale JavaScript Application Architecture
addyosmani
503
110k
4 Signs Your Business is Dying
shpigford
175
21k
Six Lessons from altMBA
skipperchong
20
3k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
29
6k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
60
14k
GraphQLとの向き合い方2022年版
quramy
31
12k
Designing for humans not robots
tammielis
247
25k
Transcript
自然言語処理 @ クックパッド 研究開発部 リサーチエンジニア Makoto Hiramatsu <
[email protected]
>
/ 9 自己紹介 ! 平松 淳 (Makoto Hiramatsu) ! @himkt
(Twitter/GitHub) ! 2019 年新卒 (2018 年 5 月 ~ 内定者アルバイト) ! 自然言語処理してます ( nlpaper.challenge の運営をしています ) 2
None
国内レシピ 310 万品+ 月間利用者 約 5,500 万人 海外レシピ 241 万品+
月間利用者 約 4,100 万人
/ 9 クックパッドの R&D ! 最高のデータ環境 (DWH がすごい) ! おおよそすべてのデータが1箇所に集約されている
! 自由にクエリを投げてデータを解析できる! ! 自分で作ったアプリケーション,プロダクション環境まで ! Dockerfile を書く -> Hako (コンテナ管理システム) でデプロイ ! (https://github.com/eagletmt/hako) 5
/ 9 クックパッドの R&D (NLPer 目線) ! サービスで実際に使う機能をつくる ! クックパッド本体
+ さまざまなサービス ! 専門知識を持ったアノテータさんが常駐している ! タスクを思いついた! GitHub issue 作成 アノテーション ! 基礎レベルの解析も大事にしていく雰囲気があります ! スタッフが使える形態素解析の辞書管理ツール ! 継続的改善への取り組み: MeCab の辞書再学習 6
クックパッドの自然言語処理 アプリケーション (レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 形態素解析 固有表現抽出 文脈レベル 格解析 同義表現認識 -
同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 構文レベル 単語レベル
格解析 同義表現認識 - 同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 アプリケーション
(レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 クックパッドの自然言語処理 形態素解析 固有表現抽出 文脈レベル 構文レベル 単語レベル 基礎解析 × R&D! ✅ 大量トラフィックを捌ける ✅ 形態素解析より高段の言語解析ができる
大規模サービスの言語解析基盤に知見があるかた おしゃべりしたいです クックパッドの自然言語処理に興味をもってくださったかた ぜひぜひお気軽にお声がけください