Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT at nlp_career
Search
yag_ays
July 10, 2019
Programming
360
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LT at nlp_career
yag_ays
July 10, 2019
More Decks by yag_ays
See All by yag_ays
対話型AIの構築における工夫とデータセットの重要性 - 素早くデータを構築し検証するためには
yag_ays
3
7.1k
目と耳を持った自然言語処理 - スタートアップにおける価値創出のために
yag_ays
1
3.9k
時間情報表現抽出とルールベース解析器のこれから / Temporal Expression Analysis in Japanese and Future of Rule-based Approach
yag_ays
1
2.3k
Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
yag_ays
9
9.2k
"医者の言葉、患者の言葉、エンジニアの言葉" / MNTSQ Ubie Vertical ai
yag_ays
3
14k
Review: "Recommending Investors for Crowdfunding Projects"
yag_ays
1
1.2k
Other Decks in Programming
See All in Programming
エージェンティックRAGにAWSで入門しよう!
har1101
9
1.8k
AI 輔助遺留系統現代化的經驗分享
jame2408
1
1k
SREは、MCPとSRE Agentをこう使え!
kazumax55
0
120
技術的負債解消で開発者の未来を開く- AIの力でコード刷新
kmd2kmd
0
120
Signal Forms: Details & Live Coding @enterJS 2026 in Mannheim
manfredsteyer
PRO
0
200
Strategic Design in the Frontend: Moduliths & Micro Frontends @DDDEurope
manfredsteyer
PRO
0
130
Mujeres en SEO Summit 2026 - Greatest Disaster Hits en Web Performance
guaca
0
200
Observability in Practice:Grafana 與 Edge Device SRE 的那些事
blueswen
0
180
そのテスト、説明できますか?~LWテスト戦略FW~のご紹介
nakahara
0
170
Go1.27で導入されるジェネリクスメソッドでできること
mackee
0
190
これからAgentCoreを触る方へトレンドはGatewayです
har1101
2
230
ローカルLLMでどこまでコードが書けるか -拡張版 / How much code can be written on a local LLM Extended
kishida
12
4.5k
Featured
See All Featured
Leo the Paperboy
mayatellez
7
1.9k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
150
Music & Morning Musume
bryan
47
7.2k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
It's Worth the Effort
3n
188
29k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
170
Designing Powerful Visuals for Engaging Learning
tmiket
1
430
Accessibility Awareness
sabderemane
1
140
Visualization
eitanlees
152
17k
The Language of Interfaces
destraynor
162
27k
Fireside Chat
paigeccino
42
4k
Transcript
1 yag_ays Machine Learning Engineer @Sansan, Inc. ! NLP研究室出⾝ (Bioinformatics)
! 博⼠号
2 https://yag-ays.github.io/
pytorchでBERTの⽇本語学習済みモデルを利⽤する - ⽂章埋め込み 編 / SWEM: 単語埋め込みのみを使うシンプルな⽂章埋め込み深層 学習時代の⾔語判定の最新動向 / Fasttextを⽤いた⾔語判定
/ MeCabの形態素解析の結果から正規表現を使って品詞列を抜き出 すmecabpr / 単語埋め込みにおけるout-of-vocabularyの対応 - magnitudeの初期化」 / 後処理のみで単語ベクトルの性能を向上さ せるALL-BUT-THE-TOPを使った⽇本語学習済み分散表現 / 語彙 を限定して単語ベクトルのモデルサイズを⼩さくするminify_w2v / ⽇本語Wikipediaで学習したdoc2vecモデル / Wikipediaの記事ごと のページビューを取得する / Word Embedding based Edit Distanceの実装 / 学習済み分散表現をTensorBoardで可視化する (gensim/PyTorch/tensorboardX) / Unicode絵⽂字の⽇本語読み /キーワード/分類辞書 / 漢字を構成する部⾸/偏旁のデータセッ ト / Wikipedia CirrusSearchのダンプデータを利⽤する / ⽂字の図 3
もっと⽇本語が使える 論⽂実装をしてくれ、頼む! 4
英語を対象にした英語の論⽂が出る 英語を対象にした実装が公開される ⽇本語で書かれた論⽂解説が出る ⽇本語を対象にした実装が出る 5
論⽂解説してる⼈ → 実装してくれ! 実装してる⼈ → 公開してくれ! 6 ググって出てこなくても、Githubで論⽂名やロジック名で 検索すると意外と出てくる場合もある
良いこと 1. 動く!使える!試せる! プロダクト作るでしょ?実験するでしょ? 2. フィードバック貰える 意⾒を貰える、間違っていれば指摘してくれる (場合もある) 3 ⼈のためになる
⽇本語という⼩さい⾔語の中で⾞輪の再発明してる場合じゃねぇ 4. 転職に有利 それがあなたのポートフォリオになる(コードを書けるかはものすごい⼤事) 7
悪いこと 1. ない 8
まとめ 9 yag_aysです。ブログやってます ⽇本語使える実装しよう NLPエンジニアコミュニティを盛 り上げていきましょう