Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
眠気を覚ます方法を見つける
Search
Doarakko
October 15, 2020
Programming
0
1.4k
眠気を覚ます方法を見つける
Doarakko
October 15, 2020
Tweet
Share
More Decks by Doarakko
See All by Doarakko
Cloudflare Workers で X(Twitter)のボットを作ってみた
doarakko
0
170
Vercel Edge Functions を使って作る画像メーカー
doarakko
0
43
JOIN して1ヶ月のエンジニアに聞いた Liiga の良いところ 3 選
doarakko
0
78
わんわおーん
doarakko
0
66
職場を明るくする
doarakko
0
260
コードレビューの時間を削減しました
doarakko
0
88
仕事中に隠れてテレビ番組表を見るぞ
doarakko
0
130
GitHub Project の運用を自動化しました
doarakko
0
100
GitHub Actions に入門しました
doarakko
0
1.2k
Other Decks in Programming
See All in Programming
.NET のための通信フレームワーク MagicOnion 入門 / Introduction to MagicOnion
mayuki
1
1.4k
ペアーズにおけるAmazon Bedrockを⽤いた障害対応⽀援 ⽣成AIツールの導⼊事例 @ 20241115配信AWSウェビナー登壇
fukubaka0825
6
1.9k
エンジニアとして関わる要件と仕様(公開用)
murabayashi
0
280
AWS Lambdaから始まった Serverlessの「熱」とキャリアパス / It started with AWS Lambda Serverless “fever” and career path
seike460
PRO
1
260
Less waste, more joy, and a lot more green: How Quarkus makes Java better
hollycummins
0
100
アジャイルを支えるテストアーキテクチャ設計/Test Architecting for Agile
goyoki
9
3.3k
Better Code Design in PHP
afilina
PRO
0
120
Webの技術スタックで マルチプラットフォームアプリ開発を可能にするElixirDesktopの紹介
thehaigo
2
1k
Generative AI Use Cases JP (略称:GenU)奮闘記
hideg
1
290
RubyLSPのマルチバイト文字対応
notfounds
0
120
3 Effective Rules for Using Signals in Angular
manfredsteyer
PRO
1
100
Jakarta EE meets AI
ivargrimstad
0
130
Featured
See All Featured
The Language of Interfaces
destraynor
154
24k
Navigating Team Friction
lara
183
14k
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
GitHub's CSS Performance
jonrohan
1030
460k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Code Reviewing Like a Champion
maltzj
520
39k
Measuring & Analyzing Core Web Vitals
bluesmoon
4
120
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Teambox: Starting and Learning
jrom
133
8.8k
BBQ
matthewcrist
85
9.3k
YesSQL, Process and Tooling at Scale
rocio
169
14k
A better future with KSS
kneath
238
17k
Transcript
@Doarakko 眠気を覚ます方法を見つける
・2019年12月入社(2社目) ・エンジニア歴1.5年 - 仕事: Go, PHP(たまに) - 趣味: Python, C++
・AtCoder 緑 ・海外サッカーをよく見ます 誰?
とあるランキング 404
Google 検索でのクリック数 Top 5 の検索キーワード(直近 3 ヶ月) = どんな検索キーワードで外資就活ドットコムを訪れているのか 404
1分で睡魔を退治する方法 https://gaishishukatsu.com/archives/7145
外資就活ドットコムで検索すると...
@Doarakko 眠気を覚ます方法を見つける
人間が読めば... ・眠気覚まし ・目を覚ます方法 ・眠気を覚ます方法 ・目が覚める方法 ・... 1分で睡魔を退治する方法
なんとなく文章の意味を理解して検索して欲しい AI を導入します
ベクトル検索
ベクトル 2.4 3.2 -8.3 0.3 ... 10.2 20.4 -29.7 3.1
テキストのベクトル化 サッカー観たい モデル 2.4 0.3 ... -29.7 3.1
テキストのベクトル化 モデルの性能に依存 ピザうまい さすがメッシ サッカー観たい ボールコントロールが大切 眠気覚まし 目を覚ます方法 眠気を覚ます方法
何らかの方法でスコアリング(順位付け) テキスト スコア 目を覚ます方法 89.4 眠気覚まし 84.5 眠気を覚ます方法 80.2 ...
... サッカー観たい 20.2 さすがメッシ 10.0 ボールコントロールが大切 3.5 検索キーワード:目を覚ましたい 2.4 0.3 ... -29.7 3.1
ベクトル検索
ベクトル変換に使用するモデル BERT ・2018年に Google が公開した自然言語処理のモデル ・複数のベンチマークで SOTA(State of the Art)を達成
・以降 BERT をベースにいろいろなモデルが誕生 ・元論文:https://arxiv.org/abs/1810.04805 を日本語 Wikipedia で学習させたものを使用 学習済みモデルの公開元: https://yoheikikuta.github.io/bert-japanese
Elasticsearch とベクトル検索 ベクトルフィールド コサイン類似度(ベクトル検索でのスコアリングに使用)
全体の流れ 0. 検索対象のテキストをベクトル化して Elasticsearch に登録 1. 検索キーワードを入力 2. 検索キーワードをベクトル化 3.
ベクトル化されたものを Elasticsearch に投げる
ベクトル化の前にいろいろと前処理 ・記号の削除 ・URL 削除 ・HTML タグ削除 ・コミュニティ返信先「>>」の削除 ・コンテンツ単位ではなく、文単位に分割 ・...
① 検索キーワードをベクトルに変換 全体像 Python script Elasticsearch bert-as-service ② 変換されたベクトルを返す ③
ベクトルをクエリとして投げる ④ 検索結果を返す
今回の検索対象 ・コラム(101件) - 本文 ・コミュニティ - トピック本文(100件) - コメント(100件) ・相談室
- 質問(? 件) - 回答(100件) Elasticsearch のドキュメント数:39,683
検索してみる⚽
@Doarakko 眠気を覚ます方法を見つける