$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour # 73 - どの単語の組み合わせがよく使われるかを分析したい
Search
Takato Shiroto
June 23, 2020
Technology
0
120
Exploratory Hour # 73 - どの単語の組み合わせがよく使われるかを分析したい
2020/6/23(火)に開催したExploratory Hourのスライドです。
文章を単語化したデータから、テキストペアをカウントを使って単語の組み合わせを集計する方法を紹介しています。
Takato Shiroto
June 23, 2020
Tweet
Share
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
910
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
330
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
220
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
280
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
120
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
110
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
【pmconf2025】PdMの「責任感」がチームを弱くする?「分業型」から全員がユーザー価値に本気で向き合う「共創型開発チーム」への変遷
toshimasa012345
0
240
Kubernetes Multi-tenancy: Principles and Practices for Large Scale Internal Platforms
hhiroshell
0
110
Karate+Database RiderによるAPI自動テスト導入工数をCline+GitLab MCPを使って2割削減を目指す! / 20251206 Kazuki Takahashi
shift_evolve
PRO
1
460
世界最速級 memcached 互換サーバー作った
yasukata
0
320
Noを伝える技術2025: 爆速合意形成のためのNICOフレームワーク速習 #pmconf2025
aki_iinuma
2
2k
Lambdaの常識はどう変わる?!re:Invent 2025 before after
iwatatomoya
0
270
MapKitとオープンデータで実現する地図情報の拡張と可視化
zozotech
PRO
1
120
Microsoft Agent 365 を 30 分でなんとなく理解する
skmkzyk
1
890
Uncertainty in the LLM era - Science, more than scale
gaelvaroquaux
0
780
Snowflakeでデータ基盤を もう一度作り直すなら / rebuilding-data-platform-with-snowflake
pei0804
2
280
モバイルゲーム開発におけるエージェント技術活用への試行錯誤 ~開発効率化へのアプローチの紹介と未来に向けた展望~
qualiarts
0
650
新 Security HubがついにGA!仕組みや料金を深堀り #AWSreInvent #regrowth / AWS Security Hub Advanced GA
masahirokawahara
1
1.3k
Featured
See All Featured
The Cult of Friendly URLs
andyhume
79
6.7k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Docker and Python
trallard
47
3.7k
Designing for humans not robots
tammielis
254
26k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
GitHub's CSS Performance
jonrohan
1032
470k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
700
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Code Reviewing Like a Champion
maltzj
527
40k
Unsuck your backbone
ammeep
671
58k
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
Exploratory Hour
ࠓिͷ࣭ • Ͳͷ୯ޠͷΈ߹Θ͕ͤΑ͘ΘΕΔ͔Λੳ͍ͨ͠ • ಛఆͷจࣈྻؚ͕·Ε͍ͯΔߦʹTRUEͷϥϕϧΛ͚͍ͭͨ 4
ࠓिͷ࣭ • Ͳͷ୯ޠͷΈ߹Θ͕ͤΑ͘ΘΕΔ͔Λੳ͍ͨ͠ • ಛఆͷจࣈྻؚ͕·Ε͍ͯΔߦʹTRUEͷϥϕϧΛ͚͍ͭͨ 5
6 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
લճͷExploratory Hourͷ͋Β͢͡ 7
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ʮσʔλʯͱʮαΠΤϯεʯͱ͍͏୯ޠΛϑΟϧλΛͬͯऔΓআ͘ɻ
11
12 ୯ޠԽͰݕࡧ
13 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
14 ྫ͑ɺػցͱֶशҰॹʹΘΕ͍ͯΔͷͰͳ͍͔ʁ
15 ͦΕͱɺpythonͱAI͕ҰॹʹΘΕ͍ͯΔ͔͠Εͳ͍ɻ
Α͘ΘΕΔ୯ޠͷΈ߹ΘͤΛΔʹʁ 16
17 จষΛ୯ޠԽͨ͠σʔλ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1
18 ୯ޠͷΈ߹ΘͤΛ͑Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
19 ͔͠͠ɺσʔλʹΑΓଟ͘ͷυΩϡϝϯτ(document_id)͕ଘࡏ͢Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2
20 υΩϡϝϯτ(document_id)͝ͱʹɺάϧʔϓΛ͚Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2
token count document_id σʔλ 1 1 αΠΤϯε 1 1 ֶश
1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2 21 υΩϡϝϯτ͝ͱʹɺ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1 2 σʔλ αΠΤϯε 1 2 αΠΤϯε ຊ 1 2 ຊ σʔλ 1
22 ୯ޠͷΈ߹Θͤ͝ͱʹɺΛूܭ͢Δɻ document_id token_x token_y value 1 σʔλ αΠΤϯε 1
1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1 2 σʔλ αΠΤϯε 1 2 αΠΤϯε ຊ 1 2 ຊ σʔλ 1 token_x token_y value σʔλ αΠΤϯε 2 αΠΤϯε ֶश 1 ֶश σʔλ 1 αΠΤϯε ຊ 1 ຊ σʔλ 1
23 จষΛ୯ޠԽͨ͠σʔλ
24 ୯ޠ(token)ͷྻϔομϝχϡʔ͔ΒςΩετσʔλͷՃ(UI)ͷςΩετϖΞΛ ΧϯτΛબ͢Δɻ
25 ςΩετϖΞΛΧϯτͷμΠΞϩά͕දࣔ͞ΕΔɻ
26 ୯ޠԽ͞ΕͨྻʹtokenɺจॻIDͷྻʹdocument_id͕બ͞Ε͍ͯΔɻ
27 ୯ޠͷΈ߹Θͤͷ͕ूܭ͞Εͨɻ
28 αϚϦɾϏϡʔ͔Β୯ޠͷΈ߹Θͤͷ(value)ͷྻΛݟΔͱɺ1ճ͔Β11ճ ʹσʔλ͕ू·͍ͬͯΔΑ͏ͩɻ
29 ͜ͷ··Ͱɺ͋·ΓΘΕͳ͍୯ޠͷΈ߹ΘͤՄࢹԽ͞Εͯ͠·͏ͨ ΊɺϑΟϧλΛ͕ͬͯ10Ҏ্ͷΈ߹Θ͚ͤͩΛ͍ͨ͠ɻ
30 ྻϔομϝχϡʔ͔ΒϑΟϧλͷҎ্Λબ͢Δɻ
31 ʹ10Λೖྗͯ͠ɺ࣮ߦ͢Δɻ
32 ୯ޠͷΈ߹Θͤͷ͕10Ҏ্ͷσʔλͷΈʹ͢Δ͜ͱ͕Ͱ͖ͨɻ
33 • νϟʔτλΠϓʹόʔΛબ͢Δɻ • X࣠ʹtoken.xΛબ͢Δɻ • Y࣠ʹvalueΛબ͢Δɻ
34 ͜ͷ··ͰɺҰͭͷ୯ޠͷΈՄࢹԽ͞ΕɺΈ߹Θ͕ͤΘ͔Βͳ͍ɻ
35 ͳͥͳΒɺX࣠ʹҰͭͷྻ(Ұͭͷ୯ޠ)͔͠બͰ͖ͳ͍͔Βɻ
୯ޠͲ͏͠ΛΈ߹ΘͤͨྻΛ࡞Δʂ 36
37 token.xͱtoken.yΛબͼɺྻϔομϝχϡʔ͔ΒෳͷྻΛͭͳ͛ΔΛબ͢Δɻ
38 ෳͷྻΛͭͳ͛ΔͷμΠΞϩά͕දࣔ͞ΕΔɻ
39 ৽͍͠ྻ໊ʹҙͷ໊લΛೖྗ࣮ͯ͠ߦ͢Δɻ
40 ୯ޠͲ͏͠ΛΈ߹ΘͤͨྻΛ࡞Δ͜ͱ͕Ͱ͖ͨɻ
41 νϟʔτϐϯΛ࠷৽ͷεςοϓʹඥ͚ͮΔɻ
42 X࣠ʹ୯ޠͷΈ߹Θͤ(token_pair)ͷྻΛબ͢Δɻ
43 ιʔτʹY1࣠ͷ߱ॱΛબ͢Δɻ
44 ՄࢹԽ͞Ε͍ͯΔ୯ޠͷΈ߹Θͤͷ͕ଟ͍ͨΊɺ্Ґ50ͷΈΛՄࢹԽ͠ ͍ͨɻ
45 X࣠ͷϝχϡʔ͔Βදࣔ͢Δͷ੍ݶΛબ͢Δɻ
46 • λΠϓʹ্ҐΛબ͢Δɻ • ݁Ռͷʹ50Λબ͢Δɻ
47 Α͘ΘΕΔ୯ޠͷΈ߹Θͤͷ্Ґ50ΛՄࢹԽ͢Δ͜ͱ͕Ͱ͖ͨɻ
48 ϊοΫͱຊgithubɺެ։ͱ͍ͬͨ୯ޠ͕Α͘ΘΕ͍ͯΔΑ͏ͩɻ
49 TwitterΛݟͯΈΔͱɺσʔλαΠΤϯςΟετڠձ͔ΒɺʮσʔλαΠΤϯε 100ຊϊοΫʯͱ͍͏ίϯςϯπ͕githubͰެ։͞Ε͍ͯͨΑ͏ͩɻ
Appendix 50
51 ʮϊοΫ x ຊʯ ͱͳ͍ͬͯΔ͕ɺʮຊ x ϊοΫʯ͕ਖ਼͍͠ͷͰͳ͍͔ʁ
52 σϑΥϧτͰɺҰҙͷΈ߹Θ͚ͤͩΛอ͕࣋ద༻͞Ε͍ͯΔɻ
53 ҰҙͷΈ߹Θ͚ͤͩΛอ͕࣋TRUEͷ߹ɺಉ͡୯ޠͷΈ߹Θ͕ͤҰͭऔ Γআ͔ΕΔɻ FALSE TRUE (σϑΥϧτ)
࣍ճηϛφʔ
55 EXPLORATORY SaaS ΞφϦςΟΫε ϫʔΫγϣοϓ #5 Τϯήʔδϝϯτ Part 3 -
RFV
56 • ୈ1ճɿ SaaSͷ࠷ॏཁKPI ͱͦͷՄࢹԽ Part 1 • ୈ2ճɿ SaaSͷ࠷ॏཁKPI
ͱͦͷՄࢹԽ Part 2 • ୈ3ճɿ Τϯήʔδϝϯτ Part 1 - DAU/MAU • ୈ4ճɿΤϯήʔδϝϯτ Part 2 - ύϫʔϢʔβʔɾΧʔϒ • ୈ5ճɿ Τϯήʔδϝϯτ Part 3 - RFV - 6/26 () • ୈ6ճɿίϗʔτੳ Part 1 • ୈ7ճɿ ίϗʔτੳ Part 2 • ୈ8ճɿ NPSͷܭࢉͱࣗ༝هड़ͷςΩετੳ SaaS ΞφϦςΟΫεɾϫʔΫγϣοϓ
EDA Salon ୳ࡧతσʔλੳΛΈΜͳͰֶͿ
58 Kickstarter
ΫϥυɾϑΝϯσΟϯά
60 σʔλͷ֓ཁ
61 σʔλɾσΟΫγϣφϦ
αϯϓϧͷ࣭ • ޭ͍ͯ͠ΔϓϩδΣΫτʹͲΜͳಛ͕͋Δ͔ʁ • ௐୡֹۚΧςΰϦʔࠃ͝ͱʹҧ͍͋Δ͔ʁ • ࣦഊ͢ΔϓϩδΣΫτͷݪҼԿ͔ʁ 62
None
None
None
7݄։࠵ܾఆʂ ि൛ɿ24ʢۚʣɺ25ʢʣɺ26ʢʣ ฏ൛ɿ28ʢՐʣɺ29ʢਫʣɺ30ʢʣ
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY