Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour # 73 - どの単語の組み合わせがよく使われるかを分析したい
Search
Takato Shiroto
June 23, 2020
Technology
0
110
Exploratory Hour # 73 - どの単語の組み合わせがよく使われるかを分析したい
2020/6/23(火)に開催したExploratory Hourのスライドです。
文章を単語化したデータから、テキストペアをカウントを使って単語の組み合わせを集計する方法を紹介しています。
Takato Shiroto
June 23, 2020
Tweet
Share
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
900
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
320
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
200
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
260
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
120
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
110
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
【TiDB GAME DAY 2025】Shadowverse: Worlds Beyond にみる TiDB 活用術
cygames
0
900
A2Aのクライアントを自作する
rynsuke
1
150
Microsoft Build 2025 技術/製品動向 for Microsoft Startup Tech Community
torumakabe
1
210
20250625 Snowflake Summit 2025活用事例 レポート / Nowcast Snowflake Summit 2025 Case Study Report
kkuv
1
230
標準技術と独自システムで作る「つらくない」SaaS アカウント管理 / Effortless SaaS Account Management with Standard Technologies & Custom Systems
yuyatakeyama
2
1k
IIWレポートからみるID業界で話題のMCP
fujie
0
740
rubygem開発で鍛える設計力
joker1007
1
130
Agentic Workflowという選択肢を考える
tkikuchi1002
1
400
実践! AIエージェント導入記
1mono2prod
0
150
Кто отправит outbox? Валентин Удальцов, автор канала Пых
lamodatech
0
290
ローカルLLMでファインチューニング
knishioka
0
130
~宇宙最速~2025年AWS Summit レポート
satodesu
1
1.4k
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
Gamification - CAS2011
davidbonilla
81
5.3k
What's in a price? How to price your products and services
michaelherold
245
12k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
36
2.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Docker and Python
trallard
44
3.4k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.8k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
137
34k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
920
Six Lessons from altMBA
skipperchong
28
3.8k
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
Exploratory Hour
ࠓिͷ࣭ • Ͳͷ୯ޠͷΈ߹Θ͕ͤΑ͘ΘΕΔ͔Λੳ͍ͨ͠ • ಛఆͷจࣈྻؚ͕·Ε͍ͯΔߦʹTRUEͷϥϕϧΛ͚͍ͭͨ 4
ࠓिͷ࣭ • Ͳͷ୯ޠͷΈ߹Θ͕ͤΑ͘ΘΕΔ͔Λੳ͍ͨ͠ • ಛఆͷจࣈྻؚ͕·Ε͍ͯΔߦʹTRUEͷϥϕϧΛ͚͍ͭͨ 5
6 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
લճͷExploratory Hourͷ͋Β͢͡ 7
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ʮσʔλʯͱʮαΠΤϯεʯͱ͍͏୯ޠΛϑΟϧλΛͬͯऔΓআ͘ɻ
11
12 ୯ޠԽͰݕࡧ
13 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
14 ྫ͑ɺػցͱֶशҰॹʹΘΕ͍ͯΔͷͰͳ͍͔ʁ
15 ͦΕͱɺpythonͱAI͕ҰॹʹΘΕ͍ͯΔ͔͠Εͳ͍ɻ
Α͘ΘΕΔ୯ޠͷΈ߹ΘͤΛΔʹʁ 16
17 จষΛ୯ޠԽͨ͠σʔλ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1
18 ୯ޠͷΈ߹ΘͤΛ͑Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
19 ͔͠͠ɺσʔλʹΑΓଟ͘ͷυΩϡϝϯτ(document_id)͕ଘࡏ͢Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2
20 υΩϡϝϯτ(document_id)͝ͱʹɺάϧʔϓΛ͚Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2
token count document_id σʔλ 1 1 αΠΤϯε 1 1 ֶश
1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2 21 υΩϡϝϯτ͝ͱʹɺ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1 2 σʔλ αΠΤϯε 1 2 αΠΤϯε ຊ 1 2 ຊ σʔλ 1
22 ୯ޠͷΈ߹Θͤ͝ͱʹɺΛूܭ͢Δɻ document_id token_x token_y value 1 σʔλ αΠΤϯε 1
1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1 2 σʔλ αΠΤϯε 1 2 αΠΤϯε ຊ 1 2 ຊ σʔλ 1 token_x token_y value σʔλ αΠΤϯε 2 αΠΤϯε ֶश 1 ֶश σʔλ 1 αΠΤϯε ຊ 1 ຊ σʔλ 1
23 จষΛ୯ޠԽͨ͠σʔλ
24 ୯ޠ(token)ͷྻϔομϝχϡʔ͔ΒςΩετσʔλͷՃ(UI)ͷςΩετϖΞΛ ΧϯτΛબ͢Δɻ
25 ςΩετϖΞΛΧϯτͷμΠΞϩά͕දࣔ͞ΕΔɻ
26 ୯ޠԽ͞ΕͨྻʹtokenɺจॻIDͷྻʹdocument_id͕બ͞Ε͍ͯΔɻ
27 ୯ޠͷΈ߹Θͤͷ͕ूܭ͞Εͨɻ
28 αϚϦɾϏϡʔ͔Β୯ޠͷΈ߹Θͤͷ(value)ͷྻΛݟΔͱɺ1ճ͔Β11ճ ʹσʔλ͕ू·͍ͬͯΔΑ͏ͩɻ
29 ͜ͷ··Ͱɺ͋·ΓΘΕͳ͍୯ޠͷΈ߹ΘͤՄࢹԽ͞Εͯ͠·͏ͨ ΊɺϑΟϧλΛ͕ͬͯ10Ҏ্ͷΈ߹Θ͚ͤͩΛ͍ͨ͠ɻ
30 ྻϔομϝχϡʔ͔ΒϑΟϧλͷҎ্Λબ͢Δɻ
31 ʹ10Λೖྗͯ͠ɺ࣮ߦ͢Δɻ
32 ୯ޠͷΈ߹Θͤͷ͕10Ҏ্ͷσʔλͷΈʹ͢Δ͜ͱ͕Ͱ͖ͨɻ
33 • νϟʔτλΠϓʹόʔΛબ͢Δɻ • X࣠ʹtoken.xΛબ͢Δɻ • Y࣠ʹvalueΛબ͢Δɻ
34 ͜ͷ··ͰɺҰͭͷ୯ޠͷΈՄࢹԽ͞ΕɺΈ߹Θ͕ͤΘ͔Βͳ͍ɻ
35 ͳͥͳΒɺX࣠ʹҰͭͷྻ(Ұͭͷ୯ޠ)͔͠બͰ͖ͳ͍͔Βɻ
୯ޠͲ͏͠ΛΈ߹ΘͤͨྻΛ࡞Δʂ 36
37 token.xͱtoken.yΛબͼɺྻϔομϝχϡʔ͔ΒෳͷྻΛͭͳ͛ΔΛબ͢Δɻ
38 ෳͷྻΛͭͳ͛ΔͷμΠΞϩά͕දࣔ͞ΕΔɻ
39 ৽͍͠ྻ໊ʹҙͷ໊લΛೖྗ࣮ͯ͠ߦ͢Δɻ
40 ୯ޠͲ͏͠ΛΈ߹ΘͤͨྻΛ࡞Δ͜ͱ͕Ͱ͖ͨɻ
41 νϟʔτϐϯΛ࠷৽ͷεςοϓʹඥ͚ͮΔɻ
42 X࣠ʹ୯ޠͷΈ߹Θͤ(token_pair)ͷྻΛબ͢Δɻ
43 ιʔτʹY1࣠ͷ߱ॱΛબ͢Δɻ
44 ՄࢹԽ͞Ε͍ͯΔ୯ޠͷΈ߹Θͤͷ͕ଟ͍ͨΊɺ্Ґ50ͷΈΛՄࢹԽ͠ ͍ͨɻ
45 X࣠ͷϝχϡʔ͔Βදࣔ͢Δͷ੍ݶΛબ͢Δɻ
46 • λΠϓʹ্ҐΛબ͢Δɻ • ݁Ռͷʹ50Λબ͢Δɻ
47 Α͘ΘΕΔ୯ޠͷΈ߹Θͤͷ্Ґ50ΛՄࢹԽ͢Δ͜ͱ͕Ͱ͖ͨɻ
48 ϊοΫͱຊgithubɺެ։ͱ͍ͬͨ୯ޠ͕Α͘ΘΕ͍ͯΔΑ͏ͩɻ
49 TwitterΛݟͯΈΔͱɺσʔλαΠΤϯςΟετڠձ͔ΒɺʮσʔλαΠΤϯε 100ຊϊοΫʯͱ͍͏ίϯςϯπ͕githubͰެ։͞Ε͍ͯͨΑ͏ͩɻ
Appendix 50
51 ʮϊοΫ x ຊʯ ͱͳ͍ͬͯΔ͕ɺʮຊ x ϊοΫʯ͕ਖ਼͍͠ͷͰͳ͍͔ʁ
52 σϑΥϧτͰɺҰҙͷΈ߹Θ͚ͤͩΛอ͕࣋ద༻͞Ε͍ͯΔɻ
53 ҰҙͷΈ߹Θ͚ͤͩΛอ͕࣋TRUEͷ߹ɺಉ͡୯ޠͷΈ߹Θ͕ͤҰͭऔ Γআ͔ΕΔɻ FALSE TRUE (σϑΥϧτ)
࣍ճηϛφʔ
55 EXPLORATORY SaaS ΞφϦςΟΫε ϫʔΫγϣοϓ #5 Τϯήʔδϝϯτ Part 3 -
RFV
56 • ୈ1ճɿ SaaSͷ࠷ॏཁKPI ͱͦͷՄࢹԽ Part 1 • ୈ2ճɿ SaaSͷ࠷ॏཁKPI
ͱͦͷՄࢹԽ Part 2 • ୈ3ճɿ Τϯήʔδϝϯτ Part 1 - DAU/MAU • ୈ4ճɿΤϯήʔδϝϯτ Part 2 - ύϫʔϢʔβʔɾΧʔϒ • ୈ5ճɿ Τϯήʔδϝϯτ Part 3 - RFV - 6/26 () • ୈ6ճɿίϗʔτੳ Part 1 • ୈ7ճɿ ίϗʔτੳ Part 2 • ୈ8ճɿ NPSͷܭࢉͱࣗ༝هड़ͷςΩετੳ SaaS ΞφϦςΟΫεɾϫʔΫγϣοϓ
EDA Salon ୳ࡧతσʔλੳΛΈΜͳͰֶͿ
58 Kickstarter
ΫϥυɾϑΝϯσΟϯά
60 σʔλͷ֓ཁ
61 σʔλɾσΟΫγϣφϦ
αϯϓϧͷ࣭ • ޭ͍ͯ͠ΔϓϩδΣΫτʹͲΜͳಛ͕͋Δ͔ʁ • ௐୡֹۚΧςΰϦʔࠃ͝ͱʹҧ͍͋Δ͔ʁ • ࣦഊ͢ΔϓϩδΣΫτͷݪҼԿ͔ʁ 62
None
None
None
7݄։࠵ܾఆʂ ि൛ɿ24ʢۚʣɺ25ʢʣɺ26ʢʣ ฏ൛ɿ28ʢՐʣɺ29ʢਫʣɺ30ʢʣ
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY