Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour # 73 - どの単語の組み合わせがよく使われるかを分析したい
Search
Takato Shiroto
June 23, 2020
Technology
0
110
Exploratory Hour # 73 - どの単語の組み合わせがよく使われるかを分析したい
2020/6/23(火)に開催したExploratory Hourのスライドです。
文章を単語化したデータから、テキストペアをカウントを使って単語の組み合わせを集計する方法を紹介しています。
Takato Shiroto
June 23, 2020
Tweet
Share
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
900
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
310
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
190
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
240
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
110
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
100
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
Apache Iceberg Case Study in LY Corporation
lycorptech_jp
PRO
0
380
AWSアカウントのセキュリティ自動化、どこまで進める? 最適な設計と実践ポイント
yuobayashi
7
1.7k
クラウド関連のインシデントケースを収集して見えてきたもの
lhazy
9
1.9k
リクルートのエンジニア組織を下支えする 新卒の育成の仕組み
recruitengineers
PRO
2
180
MLflowはどのようにLLMOpsの課題を解決するのか
taka_aki
0
140
30→150人のエンジニア組織拡大に伴うアジャイル文化を醸成する役割と取り組みの変化
nagata03
0
350
サバイバルモード下でのエンジニアリングマネジメント
konifar
21
7.2k
Amazon Athenaから利用時のGlueのIcebergテーブルのメンテナンスについて
nayuts
0
110
MIMEと文字コードの闇
hirachan
2
1.5k
入門 PEAK Threat Hunting @SECCON
odorusatoshi
0
180
【Snowflake九州ユーザー会#2】BigQueryとSnowflakeを比較してそれぞれの良し悪しを掴む / BigQuery vs Snowflake: Pros & Cons
civitaspo
2
730
大規模アジャイルフレームワークから学ぶエンジニアマネジメントの本質
staka121
PRO
3
1.6k
Featured
See All Featured
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
13
1k
KATA
mclloyd
29
14k
Testing 201, or: Great Expectations
jmmastey
42
7.2k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
46
2.4k
The Pragmatic Product Professional
lauravandoore
32
6.4k
Unsuck your backbone
ammeep
669
57k
Six Lessons from altMBA
skipperchong
27
3.6k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
45
9.4k
GitHub's CSS Performance
jonrohan
1030
460k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
Exploratory Hour
ࠓिͷ࣭ • Ͳͷ୯ޠͷΈ߹Θ͕ͤΑ͘ΘΕΔ͔Λੳ͍ͨ͠ • ಛఆͷจࣈྻؚ͕·Ε͍ͯΔߦʹTRUEͷϥϕϧΛ͚͍ͭͨ 4
ࠓिͷ࣭ • Ͳͷ୯ޠͷΈ߹Θ͕ͤΑ͘ΘΕΔ͔Λੳ͍ͨ͠ • ಛఆͷจࣈྻؚ͕·Ε͍ͯΔߦʹTRUEͷϥϕϧΛ͚͍ͭͨ 5
6 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
લճͷExploratory Hourͷ͋Β͢͡ 7
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ʮσʔλʯͱʮαΠΤϯεʯͱ͍͏୯ޠΛϑΟϧλΛͬͯऔΓআ͘ɻ
11
12 ୯ޠԽͰݕࡧ
13 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
14 ྫ͑ɺػցͱֶशҰॹʹΘΕ͍ͯΔͷͰͳ͍͔ʁ
15 ͦΕͱɺpythonͱAI͕ҰॹʹΘΕ͍ͯΔ͔͠Εͳ͍ɻ
Α͘ΘΕΔ୯ޠͷΈ߹ΘͤΛΔʹʁ 16
17 จষΛ୯ޠԽͨ͠σʔλ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1
18 ୯ޠͷΈ߹ΘͤΛ͑Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
19 ͔͠͠ɺσʔλʹΑΓଟ͘ͷυΩϡϝϯτ(document_id)͕ଘࡏ͢Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2
20 υΩϡϝϯτ(document_id)͝ͱʹɺάϧʔϓΛ͚Δɻ token count document_id σʔλ 1 1 αΠΤϯε 1
1 ֶश 1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2
token count document_id σʔλ 1 1 αΠΤϯε 1 1 ֶश
1 1 σʔλ 1 2 αΠΤϯε 1 2 ຊ 1 2 21 υΩϡϝϯτ͝ͱʹɺ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1 2 σʔλ αΠΤϯε 1 2 αΠΤϯε ຊ 1 2 ຊ σʔλ 1
22 ୯ޠͷΈ߹Θͤ͝ͱʹɺΛूܭ͢Δɻ document_id token_x token_y value 1 σʔλ αΠΤϯε 1
1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1 2 σʔλ αΠΤϯε 1 2 αΠΤϯε ຊ 1 2 ຊ σʔλ 1 token_x token_y value σʔλ αΠΤϯε 2 αΠΤϯε ֶश 1 ֶश σʔλ 1 αΠΤϯε ຊ 1 ຊ σʔλ 1
23 จষΛ୯ޠԽͨ͠σʔλ
24 ୯ޠ(token)ͷྻϔομϝχϡʔ͔ΒςΩετσʔλͷՃ(UI)ͷςΩετϖΞΛ ΧϯτΛબ͢Δɻ
25 ςΩετϖΞΛΧϯτͷμΠΞϩά͕දࣔ͞ΕΔɻ
26 ୯ޠԽ͞ΕͨྻʹtokenɺจॻIDͷྻʹdocument_id͕બ͞Ε͍ͯΔɻ
27 ୯ޠͷΈ߹Θͤͷ͕ूܭ͞Εͨɻ
28 αϚϦɾϏϡʔ͔Β୯ޠͷΈ߹Θͤͷ(value)ͷྻΛݟΔͱɺ1ճ͔Β11ճ ʹσʔλ͕ू·͍ͬͯΔΑ͏ͩɻ
29 ͜ͷ··Ͱɺ͋·ΓΘΕͳ͍୯ޠͷΈ߹ΘͤՄࢹԽ͞Εͯ͠·͏ͨ ΊɺϑΟϧλΛ͕ͬͯ10Ҏ্ͷΈ߹Θ͚ͤͩΛ͍ͨ͠ɻ
30 ྻϔομϝχϡʔ͔ΒϑΟϧλͷҎ্Λબ͢Δɻ
31 ʹ10Λೖྗͯ͠ɺ࣮ߦ͢Δɻ
32 ୯ޠͷΈ߹Θͤͷ͕10Ҏ্ͷσʔλͷΈʹ͢Δ͜ͱ͕Ͱ͖ͨɻ
33 • νϟʔτλΠϓʹόʔΛબ͢Δɻ • X࣠ʹtoken.xΛબ͢Δɻ • Y࣠ʹvalueΛબ͢Δɻ
34 ͜ͷ··ͰɺҰͭͷ୯ޠͷΈՄࢹԽ͞ΕɺΈ߹Θ͕ͤΘ͔Βͳ͍ɻ
35 ͳͥͳΒɺX࣠ʹҰͭͷྻ(Ұͭͷ୯ޠ)͔͠બͰ͖ͳ͍͔Βɻ
୯ޠͲ͏͠ΛΈ߹ΘͤͨྻΛ࡞Δʂ 36
37 token.xͱtoken.yΛબͼɺྻϔομϝχϡʔ͔ΒෳͷྻΛͭͳ͛ΔΛબ͢Δɻ
38 ෳͷྻΛͭͳ͛ΔͷμΠΞϩά͕දࣔ͞ΕΔɻ
39 ৽͍͠ྻ໊ʹҙͷ໊લΛೖྗ࣮ͯ͠ߦ͢Δɻ
40 ୯ޠͲ͏͠ΛΈ߹ΘͤͨྻΛ࡞Δ͜ͱ͕Ͱ͖ͨɻ
41 νϟʔτϐϯΛ࠷৽ͷεςοϓʹඥ͚ͮΔɻ
42 X࣠ʹ୯ޠͷΈ߹Θͤ(token_pair)ͷྻΛબ͢Δɻ
43 ιʔτʹY1࣠ͷ߱ॱΛબ͢Δɻ
44 ՄࢹԽ͞Ε͍ͯΔ୯ޠͷΈ߹Θͤͷ͕ଟ͍ͨΊɺ্Ґ50ͷΈΛՄࢹԽ͠ ͍ͨɻ
45 X࣠ͷϝχϡʔ͔Βදࣔ͢Δͷ੍ݶΛબ͢Δɻ
46 • λΠϓʹ্ҐΛબ͢Δɻ • ݁Ռͷʹ50Λબ͢Δɻ
47 Α͘ΘΕΔ୯ޠͷΈ߹Θͤͷ্Ґ50ΛՄࢹԽ͢Δ͜ͱ͕Ͱ͖ͨɻ
48 ϊοΫͱຊgithubɺެ։ͱ͍ͬͨ୯ޠ͕Α͘ΘΕ͍ͯΔΑ͏ͩɻ
49 TwitterΛݟͯΈΔͱɺσʔλαΠΤϯςΟετڠձ͔ΒɺʮσʔλαΠΤϯε 100ຊϊοΫʯͱ͍͏ίϯςϯπ͕githubͰެ։͞Ε͍ͯͨΑ͏ͩɻ
Appendix 50
51 ʮϊοΫ x ຊʯ ͱͳ͍ͬͯΔ͕ɺʮຊ x ϊοΫʯ͕ਖ਼͍͠ͷͰͳ͍͔ʁ
52 σϑΥϧτͰɺҰҙͷΈ߹Θ͚ͤͩΛอ͕࣋ద༻͞Ε͍ͯΔɻ
53 ҰҙͷΈ߹Θ͚ͤͩΛอ͕࣋TRUEͷ߹ɺಉ͡୯ޠͷΈ߹Θ͕ͤҰͭऔ Γআ͔ΕΔɻ FALSE TRUE (σϑΥϧτ)
࣍ճηϛφʔ
55 EXPLORATORY SaaS ΞφϦςΟΫε ϫʔΫγϣοϓ #5 Τϯήʔδϝϯτ Part 3 -
RFV
56 • ୈ1ճɿ SaaSͷ࠷ॏཁKPI ͱͦͷՄࢹԽ Part 1 • ୈ2ճɿ SaaSͷ࠷ॏཁKPI
ͱͦͷՄࢹԽ Part 2 • ୈ3ճɿ Τϯήʔδϝϯτ Part 1 - DAU/MAU • ୈ4ճɿΤϯήʔδϝϯτ Part 2 - ύϫʔϢʔβʔɾΧʔϒ • ୈ5ճɿ Τϯήʔδϝϯτ Part 3 - RFV - 6/26 () • ୈ6ճɿίϗʔτੳ Part 1 • ୈ7ճɿ ίϗʔτੳ Part 2 • ୈ8ճɿ NPSͷܭࢉͱࣗ༝هड़ͷςΩετੳ SaaS ΞφϦςΟΫεɾϫʔΫγϣοϓ
EDA Salon ୳ࡧతσʔλੳΛΈΜͳͰֶͿ
58 Kickstarter
ΫϥυɾϑΝϯσΟϯά
60 σʔλͷ֓ཁ
61 σʔλɾσΟΫγϣφϦ
αϯϓϧͷ࣭ • ޭ͍ͯ͠ΔϓϩδΣΫτʹͲΜͳಛ͕͋Δ͔ʁ • ௐୡֹۚΧςΰϦʔࠃ͝ͱʹҧ͍͋Δ͔ʁ • ࣦഊ͢ΔϓϩδΣΫτͷݪҼԿ͔ʁ 62
None
None
None
7݄։࠵ܾఆʂ ि൛ɿ24ʢۚʣɺ25ʢʣɺ26ʢʣ ฏ൛ɿ28ʢՐʣɺ29ʢਫʣɺ30ʢʣ
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY