Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グルー...
Search
Takato Shiroto
December 22, 2020
Technology
0
96
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グループごと」に集計したい
2020/12/22(火)に開催したExploratory Hourのスライドです。
文章が単語化されたデータから、単語の組み合わせをグループごとに集計する方法を紹介しています。
Takato Shiroto
December 22, 2020
Tweet
Share
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
900
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
300
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
170
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
230
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
99
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
97
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
Shift-from-React-to-Vue
calm1205
3
1.3k
ABEMA のコンテンツ制作を最適化!生成 AI x クラウド映像編集システム / abema-ai-editor
cyberagentdevelopers
PRO
1
180
Fargateを使った研修の話
takesection
0
120
CyberAgent 生成AI Deep Dive with Amazon Web Services / genai-aws
cyberagentdevelopers
PRO
1
480
現地でMeet Upをやる場合の注意点〜反省点を添えて〜
shotashiratori
0
530
来年もre:Invent2024 に行きたいあなたへ - “集中”と“つながり”で楽しむ -
ny7760
0
470
小規模に始めるデータメッシュとデータガバナンスの実践
kimujun
3
590
【若手エンジニア応援LT会】AWSで繋がり、共に成長! ~コミュニティ活動と新人教育への挑戦~
kazushi_ohata
0
180
IaC運用を楽にするためにCDK Pipelinesを導入したけど、思い通りにいかなかった話
smt7174
1
110
【技術書典17】OpenFOAM(自宅で極める流体解析)2次元円柱まわりの流れ
kamakiri1225
0
210
最速最小からはじめるデータプロダクト / Data Product MVP
amaotone
5
740
MAMを軸とした動画ハンドリングにおけるAI活用前提の整備と次世代ビジョン / abema-ai-mam
cyberagentdevelopers
PRO
1
110
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
Being A Developer After 40
akosma
86
590k
Adopting Sorbet at Scale
ufuk
73
9k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
3
370
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.2k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
364
22k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
A Philosophy of Restraint
colly
203
16k
Code Review Best Practice
trishagee
64
17k
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
3 • ࣭͝zoomͷνϟοτʹ͝ߘ͍ͩ͘͞ɻ • ηϛφʔͷײʹཱͭใΛTwitterͰϋογϡλάΛ ͚ͭͯπΠʔτΛ͓ئ͍͠·͢ɻ #Exploratoryηϛφʔ Exploratory Hour
Exploratory Hour
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹू ܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹ ूܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
7 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
ಉ͡จষͷதͰҰॹʹΘΕΔ୯ޠͷΈ߹ ΘͤΛΓ͍ͨɻ 11
12 ྫ͑ɺAIͱػցֶशΑ͘ҰॹʹΘΕΔͷͰͳ͍͔ʁ
13 ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token count 1 σʔλ 1 1 αΠΤϯε
1 1 ֶश 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
14 ςΩετσʔλͷՃʹ͋Δʮ୯ޠͷΈ߹ΘͤΛΧϯτʯ͔Β࣮ߦͰ͖Δɻ
15 ୯ޠͷΈ߹ΘͤΛ͑ͨσʔλ
16 ୯ޠͷΈ߹ΘͤΛόʔνϟʔτͰՄࢹԽ
17
18 ʮ୯ޠʯͰݕࡧ
σόΠεʹΑͬͯҰॹʹΘΕΔ୯ޠͷ Έ߹Θͤͷʹҧ͍͋Δͷ͔ʁ 19
20 άϧʔϓʢσόΠεʣ͝ͱʹ୯ޠͷΈ߹ΘͤͷΛूܭ͢Δɻ device token_x token_y value mobile σʔλ αΠΤϯε 10
mobile σʔλ ߴߍੜ 6 mobile ߴߍੜ ߨٛ 5 mobile ڭҭ σʔλ 5 pc σʔλ αΠΤϯε 8 pc σʔλ ࣾձਓ 6 pc ࣾձਓ ߨ࠲ 5 pc େֶ ࣾձਓ 4
21 ݩʑͷσʔλʹdeviceͷྻ͕͋Δɻ
22 ͔͠͠ɺ୯ޠԽͨ͠ࡍʹଞͷྻ͕ফ͑ͯ͠·͍ͬͯΔΑ͏ͩɻ
23 จষΛ୯ޠԽͨ͠εςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
24 ଞͷྻΛอ࣋͢Δʹʮ͍ʯΛબ࣮ͯ͠ߦ͢Δɻ
25 ୯ޠԽ͢ΔࡍʹଞͷྻΛ͢͜ͱ͕Ͱ͖ͨɻ
26 ςΩετϖΞΛΧϯτͷεςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
27 άϧʔϓԽ͢ΔྻʹʮdeviceʯΛબ࣮ͯ͠ߦ͢Δɻ
28 device͝ͱʹ୯ޠͷΈ߹ΘͤΛٻΊΔ͜ͱ͕Ͱ͖ͨɻ
29 όʔνϟʔτͷ܁Γฦ͠ʹʮdeviceʯΛબ͢Δɻ
30 mobileͷϢʔβʔঁࢠɺ౦ژɺதߴɺڭ͑Δͱ͍ͬͨ୯ޠ͕ΘΕ͓ͯΓɺ pcϢʔβʔͰɺAIɺେࡕɺۀɺߨ࠲ͱ͍ͬͨ୯ޠ͕ΘΕ͍ͯΔɻ
31 TwitterΛݟͯΈΔͱɺ౦ژঁࢠֶԂͱ͍͏ֶߍͰதߴੜʹσʔλαΠΤϯεΛڭ͍͑ͯΔͷ ͱɺେࡕۀେֶͰࣾձਓ͚ͷσʔλαΠΤϯεߨ࠲͕։ߨ͞ΕͨΑ͏ͩɻ
࣍ճηϛφʔ
EXPLORATORY ΦϯϥΠϯɾηϛφʔ #41 ͳͥExcelϢʔβʔ ExploratoryΛ͏͖ͳͷ͔
None
35
None
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄2(Ր), 3(ਫ), 4()
None
• ϏδωεͰ͑Δࢥߟྗͷҭ σʔλαΠΤϯεͷεΩϧशಘ͚ͩͰͳ͘ɺσʔλΛͬͨΑΓΑ͍ҙࢥܾఆΛߦ͏ͨ Ίʹඞཁͳ౷ܭతɾ֬తࢥߟྗशಘͰ͖Δɻ • ݱͰ͑ΔεΩϧͷशಘ ڭࣨͷத͚ͩͰ௨༻͢ΔཧΑΓɺ࣮ࡍͷϏδωεͷݱͰͷΛղܾ͢ΔͨΊʹ ͑ΔεΩϧͷशಘʹॏ৺Λ͓͍ͨτϨʔχϯάɻ • ϓϩάϥϛϯάͳ͠
RݴޠͷUIͰ͋ΔExploratoryΛੳπʔϧͱͯ͠༻͢ΔͨΊɺࢥߟྗͱσʔλαΠΤϯ εͷख๏ͷशಘʹ100ˋूதͰ͖Δɻ ಛ
σʔλϥϯάϦϯάɾτϨʔχϯά 2݄։࠵ʂ EXPLORATORY
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄18(),19(ۚ)
None
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY