Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory: データラングリング:テキスト・データの加工
Search
Kan Nishida
January 15, 2019
Technology
0
3.8k
Exploratory: データラングリング:テキスト・データの加工
ExploratoryとRを使った、テキスト・データを加工するための様々なデータラングリングの手法を紹介します。
Kan Nishida
January 15, 2019
Tweet
Share
More Decks by Kan Nishida
See All by Kan Nishida
Seminar #52 - Introduction to Exploratory Server
kanaugust
0
370
Exploratory セミナー #61 政府のオープンデータ e-Statの活用
kanaugust
0
1.1k
Exploratory セミナー #60 時系列データの加工、可視化、分析手法の紹介
kanaugust
0
1.2k
Seminar #51 - Machine Learning - How Variable Importance Works
kanaugust
0
710
Exploratory セミナー #59 テキストデータの加工
kanaugust
0
720
Seminar #50 - Salesforce Data, Clean, Visualize, Analyze, & Dashboard
kanaugust
1
440
Exploratory セミナー #58 Exploratory x Salesforce
kanaugust
0
370
Exploratory Seminar #49 - Introduction to Dashboard Cycle with Exploratory
kanaugust
0
440
Seminar #48 - Introduction to Exploratory v6.6
kanaugust
0
380
Other Decks in Technology
See All in Technology
因果AIへの招待
sshimizu2006
0
980
30分であなたをOmniのファンにしてみせます~分析画面のクリック操作をそのままコード化できるAI-ReadyなBIツール~
sagara
0
150
今年のデータ・ML系アップデートと気になるアプデのご紹介
nayuts
1
420
JEDAI認定プログラム JEDAI Order 2026 エントリーのご案内 / JEDAI Order 2026 Entry
databricksjapan
0
110
[JAWS-UG 横浜支部 #91]DevOps Agent vs CloudWatch Investigations -比較と実践-
sh_fk2
2
260
1人1サービス開発しているチームでのClaudeCodeの使い方
noayaoshiro
1
170
ガバメントクラウド利用システムのライフサイクルについて
techniczna
0
190
大企業でもできる!ボトムアップで拡大させるプラットフォームの作り方
findy_eventslides
1
790
エンジニアリングをやめたくないので問い続ける
estie
2
1.2k
「図面」から「法則」へ 〜メタ視点で読み解く現代のソフトウェアアーキテクチャ〜
scova0731
0
240
5分で知るMicrosoft Ignite
taiponrock
PRO
0
380
Lookerで実現するセキュアな外部データ提供
zozotech
PRO
0
140
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Building Adaptive Systems
keathley
44
2.9k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Designing for humans not robots
tammielis
254
26k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
What's in a price? How to price your products and services
michaelherold
246
13k
[SF Ruby Conf 2025] Rails X
palkan
0
530
Navigating Team Friction
lara
191
16k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
710
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
Transcript
EXPLORATORY
2 εϐʔΧʔ ా צҰ CEO EXPLORATORY ུྺ ถΦϥΫϧຊࣾͰɺ16ʹΘͨΓσʔλαΠΤϯεͷ։ൃνʔϜΛ ͍ɺػցֶशɺϏοάɾσʔλɺϏδωεɾΠϯςϦδΣϯεɺσʔ λϕʔεʹؔ͢Δଟ͘ͷΛੈʹૹΓग़͢ɻ
2016ॳ಄ʹɺΦʔϓϯιʔεͷੈքͰى͖͍ͯΔσʔλαΠΤϯε ͷֵ৽తͳਐาΛɺੈքͷ99%ͷϓϩάϥϛϯάΛ͠ͳ͍ਓͨͪͷ ͱಧ͚͍ͨͱ͍͏ࢥ͍ͷͱɺExploratory, Inc Λ্ཱͪ͛Δɻ ݱࡏExploratory, Inc.ͰCEOΛΊΔ͔ͨΘΒɺσʔλαΠΤϯεɾ ϒʔτΩϟϯϓɾτϨʔχϯάͳͲΛ௨ͯ͠γϦίϯόϨʔͰߦΘΕ ͍ͯΔ࠷ઌͷσʔλαΠΤϯεͷීٴͱڭҭʹऔΓΉɻ @KanAugust
Vision ͯ͢ͷਓ͕σʔλΛͬͯ ΑΓΑ͍ҙࢥܾఆΛ͢Δ
Mission ΞφϦςΟΫεͷຽओԽ
5 ୈ̏ͷ σʔλαΠΤϯεɺAIɺػցֶश౷ܭֶऀɺ։ൃऀͷͨΊ͚ͩͷͷͰ͋Γ·ͤΜɻ σʔλʹڵຯͷ͋ΔਓͳΒ୭͕ੈքͰ࠷ઌͷΞϧΰϦζϜΛͬͯ ϏδωεσʔλΛ؆୯ʹੳͰ͖Δ͖Ͱ͢ɻ Exploratory͕ͦ͏ͨ͠ੈքΛՄೳʹ͠·͢ɻ
ୈ1ͷ ୈ̎ͷ ୈ̏ͷ ϓϥΠϕʔτ(ߴ͍/ݹ͍) Φʔϓϯɾιʔε(ແྉ/࠷ઌ) UI & ϓϩάϥϛϯά ϓϩάϥϛϯά 2016
2000 1976 ϚωλΠθʔγϣϯ ίϞσΟςΟԽ ຽओԽ ౷ܭֶऀ σʔλαΠΤϯςΟετ Exploratory ΞϧΰϦζϜ Ϣʔβʔɾ ମݧ πʔϧ Φʔϓϯɾιʔε(ແྉ/࠷ઌ) UI & ࣗಈԽ ϏδωεɾϢʔβʔ ςʔϚ σʔλαΠΤϯεͷຽओԽ
質問 σʔλαΠΤϯεɾϫʔΫϑϩʔ 伝える データアクセス 加⼯ 可視化 機械学習・AI 統計
質問 ExploratoryͰ؆୯ʹͰ͖ΔλεΫ 伝える データアクセス 加⼯ 可視化 機械学習/AI・ 統計
ςΩετɾσʔλΛૢΔ
جૅ
ਖ਼نදݱ ςΩετ͔ΒΛநग़͢Δ [\d,]+(\.\d+)? “ϏοτίΠϯͷҝସϨʔτ288,425.12ԁͰ͢ɻ” 288,425.12
@[[a-zA-Z0-9].-]+$ “
[email protected]
” exploratory.io emailΞυϨε͔ΒυϝΠϯΛநग़͢Δ ਖ਼نදݱ
͔͠͠ɺ ॏཁͳςΩετॲཧͷଟ͘ਖ਼نදݱͳ͠Ͱ Ͱ͖Δɻ
ॏཁͳςΩετૢ࡞ 1. ࣈͷม 2. จࣈྻΛݟ͚ͭΔ 3. ෳͷྻͷׂ 4. ෳͷߦͷׂ 5.
ΫϦʔϯΞοϓ 6. ஔ͢Δ 7. Ұ෦Λൈ͖ग़͢ 8. ݁߹͢Δ
આ໌ - σʔλ • Ϣʔβʔใ • ͦΕͧΕͷߦɺ͋ΔΣϒαʔϏεͷϢʔβʔΞΧϯτใΛද͢ • 4,386 ݅ͷϢʔβʔΞΧϯτ
• ֤ϢʔβʔΞΧϯτʹɺemailɺ ɺ໊ɺࠃɺڵຯɺ༻OSͷྻ ͕͋Δ
None
None
ࣈͷม
ࣈͷม - average_monthly_spendingྻจࣈܕͷ σʔλܕ͕ͩɺ͔ͦ͜ΒΛऔΓग़͠ ͍ͨɻ
ΧϥϜϔομϝχϡʔ͔Β 1. “σʔλλΠϓΛม”Λબ 2. “ʹม”Λબ ࣈͷม - ݺͼग़͠
ࣈͷม - ݺͼग़͠
จࣈྻΛݟ͚ͭΔ
จࣈྻΛݟ͚ͭΔ - ԿਓͷϢʔβʔ͕gmailΛ͍ͬͯΔ͔ʁ
ΧϥϜϔομϝχϡʔ͔Β 1. “ςΩετσʔλΛૢ࡞”Λબ 2. “͜ͷจࣈྻΛؚΉ͔Ͳ͏͔”Λબ จࣈྻΛݟ͚ͭΔ - ݺͼग़͠
จࣈྻΛݟ͚ͭΔ - ݺͼग़͠
͠emailΞυϨε͕gmailͳΒ ͜ͷྻͷTRUEʹͳΔɻ จࣈྻΛݟ͚ͭΔ - ݺͼग़͠
จࣈྻΛݟ͚ͭΔ - ݺͼग़͠ gmailΛ͍ͬͯΔϢʔβʔ 592ਓͰશମͷ13.50%
ෳͷྻͷׂ
emailΞυϨεΛ໊લͷ෦ͱυϝΠϯͷ ෦ʹׂ͍ͨ͠ɻ ෳͷྻͷׂ -
ΧϥϜϔομϝχϡʔ͔Β 1. “ׂ”Λબ 2. “…Ͱྻʹׂ”Λબ 3. “ΧελϜ”Λબ ෳͷྻͷׂ - ݺͼग़͠
ෳͷྻͷׂ - ݺͼग़͠
ෳͷྻͷׂ - ݺͼग़͠
ෳͷߦͷׂ
ෳͷߦͷׂ - Ϣʔβʔͷڵຯ(͔̍ͭͦΕҎ্)͕ ΧϯϚ۠ΓͰinterestsͱ͍͏ྻ ʹ֨ೲ͞Ε͍ͯΔ͕ɺڵຯҰͭʹ ͍ͭͯҰߦʹ͍ͨ͠ɻ
ΧϥϜϔομϝχϡʔ͔Β 1. “ׂ”Λબ 2. “…Ͱߦʹׂ”Λબ 3. “Comma(,)” ෳͷߦͷׂ - ݺͼग़͠
ෳͷߦͷׂ - ݺͼग़͠
“interests” ྻͷ ΧϯϚͰ۠ͬͯෳͷߦׂ͞Εͨɻ ෳͷߦͷׂ - ݺͼग़͠
͋͠ΔϢʔβʔ͕ෳͷ߲Λ “interests”ྻʹೖΕ͍ͯͨ߹ɺ ߲Ұͭʹରͯ͠ߦ͕ҰߦͰ͖͍ͯΔͷ ͕Θ͔Δ ෳͷߦͷׂ - ݺͼग़͠
ΫϦʔϯΞοϓ
ΫϦʔϯΞοϓ - σʔλʹվߦίʔυ(\n)ɺλϒ(\t)ͱ ͍ͬͨෆඞཁͳจࣈ͕͍ࠞͬͯ͟Δ͜ ͱ͕͋͠͠Δɻ͜ͷෆඞཁͳจࣈ ʹΑͬͯɺ్ʹσʔλ͕ѻ͍ʹ͘͘ ͳΔɻྫ͑ɺಉ໊͡લͳͷʹɺผͷ ໊લͱͯ͠ೝࣝ͞Εͯ͠·͏ͱ͍͏͜ ͱ͕ى͜Δɻ͜͏ͨ͜͠ͱΛ͙ͨΊ
ʹɺσʔλΛΫϦʔϯΞοϓ͢Δɻ
ΧϥϜϔομϝχϡʔ͔Β 1. “ςΩετΛૢ࡞”Λબ 2. “ςΩετσʔλΛΫϦʔϯΞοϓ” Λબ ΫϦʔϯΞοϓ - ݺͼग़͠
ΫϦʔϯΞοϓ - ݺͼग़͠
ஔ͢Δ
ஔ͢Δ - interestsྻΛΑ͘ݟΔͱɺ“Tech”ͱ “Technology”͕ࠞࡏ͍ͯ͠Δͷʹؾ͘ɻͲ ͪΒجຊతʹಉ͡ͳͷͰɺ྆ํ·ͱΊͯɺ “Tech”ʹ͍ͨ͠ɻ
ஔ͢Δ - ݺͼग़͠ ΧϥϜϔομϝχϡʔ͔Β 1. “ςΩετΛૢ࡞”Λબ 2. “ஔ”Λબ
ஔ͢Δ - ݺͼग़͠
Technology͕Techʹஔ͞Εͨ
Ұ෦Λൈ͖ग़͢
Ұ෦Λൈ͖ग़͢ - ϑΝʔετωʔϜ͔Β࠷ॳͷ 1จࣈ(Πχγϟϧ)Λൈ͖ग़͠ ͍ͨɻ
Ұ෦Λൈ͖ग़͢ - ݺͼग़͠ ΧϥϜϔομϝχϡʔ͔Β 1. “ςΩετΛૢ࡞”Λબ 2. “ςΩετͷൣғΛநग़”Λબ
࠷ॳͷࣈ (1)։࢝Ґஔ ̎൪ͷࣈ (͜Ε·ͨ1)ऴྃҐஔ Ұ෦Λൈ͖ग़͢ - ݺͼग़͠
݁߹͢Δ
last_name first_name_initial Nishida K ݁߹͢Δ - ϑΝʔετωʔϜͷ̍จࣈͱɺϥετωʔϜશ෦ΛΞϯμʔ είΞ(_)Λͬͯ݁߹͠ɺϢʔβʔ໊Λ࡞Γ͍ͨɻ username
K_Nishida
݁߹͢Δ - ݺͼग़͠ ΧϥϜϔομϝχϡʔ͔Β 1. “ςΩετΛૢ࡞”Λબ 2. “ςΩετΛ࿈݁”Λબ
࿈͍݁ͨ͠จࣈྻΛΧϯϚ(,)Ͱ۠ͬͯ str_cͷதʹฒΔɻ ݁߹͢Δ - ݺͼग़͠
݁߹ͯ͠usernameྻ͕࡞͞ΕΔ
ΫϨδοτ
stringr Simple & Consistent Functions for Common String Operations https://stringr.tidyverse.org
Hadley Wickham
None
• ϓϩάϥϛϯάͳ͠ RݴޠͷUIͰ͋ΔExploratoryΛੳπʔϧͱͯ͠༻͢ΔͨΊडߨதɺϏδωεͷ Λղܾ͢ΔͨΊʹඞཁͳσʔλαΠΤϯεͷख๏ͷशಘʹ100ˋूதͰ͖Δ • ੳπʔϧͷϕϯμʔϩοΫΠϯͳ͠ ExploratoryͰͷ࡞ۀશͯಠཱͨ͠ΦʔϓϯιʔεͷRڥͰ࠶ݱ͕Մೳ • ࢥߟྗͱεΩϧͷशಘ σʔλαΠΤϯεͷεΩϧशಘ͚ͩͰͳ͘ɺσʔλੳʹඞཁͳࢥߟྗशಘͰ͖Δ
ಛ
Q & A
࿈བྷઌ ϝʔϧ
[email protected]
ΣϒαΠτ https://ja.exploratory.io ϒʔτΩϟϯϓɾτϨʔχϯά https://ja.exploratory.io/training-jp Twitter @KanAugust
จࣈྻؔͷνʔτγʔτ