Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ分析イベントデータ説明(VRChatイベントカレンダー)
Search
ぶんちん
February 06, 2025
Technology
0
93
データ分析イベントデータ説明(VRChatイベントカレンダー)
ぶんちん
February 06, 2025
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
LTのはじめかた(VRChat技術系界隈を想定)
bunnchinn3
0
33
良書紹介04_生命科学の実験デザイン
bunnchinn3
0
94
“成果”を出すためのプレゼン準備 プレゼン資料作成の前にやること
bunnchinn3
1
190
良書紹介03_ データ分析読解の技術
bunnchinn3
0
48
MVP未満からの成果獲得
bunnchinn3
0
54
個人計画とプロジェクト遂行の考え方
bunnchinn3
0
70
<事前告知> DS集会データ分析イベント VRChatイベントカレンダー
bunnchinn3
0
78
統計知識と実務のギャップ
bunnchinn3
0
120
製造業における品質不良の要因分析04_ツール選択の考え方
bunnchinn3
0
200
Other Decks in Technology
See All in Technology
今すぐGoogle Antigravityを触りましょう
rfdnxbro
0
150
やり方は一つだけじゃない、正解だけを目指さず寄り道やその先まで自分流に楽しむ趣味プログラミングの探求 2025-11-15 YAPC::Fukuoka
sugyan
3
950
米軍Platform One / Black Pearlに学ぶ極限環境DevSecOps
jyoshise
2
530
pmconf 2025 大阪「生成AI時代に未来を切り開くためのプロダクト戦略:圧倒的生産性を実現するためのプロダクトサイクロン」 / The Product Cyclone for Outstanding Productivity
yamamuteki
3
2.4k
LINEヤフー バックエンド組織・体制の紹介
lycorptech_jp
PRO
0
850
自然言語でAPI作業を片付ける!「Postman Agent Mode」
nagix
0
130
クラウドネイティブ時代の 開発プロセス再設計 〜速さと品質を両立するには〜
moritamasami
0
110
AI時代のインシデント対応 〜時代を切り抜ける、組織アーキテクチャ〜
jacopen
4
120
"'TSのAPI型安全”の対価は誰が払う?不公平なスキーマ駆動に終止符を打つハイブリッド戦略
hal_spidernight
0
120
JJUG CCC 2025 Fall バッチ性能!!劇的ビフォーアフター
hayashiyuu1
1
410
AWS Media Services 最新サービスアップデート 2025
eijikominami
0
110
ローカルLLM基礎知識 / local LLM basics 2025
kishida
23
7.3k
Featured
See All Featured
The Cost Of JavaScript in 2023
addyosmani
55
9.3k
Faster Mobile Websites
deanohume
310
31k
Unsuck your backbone
ammeep
671
58k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
Mobile First: as difficult as doing things right
swwweet
225
10k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
GitHub's CSS Performance
jonrohan
1032
470k
Building Adaptive Systems
keathley
44
2.8k
Embracing the Ebb and Flow
colly
88
4.9k
Writing Fast Ruby
sferik
630
62k
Transcript
データ分析イベントデータ説明 <超簡易版>R AnaliticFlow操作説明 ぶんちん 2025年2月6日 データサイエンティスト集会 in VRC 1
使用するデータ VRChatイベントカレンダー 2018年~2025年1月21日までに登録されたデータ
基データ概要 配布ファイル形式:CSV 文字コード:UTF-8 ファイルサイズ:約65MB データ期間:2018年6月21日~2025年1月21日
レコード数:95693 項目数:18 3
データ項目 タイムスタンプ イベント名 日付 開始時刻
終了時刻 イベント詳細 イベント主催者 イベント内容 4 人数制限 参加条件(モデル、人数制限など) 参加方法 備考 Android対応可否 イベントジャンル 海外ユーザー向け告知 告知文 途中から取得したと思われる項目もあるので扱いに注意
データ分析にあたっての注意点 イベント名などの入力のないデータ(空白行) ⇒明らかな異常データ VRChatイベントへの登録データは利用者側で修正・削除不 可であり、正しいデータへの対応は新規登録(データ追加) ⇒不適切な内容のデータ 基本的にデータクレンジングが必要 5
できる範囲でやりました!
配布データ 2種類のデータを配布します 生データ 前処理済データ <初心者はこちらがオススメ> イベント名の記載がない異常データ(空白行)を削除 同一イベント名が同じ日に複数回開催登録されているデータの重複 削除(タイムスタンプが最新のレコードを採用)
イベントジャンル列をカテゴリごとに扱いやすいよう整理 6 どれを使ってもらってもOKです 後述の理由からそれぞれ ・UTF-8版 ・Shift-JIS版(特殊文字削除) の2種類、計4種類を配布します
ちょっとだけ、 データ分析ソフト「R AnaliticFlow」の 使い方(超ダイジェスト)と注意点 7
R AnalyticFlow 8 https://r.analyticflow.com/ja/ Rベースで動く、GUI操作を基本とする“データ解析ソフトウェア” 日本で作られたソフトで、 UIやチュートリアルなど 全てが日本語対応! 注意) Rの導入も必要です
私の仕事(データ分析教育)で メインに使っているソフトです 導入方法の詳細は公式の情報見てください。 基本的にexeファイルでインストールし、指示に従って進めばOKです。
画面の基本的な見方 9 一番基本のエリア 分析フローの作成 ノード (分析・データ処理機能) データ・グラフ・ ヘルプなどの表示 Rのコンソール 選択中のノードの
設定を入力 ノードの格納場所
起動後の画面 作業フォルダの作成 10 初めてのデータのときは ここを選択してプロジェ クトフォルダを作成 分析を再開する場合は ここから該当のプロジェクトを選択
データの読み込み 11 ここを右クリックすると作業 フォルダを開ける ⇒データを入れておくとよい 読み込みたいデータを ドラッグ&ドロップ ヘッダーがTRUE 文字コードを確認 ⇒フローを実行
or ノードを実行 注意! 今回使用するデータの特殊文字を読み込めない 今回に限り特殊文字を消すため、 文字コードをShift-JISに変換したデータを 読み込むのが楽です( Shift-JIS 版データも配布予定)
分析例 12 集計ノードで カテゴリごとに統計量算出 グラフノードで 見たいグラフ描画 分析フローを示す矢印は右クリックのドラッグ&ドロップで引けます 処理(コード)の実行順にノードを配置して分析する 集計条件を設定 描画条件を設定
Orange Data Mining こちらは処理順ではなく、データの流れをフローで描画 UTF-8をそのまま読み込めます 13 使用方法は過去のLT資料を見てみてください