Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ分析イベントデータ説明(VRChatイベントカレンダー)
Search
ぶんちん
February 06, 2025
Technology
0
80
データ分析イベントデータ説明(VRChatイベントカレンダー)
ぶんちん
February 06, 2025
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
良書紹介03_ データ分析読解の技術
bunnchinn3
0
26
MVP未満からの成果獲得
bunnchinn3
0
21
個人計画とプロジェクト遂行の考え方
bunnchinn3
0
47
<事前告知> DS集会データ分析イベント VRChatイベントカレンダー
bunnchinn3
0
69
統計知識と実務のギャップ
bunnchinn3
0
97
製造業における品質不良の要因分析04_ツール選択の考え方
bunnchinn3
0
130
これまでLT振り返り 何が人気の話題?
bunnchinn3
0
92
製造業における品質不良の要因分析03_必要な知識の入手方法
bunnchinn3
0
110
製造業における品質不良の要因分析02_分析着手順の考え方
bunnchinn3
0
120
Other Decks in Technology
See All in Technology
Amazon ECS & AWS Fargate 運用アーキテクチャ2025 / Amazon ECS and AWS Fargate Ops Architecture 2025
iselegant
16
4.7k
生成AIでwebアプリケーションを作ってみた
tajimon
2
130
PHPでWebブラウザのレンダリングエンジンを実装する
dip_tech
PRO
0
170
Prox Industries株式会社 会社紹介資料
proxindustries
0
210
AWS CDK 実践的アプローチ N選 / aws-cdk-practical-approaches
gotok365
4
520
Amazon Bedrockで実現する 新たな学習体験
kzkmaeda
1
400
20250623 Findy Lunch LT Brown
3150
0
790
変化する開発、進化する体系時代に適応するソフトウェアエンジニアの知識と考え方(JaSST'25 Kansai)
mizunori
0
140
Microsoft Build 2025 技術/製品動向 for Microsoft Startup Tech Community
torumakabe
1
210
菸酒生在 LINE Taiwan 的後端雙刀流
line_developers_tw
PRO
0
1.1k
より良いプロダクトの開発を目指して - 情報を中心としたプロダクト開発 #phpcon #phpcon2025
bengo4com
1
390
JSX - 歴史を振り返り、⾯⽩がって、エモくなろう
pal4de
3
1.1k
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
200
Java REST API Framework Comparison - PWX 2021
mraible
31
8.6k
Code Review Best Practice
trishagee
68
18k
Building a Modern Day E-commerce SEO Strategy
aleyda
41
7.3k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
The World Runs on Bad Software
bkeepers
PRO
69
11k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Product Roadmaps are Hard
iamctodd
PRO
53
11k
Art, The Web, and Tiny UX
lynnandtonic
299
21k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Become a Pro
speakerdeck
PRO
28
5.4k
Transcript
データ分析イベントデータ説明 <超簡易版>R AnaliticFlow操作説明 ぶんちん 2025年2月6日 データサイエンティスト集会 in VRC 1
使用するデータ VRChatイベントカレンダー 2018年~2025年1月21日までに登録されたデータ
基データ概要 配布ファイル形式:CSV 文字コード:UTF-8 ファイルサイズ:約65MB データ期間:2018年6月21日~2025年1月21日
レコード数:95693 項目数:18 3
データ項目 タイムスタンプ イベント名 日付 開始時刻
終了時刻 イベント詳細 イベント主催者 イベント内容 4 人数制限 参加条件(モデル、人数制限など) 参加方法 備考 Android対応可否 イベントジャンル 海外ユーザー向け告知 告知文 途中から取得したと思われる項目もあるので扱いに注意
データ分析にあたっての注意点 イベント名などの入力のないデータ(空白行) ⇒明らかな異常データ VRChatイベントへの登録データは利用者側で修正・削除不 可であり、正しいデータへの対応は新規登録(データ追加) ⇒不適切な内容のデータ 基本的にデータクレンジングが必要 5
できる範囲でやりました!
配布データ 2種類のデータを配布します 生データ 前処理済データ <初心者はこちらがオススメ> イベント名の記載がない異常データ(空白行)を削除 同一イベント名が同じ日に複数回開催登録されているデータの重複 削除(タイムスタンプが最新のレコードを採用)
イベントジャンル列をカテゴリごとに扱いやすいよう整理 6 どれを使ってもらってもOKです 後述の理由からそれぞれ ・UTF-8版 ・Shift-JIS版(特殊文字削除) の2種類、計4種類を配布します
ちょっとだけ、 データ分析ソフト「R AnaliticFlow」の 使い方(超ダイジェスト)と注意点 7
R AnalyticFlow 8 https://r.analyticflow.com/ja/ Rベースで動く、GUI操作を基本とする“データ解析ソフトウェア” 日本で作られたソフトで、 UIやチュートリアルなど 全てが日本語対応! 注意) Rの導入も必要です
私の仕事(データ分析教育)で メインに使っているソフトです 導入方法の詳細は公式の情報見てください。 基本的にexeファイルでインストールし、指示に従って進めばOKです。
画面の基本的な見方 9 一番基本のエリア 分析フローの作成 ノード (分析・データ処理機能) データ・グラフ・ ヘルプなどの表示 Rのコンソール 選択中のノードの
設定を入力 ノードの格納場所
起動後の画面 作業フォルダの作成 10 初めてのデータのときは ここを選択してプロジェ クトフォルダを作成 分析を再開する場合は ここから該当のプロジェクトを選択
データの読み込み 11 ここを右クリックすると作業 フォルダを開ける ⇒データを入れておくとよい 読み込みたいデータを ドラッグ&ドロップ ヘッダーがTRUE 文字コードを確認 ⇒フローを実行
or ノードを実行 注意! 今回使用するデータの特殊文字を読み込めない 今回に限り特殊文字を消すため、 文字コードをShift-JISに変換したデータを 読み込むのが楽です( Shift-JIS 版データも配布予定)
分析例 12 集計ノードで カテゴリごとに統計量算出 グラフノードで 見たいグラフ描画 分析フローを示す矢印は右クリックのドラッグ&ドロップで引けます 処理(コード)の実行順にノードを配置して分析する 集計条件を設定 描画条件を設定
Orange Data Mining こちらは処理順ではなく、データの流れをフローで描画 UTF-8をそのまま読み込めます 13 使用方法は過去のLT資料を見てみてください