Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ分析イベントデータ説明(VRChatイベントカレンダー)
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ぶんちん
February 06, 2025
Technology
140
0
Share
データ分析イベントデータ説明(VRChatイベントカレンダー)
ぶんちん
February 06, 2025
More Decks by ぶんちん
See All by ぶんちん
プロジェクト失敗につながる地雷ワード
bunnchinn3
0
17
良書紹介07_LEAN ANALYICS
bunnchinn3
0
5
基礎統計のつまづきポイント
bunnchinn3
0
3
良書紹介06_こどもの統計学
bunnchinn3
0
40
良書紹介05_データ分析実務スキル検定 公式テキスト
bunnchinn3
0
37
“異常”検知プロジェクトの難しさ
bunnchinn3
0
33
LTのはじめかた(VRChat技術系界隈を想定)
bunnchinn3
0
82
良書紹介04_生命科学の実験デザイン
bunnchinn3
0
150
“成果”を出すためのプレゼン準備 プレゼン資料作成の前にやること
bunnchinn3
1
230
Other Decks in Technology
See All in Technology
[Oracle TechNight#99] 生成AI時代のAI/ML入門 ~ AIとオラクルデータベースの関係 (前半)
oracle4engineer
PRO
2
240
小さいVue.jsを30分で作る
hal_spidernight
0
150
鹿野さんに聞く!CSSの最新トレンド Ver.2026
tonkotsuboy_com
6
2.8k
The 7 pitfalls of AI
ufried
0
200
AI駆動開発で生産性を追いかけたら、行き着いたのは品質とシフトレフトだった
littlehands
0
470
Claude Code / Codex / Kiro に AWS 権限を 渡すとき、何を設計すべきか
k_adachi_01
4
770
ボトムアップの改善の火を灯し続けろ!〜支援現場で学んだ、消えないための3つの打ち手〜 / 20260509 Kazuki Mori
shift_evolve
PRO
2
620
freeeで運用しているAIQAについて
qatonchan
0
480
「強制アップデート」か「チームの自律」か?エンタープライズが辿り着いたプラットフォームのハイブリッド運用/cloudnative-kaigi-hybrid-platform-operations
mhrtech
0
160
全社統制を維持しながら現場負担をどう減らすか〜プラットフォームチームとセキュリティチームで進めたSecurity Hub活用によるAWS統制の見直し〜/secjaws-security-hub-custom-insights
mhrtech
1
270
ボトムアップ限界を越える - 20チームを束る "Drive Map" / Beyond Bottom-Up: A 'Drive Map' for 20 Teams
kaonavi
0
170
Oracle Cloud Infrastructure presents managed, serverless MCP Servers for Oracle AI Database
thatjeffsmith
0
220
Featured
See All Featured
WENDY [Excerpt]
tessaabrams
10
37k
WCS-LA-2024
lcolladotor
0
580
The Mindset for Success: Future Career Progression
greggifford
PRO
0
330
Being A Developer After 40
akosma
91
590k
Un-Boring Meetings
codingconduct
0
280
Between Models and Reality
mayunak
3
280
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
140
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
180
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.3k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
110
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Transcript
データ分析イベントデータ説明 <超簡易版>R AnaliticFlow操作説明 ぶんちん 2025年2月6日 データサイエンティスト集会 in VRC 1
使用するデータ VRChatイベントカレンダー 2018年~2025年1月21日までに登録されたデータ
基データ概要 配布ファイル形式:CSV 文字コード:UTF-8 ファイルサイズ:約65MB データ期間:2018年6月21日~2025年1月21日
レコード数:95693 項目数:18 3
データ項目 タイムスタンプ イベント名 日付 開始時刻
終了時刻 イベント詳細 イベント主催者 イベント内容 4 人数制限 参加条件(モデル、人数制限など) 参加方法 備考 Android対応可否 イベントジャンル 海外ユーザー向け告知 告知文 途中から取得したと思われる項目もあるので扱いに注意
データ分析にあたっての注意点 イベント名などの入力のないデータ(空白行) ⇒明らかな異常データ VRChatイベントへの登録データは利用者側で修正・削除不 可であり、正しいデータへの対応は新規登録(データ追加) ⇒不適切な内容のデータ 基本的にデータクレンジングが必要 5
できる範囲でやりました!
配布データ 2種類のデータを配布します 生データ 前処理済データ <初心者はこちらがオススメ> イベント名の記載がない異常データ(空白行)を削除 同一イベント名が同じ日に複数回開催登録されているデータの重複 削除(タイムスタンプが最新のレコードを採用)
イベントジャンル列をカテゴリごとに扱いやすいよう整理 6 どれを使ってもらってもOKです 後述の理由からそれぞれ ・UTF-8版 ・Shift-JIS版(特殊文字削除) の2種類、計4種類を配布します
ちょっとだけ、 データ分析ソフト「R AnaliticFlow」の 使い方(超ダイジェスト)と注意点 7
R AnalyticFlow 8 https://r.analyticflow.com/ja/ Rベースで動く、GUI操作を基本とする“データ解析ソフトウェア” 日本で作られたソフトで、 UIやチュートリアルなど 全てが日本語対応! 注意) Rの導入も必要です
私の仕事(データ分析教育)で メインに使っているソフトです 導入方法の詳細は公式の情報見てください。 基本的にexeファイルでインストールし、指示に従って進めばOKです。
画面の基本的な見方 9 一番基本のエリア 分析フローの作成 ノード (分析・データ処理機能) データ・グラフ・ ヘルプなどの表示 Rのコンソール 選択中のノードの
設定を入力 ノードの格納場所
起動後の画面 作業フォルダの作成 10 初めてのデータのときは ここを選択してプロジェ クトフォルダを作成 分析を再開する場合は ここから該当のプロジェクトを選択
データの読み込み 11 ここを右クリックすると作業 フォルダを開ける ⇒データを入れておくとよい 読み込みたいデータを ドラッグ&ドロップ ヘッダーがTRUE 文字コードを確認 ⇒フローを実行
or ノードを実行 注意! 今回使用するデータの特殊文字を読み込めない 今回に限り特殊文字を消すため、 文字コードをShift-JISに変換したデータを 読み込むのが楽です( Shift-JIS 版データも配布予定)
分析例 12 集計ノードで カテゴリごとに統計量算出 グラフノードで 見たいグラフ描画 分析フローを示す矢印は右クリックのドラッグ&ドロップで引けます 処理(コード)の実行順にノードを配置して分析する 集計条件を設定 描画条件を設定
Orange Data Mining こちらは処理順ではなく、データの流れをフローで描画 UTF-8をそのまま読み込めます 13 使用方法は過去のLT資料を見てみてください