Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VRChat と cluster ワールドの違い-その1-
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
みかん大学
January 13, 2024
Research
390
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
VRChat と cluster ワールドの違い-その1-
みかん大学
January 13, 2024
More Decks by みかん大学
See All by みかん大学
データウェアハウスを使ってみよう
hidetobara
0
86
VRChatのワールド情報が大量に集まっていた
hidetobara
0
180
VRChat 続・日本語圏のワールドの特徴
hidetobara
0
170
VRChat日本語圏のワールドの特徴
hidetobara
0
250
VRChat Lab抜けの条件
hidetobara
0
3k
アンドロイドは電気羊の絵を描くか?
hidetobara
2
74
Other Decks in Research
See All in Research
typst の使い方:言語学を研究する学生のために
gitomochang
0
460
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
860
正規分布と最適化について
koide3
1
260
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
4
780
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
490
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
280
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
3
160
R&Dチームを起ち上げる
shibuiwilliam
1
270
業界横断 副業コンプライアンス調査 三者(副業者・本業先・発注者)におけるトラブル認知ギャップの構造分析
fkske
0
1.3k
敵対生成プロンプト同時探索による内省型プロンプト最適化
kinoue_smarthr
0
200
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
560
2026年3月1日(日)福島「除染土」の公共利用をかんがえる
atsukomasano2026
0
640
Featured
See All Featured
Rails Girls Zürich Keynote
gr2m
96
14k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.4k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
BBQ
matthewcrist
89
10k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
300
Music & Morning Musume
bryan
47
7.2k
Marketing to machines
jonoalderson
1
5.5k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Navigating Weather and Climate Data
rabernat
0
220
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
Building AI with AI
inesmontani
PRO
1
1.1k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
Transcript
VRChat と cluster ワールドの違い-その1- みかん電機
おさらい VRChat や cluster のワールド情報を Crawling して BigQuery に貯めており・・ VRChat
の日本語圏と非日本語圏でのワールドの違いを調べてみた • 「ワールドタグの使用頻度」で比較 ◦ 非日本語圏と “furry”, “avatar” が多い ◦ 日本語圏だと “sleep” や “sea” が多い ◦ “rain”, “water”, “cat” などは差異は無かった
今回の目標 VRChat と cluster でワールドに違いがあるかどうか調べる 残念なことに cluster にはタグという機能はありません 「単語(token)の使用頻度」を比較 •
使用したデータ ◦ 2023年末までに API 経由で Crawling したワールド ◦ VRChat 日本語圏で約12000 ◦ cluster で約35000 • 手法 ◦ 各ワールド名に対して形態素解析 ▪ TinySegmenter ◦ 「あ」「1」などの1文字のひらがなや数字、アルファベットは無視 ◦ フィッシャーの正確確率検定で出現回数のばらつきを調べた
p値の小さい順、偶然には起こりえない順にソート p値11-20位 token VRChat cluster pvalue jp 100 10 9.26E-37
test 198 941 2.46E-33 sleep 84 9 1.38E-30 the 351 288 1.22E-29 quest 85 11 1.89E-29 試着 57 1 1.81E-26 chill 111 35 5.80E-26 迷路 6 172 6.79E-23 house 337 316 2.29E-22 ライブ 4 152 1.03E-21
p値1-10位 JUST !!!!!!! token VRChat cluster pvalue world 514 6706
0 just 263 16 2.50E-104 room 747 434 2.07E-100 home 419 152 1.78E-86 vrc 143 2 1.05E-65 中 60 716 1.56E-64 avatar 129 5 5.51E-55 集会 127 13 4.51E-46 new 43 507 8.02E-46 テスト 40 463 2.11E-41
頻度に差があるとは言えない単語の例 英語で表記するか、日本語で表記するかの問題は起こってしまった homeかホームか、roomか部屋か、 token VRChat cluster statistics pvalue club 68
154 0.8891513764 0.4333966147 会 70 128 1.101927351 0.5454710894 vr 87 189 0.926990116 0.6084395311 部屋 398 793 1.0111985 0.8523445293
まとめ • プラットフォームによって違いが出て面白い ◦ VRChat は「Just」「Avatar」「集会」「Sleep」 ◦ cluster は、テストワールドが多い。さらに「迷路」「ライブ」も •
MeCab とか使えばもう少し精度は上がる? • 単語間のつながりも見えたら面白いかも • 年度や時期の変化を調べても面白いかも