Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VRChat と cluster ワールドの違い-その1-
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
みかん大学
January 13, 2024
Research
0
350
VRChat と cluster ワールドの違い-その1-
みかん大学
January 13, 2024
Tweet
Share
More Decks by みかん大学
See All by みかん大学
データウェアハウスを使ってみよう
hidetobara
0
60
VRChatのワールド情報が大量に集まっていた
hidetobara
0
150
VRChat 続・日本語圏のワールドの特徴
hidetobara
0
150
VRChat日本語圏のワールドの特徴
hidetobara
0
220
VRChat Lab抜けの条件
hidetobara
0
2.4k
アンドロイドは電気羊の絵を描くか?
hidetobara
2
62
Other Decks in Research
See All in Research
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
210
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1k
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
13
7.2k
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
520
Tiaccoon: Unified Access Control with Multiple Transports in Container Networks
hiroyaonoe
0
520
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
600
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
460
2026.01ウェビナー資料
elith
0
170
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
440
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
190
生成AIとうまく付き合うためのプロンプトエンジニアリング
yuri_ohashi
0
120
SkySense V2: A Unified Foundation Model for Multi-modal Remote Sensing
satai
3
450
Featured
See All Featured
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
69
Why Our Code Smells
bkeepers
PRO
340
58k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
810
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
630
Testing 201, or: Great Expectations
jmmastey
46
8k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
71k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
310
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
310
GitHub's CSS Performance
jonrohan
1032
470k
Paper Plane (Part 1)
katiecoart
PRO
0
3.7k
My Coaching Mixtape
mlcsv
0
44
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
400
Transcript
VRChat と cluster ワールドの違い-その1- みかん電機
おさらい VRChat や cluster のワールド情報を Crawling して BigQuery に貯めており・・ VRChat
の日本語圏と非日本語圏でのワールドの違いを調べてみた • 「ワールドタグの使用頻度」で比較 ◦ 非日本語圏と “furry”, “avatar” が多い ◦ 日本語圏だと “sleep” や “sea” が多い ◦ “rain”, “water”, “cat” などは差異は無かった
今回の目標 VRChat と cluster でワールドに違いがあるかどうか調べる 残念なことに cluster にはタグという機能はありません 「単語(token)の使用頻度」を比較 •
使用したデータ ◦ 2023年末までに API 経由で Crawling したワールド ◦ VRChat 日本語圏で約12000 ◦ cluster で約35000 • 手法 ◦ 各ワールド名に対して形態素解析 ▪ TinySegmenter ◦ 「あ」「1」などの1文字のひらがなや数字、アルファベットは無視 ◦ フィッシャーの正確確率検定で出現回数のばらつきを調べた
p値の小さい順、偶然には起こりえない順にソート p値11-20位 token VRChat cluster pvalue jp 100 10 9.26E-37
test 198 941 2.46E-33 sleep 84 9 1.38E-30 the 351 288 1.22E-29 quest 85 11 1.89E-29 試着 57 1 1.81E-26 chill 111 35 5.80E-26 迷路 6 172 6.79E-23 house 337 316 2.29E-22 ライブ 4 152 1.03E-21
p値1-10位 JUST !!!!!!! token VRChat cluster pvalue world 514 6706
0 just 263 16 2.50E-104 room 747 434 2.07E-100 home 419 152 1.78E-86 vrc 143 2 1.05E-65 中 60 716 1.56E-64 avatar 129 5 5.51E-55 集会 127 13 4.51E-46 new 43 507 8.02E-46 テスト 40 463 2.11E-41
頻度に差があるとは言えない単語の例 英語で表記するか、日本語で表記するかの問題は起こってしまった homeかホームか、roomか部屋か、 token VRChat cluster statistics pvalue club 68
154 0.8891513764 0.4333966147 会 70 128 1.101927351 0.5454710894 vr 87 189 0.926990116 0.6084395311 部屋 398 793 1.0111985 0.8523445293
まとめ • プラットフォームによって違いが出て面白い ◦ VRChat は「Just」「Avatar」「集会」「Sleep」 ◦ cluster は、テストワールドが多い。さらに「迷路」「ライブ」も •
MeCab とか使えばもう少し精度は上がる? • 単語間のつながりも見えたら面白いかも • 年度や時期の変化を調べても面白いかも