Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GeminiとUnityで実現するインタラクティブアート
Search
ほき
December 01, 2024
Technology
0
1.7k
GeminiとUnityで実現するインタラクティブアート
GDG DevFest Tokyo 2024 のLT枠で発表した内容です.
学園祭で展示したGDGoC TUATと東京農工大学ステージ研究会の共創プロジェクトについて発表しました.
ほき
December 01, 2024
Tweet
Share
More Decks by ほき
See All by ほき
Expert-Level Detection of Epilepsy Markers in EEG on Short and Long Timescales
hokkey621
0
25
MMaDA: Multimodal Large Diffusion Language Models
hokkey621
0
19
TAID: Temporally Adaptive Interpolated Distillation for Efficient Knowledge Transfer in Language Models
hokkey621
0
23
脳波を用いた嗜好マッチングシステム
hokkey621
0
480
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
hokkey621
0
85
Learning to Model the World with Language
hokkey621
0
30
LT - Gemma Developer Time
hokkey621
0
20
wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations
hokkey621
0
31
イベントを主催してわかった運営のノウハウ
hokkey621
0
81
Other Decks in Technology
See All in Technology
ブラックボックス化したMLシステムのVertex AI移行 / mlops_community_62
visional_engineering_and_design
1
230
「通るまでRe-run」から卒業!落ちないテストを書く勘所
asumikam
3
840
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
11k
スケールアップ企業でQA組織が機能し続けるための組織設計と仕組み〜ボトムアップとトップダウンを両輪としたアプローチ〜
qa
0
370
PostgreSQL 18のNOT ENFORCEDな制約とDEFERRABLEの関係
yahonda
0
140
ThetaOS - A Mythical Machine comes Alive
aslander
0
210
Oracle Cloud Infrastructure(OCI):Onboarding Session(はじめてのOCI/Oracle Supportご利⽤ガイド)
oracle4engineer
PRO
2
17k
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
15年メンテしてきたdotfilesから開発トレンドを振り返る 2011 - 2026
giginet
PRO
0
160
互換性のある(らしい)DBへの移行など考えるにあたってたいへんざっくり
sejima
PRO
0
290
How to install a gem
indirect
0
1.9k
「捨てる」を設計する
kubell_hr
0
440
Featured
See All Featured
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
91
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.1k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
130
Faster Mobile Websites
deanohume
310
31k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
850
Context Engineering - Making Every Token Count
addyosmani
9
780
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
260
Site-Speed That Sticks
csswizardry
13
1.1k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
110
Technical Leadership for Architectural Decision Making
baasie
3
300
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
Transcript
GeminiとUnityで実現する インタラクティブアート
プロダクト概要 • テーマはコミュニケーション • 感想ノートをデジタルアート化 • 来場者の入力によって表示が変化 #農工祭interactiveArt
None
システム構成図 入力 解析 生成 出力 発話 手書き タイピング LEDライト 投影機
スピーカー 照明 エフェクト 映像描画 SE 文章解析 座標化
入力 • 来場者の想いを言葉にして入力 • 幅広い年齢のユーザに対応する ために多様な入力方法を提供 ◦ キーボード ◦ 音声
◦ 手書き文字 ArUco Marker Google Document AI Google Speech to Text 文章解析 キーボード 手書き 音声
座標生成 • GoogleのEmbeddings APIを用いて文章を埋め込みベクトルに変換 • 主成分分析で4次元ベクトルに変換 Texts 756 Embedding Vector
4 Star position PCA
映像生成 • Pythonから4次元ベクトルを受信 • 時刻によって投影の視点を変化 • 遠近投影で3次元投影 Unity 4次元ベクトル 回転、投影行列
3次元ベクトル 投影 Python
中間の文章を生成 • 2つの文章をランダムで選択 • 中間的な文章生成を行わせる • JSONモードで出力 “ふたつの文章が入力されます。この 2つの文章の意味について考え、意味 の空間の中で中点に存在するであろ
う文章を生成してください。元の文 章について、その意味のみを抽出 し、出力結果にはその文字面がもれ ることのないようにしてください。 できるだけ具体的に出力してくださ い。”
206 人 2日間で が遊んでくれました
まとめ • コミュニケーションをテーマにしたインタラクティブアートを展示 • 時間を超えた人と人のつながりを表現 • プログラミングサークル以外との共創