Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SocSys34-Balus
Search
株式会社レヴィ
March 13, 2024
Research
0
66
SocSys34-Balus
株式会社レヴィ
March 13, 2024
Tweet
Share
More Decks by 株式会社レヴィ
See All by 株式会社レヴィ
2024-06-25 ソフトウェア設計における思考と学び方を考える 〜増田さんの思考を構造的に見える化してみる〜
levii
4
920
株式会社レヴィ会社紹介
levii
0
180
Sample-se-one-day-training
levii
0
540
20230323TechDLT-vol9
levii
0
330
levii-buzzword-2022
levii
0
330
FIT2022_levii
levii
0
600
20220915modelingLT
levii
4
780
20220910SSDM
levii
0
630
20220629oolt
levii
0
94
Other Decks in Research
See All in Research
大規模言語モデルのバイアス
yukinobaba
PRO
4
700
TransformerによるBEV Perception
hf149
1
430
Global Evidence Summit (GES) 参加報告
daimoriwaki
0
150
日本語医療LLM評価ベンチマークの構築と性能分析
fta98
3
640
Tietovuoto Social Design Agency (SDA) -trollitehtaasta
hponka
0
2.5k
Generative Predictive Model for Autonomous Driving 第61回 コンピュータビジョン勉強会@関東 (後編)
kentosasaki
0
210
Human-Informed Machine Learning Models and Interactions
hiromu1996
2
470
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
5
630
大規模言語モデルを用いた日本語視覚言語モデルの評価方法とベースラインモデルの提案 【MIRU 2024】
kentosasaki
2
520
情報処理学会関西支部2024年度定期講演会「自然言語処理と大規模言語モデルの基礎」
ksudoh
3
270
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
240
EBPMにおける生成AI活用について
daimoriwaki
0
180
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
BBQ
matthewcrist
85
9.3k
Faster Mobile Websites
deanohume
305
30k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Imperfection Machines: The Place of Print at Facebook
scottboms
265
13k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.2k
[RailsConf 2023] Rails as a piece of cake
palkan
52
4.9k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2.1k
Building Adaptive Systems
keathley
38
2.3k
Practical Orchestrator
shlominoach
186
10k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.1k
Transcript
三浦 政司(宇宙航空研究開発機構)、矢倉 大夢(筑波大学)、 南部 陽介(株式会社レヴィ)、小木曽 望(大阪公立大学) SocSys034/ショート発表 2024.3.13 システムモデルに基づくコラボレーションツール の評価実験検討
発表概要 オンラインで対話しながらシステムモデルを描くことでチームのコラボレー ションを促進することができるツール「Balus」の有効性を評価する実験を 設計し、予備的な試行を行った。 発表内容 • 背景・目的 • 評価実験のデザイン •
予備実験の結果 • 今後の計画 本研究はGo-Tech事業JPJ005698の支援による 「AI搭載のモデリング特化型コラボレーション ツールの開発による製造業の製品・サービス設計 の高度化」の一部です。
対話型モデリングツール「Balus」 •シンプルなUIで素早く システムモデルを描く •オンラインで同時に、 対話しながらモデル構築 •ビュー(視点)を意識した モデリングを自然に実践 •AIによるモデリング支援 Balusのコンセプトや対話型モデリングのフレームワークに関連する研究発表 ▪
三浦政司, "システムデザインのための対話型モデリングツール-コンセプトと実践例の紹介-," 計測自動制御学会 第31回社会システム部会, 2023 ▪ 三浦政司, 南部陽介, 山舖智也, "しなやかな問題解決を実現するための対話型モデリング手法 「システミング」の提案," 第21回情報科学技術フォーラム, 2022
目的 Balusはこれまでに • システム設計 • 業務課題分析 • 事業企画 など様々な場面に適用され、チームによる意思決定や問題解決を支援する という面で多くの成果を挙げている。
ref) https://levii.co.jp/works (株式会社レヴィ-実績) 効果の定量的な評価はできていない <本研究の目的> • Balusを利用することの効果、有用性を定量的に示す • ツールがチームの意思決定に与える影響を評価する方法を構築する (特にリモート環境での意思決定やチーム活動に焦点)
評価実験のデザイン 評価方法のデザインにもBalusを活用
評価実験のデザイン • 被験者グループがサバイバルタスクに取り組み、その過程や結果を評価 • Balusを使った場合、Googleドキュメントを使った場合、ツールを使わ なかった場合(口頭のみのコミュニケーション)を比較 NASA Moon Survival Task
*Hall(1989) あなたは、月面にいる母船とランデブーする予定だった宇宙 船のクルーの一員です。 しかし、機械の故障のため、あなたの宇宙船はランデブー地 点から約300 km離れた地点に着陸せざるを得ませんでした。 ~中略~ 約300 kmの移動において最も重要なアイテムを選 択する必要があります。~中略~ 以下の15個のアイテムは、着陸後に損傷していなかったもの です。~中略~ アイテムを順位付けをしてください。また、 その決断をした理由の説明も準備してください。 アイテムリスト(一部) • マッチ箱 • 約15mのナイロンロープ • パラシュートの布 • 45口径ピストル 2丁 • 粉末ミルク 1ケース • 酸素タンク(約45kg)2本 • 磁気コンパス • 水20リットル • … ※類似タスクとして「砂漠での生存」と「冬季での生存」も用意
評価実験のデザイン:評価・分析方法 ワークのアウトプットを評価 • パフォーマンス(正答率) • 認識の一致度 発話(音声)の分析 • 発話時間 •
発話の偏り • ターンテイキングの数 被験者アンケート • 意思決定の質:Decision Making Quality Scale *Green & Taber(1980) • 認知負荷:NASA-TLX *Hart & Staveland(1988) • 自由記述のテキスト分析 発話分析の例
予備実験 • 実施日:2024年2月18日(日) • 被験者:大阪公立大学小型宇宙機システム研究センターの学生9名/2グループ ※超小型衛星開発のシステム設計でBalusを活用しており、 Balusの基本的な操作や機能を十分に知っている学生ら • 各グループともサバイバルタスクのテーマを変えながらBalus/Google Docs/
ツールなしの3回のワークを実施 グループ ワーク(1) ワーク(2) ワーク(3) A 月での生存・Balus 砂漠での生存・Docs 冬季での生存・なし B 月での生存・Docs 砂漠での生存・なし 冬季での生存・Balus 各ワークの流れ:
予備実験の結果:DMQ scale DMQ因子の一つ「意思決定スキームの満足度」を 定義する項目に関するアンケートの結果
予備実験の結果:DMQ scale DMQ因子の一つ「意思決定スキームの満足度」を 定義する項目に関するアンケートの結果
予備実験の結果:NASA-TLX ツールなしは精神的負荷が高い? ツールを使うと時間的圧迫が高い?
予備実験の結果:認識の一致度 ◯位のアイテムは? それを◯位に選んだ理由を説明して下さい 理由項目の抽出(実験者) 上着 夜間の防寒のため 防寒 上着 身を守るのに必要だから 身を守る
上着 避暑と防寒が必要だから 防寒、避暑 上着 夜間の防寒に役に立つため 防寒 ◯位のアイテムは? それを◯位に選んだ理由を説明して下さい 理由項目の抽出(実験者) 新聞紙 燃やすものの着火剤として 着火 新聞紙 1火をつけるため,またそれ自身でも体に巻いたり することにより防寒になるため 着火、防寒 新聞紙 着火や防寒にしようできるため 着火、防寒 新聞紙 着火剤 着火 完全一致:1点 部分一致:0.5点 不一致:0点 部分一致:0.5点 ※アイテム不一致の場合は 理由に関わらず0点 平均スコア ツール間の差は見られなかった 1位アイテムの認識一 致度は高いが、 2位/最下位アイテムの 認識一致度は低い
予備実験の結果:発話分析 グループA/Balus
予備実験の結果:発話分析 グループA/Googleドキュメント
予備実験の結果:発話分析 グループA/Googleドキュメント 各自で情報を記入する 時間は対話なし。 Balus使用時は最初か らノードを貼りながら 対話していた。
課題と今後 予備実験で抽出された課題 • タスク難易度の正規化 • ワーク時間の最適化 • ワークやツールに慣れる機会の必要性 • 被験者数の確保
• …(抽出途中) 今後の計画 • 予備実験データの分析 • 予備実験結果を踏まえた実験設計の改善 • 本実験(2024年度) 株式会社レヴィ Balus 2ヶ月間無料 トライアル実施中!