Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語による シェルコマンドラインチャー wanna の紹介
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
hirokidaichi
April 05, 2023
Technology
0
2.7k
自然言語による シェルコマンドラインチャー wanna の紹介
hirokidaichi
April 05, 2023
Tweet
Share
More Decks by hirokidaichi
See All by hirokidaichi
エンジニアリング組織論〜不確実性に向き合う組織の現在と未来
hirokidaichi
2
810
大規模言語モデル時代の開発生産性
hirokidaichi
20
14k
内製化のコツとワナ
hirokidaichi
2
3k
心理的安全性とソフトウェア化する社会/ Psychological Safety and Software-based Society
hirokidaichi
40
12k
Power Theory of Software Architecture
hirokidaichi
21
8.2k
Cultural Capital Theory in Software Engineering
hirokidaichi
48
16k
エンジニアリング組織論への招待:第1章(プレゼン)
hirokidaichi
6
3.7k
エンジニアリング組織論への招待:第2章(プレゼン)
hirokidaichi
3
1.3k
2つのDXと技術的負債-YAPC Tokyo 2019
hirokidaichi
55
27k
Other Decks in Technology
See All in Technology
Amazon S3 Vectorsを使って資格勉強用AIエージェントを構築してみた
usanchuu
3
420
Amazon Bedrock AgentCore 認証・認可入門
hironobuiga
2
500
Context Engineeringの取り組み
nutslove
0
250
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
210
データの整合性を保ちたいだけなんだ
shoheimitani
6
2.5k
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3.8k
FinTech SREのAWSサービス活用/Leveraging AWS Services in FinTech SRE
maaaato
0
120
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
67k
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
640
0205_Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した__.pdf
riku_423
0
150
【インシデント入門】サイバー攻撃を受けた現場って何してるの?
shumei_ito
0
1.4k
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
Featured
See All Featured
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Testing 201, or: Great Expectations
jmmastey
46
8k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
220
Scaling GitHub
holman
464
140k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Bash Introduction
62gerente
615
210k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
Producing Creativity
orderedlist
PRO
348
40k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
36k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Transcript
自然言語による シェルコマンドラインチャー wanna の紹介 株式会社レクター 広木大地
広木 大地 1983年生まれ。筑波大学大学院を卒業後、2008年に新卒第1期として株式会社ミクシィに 入社。同社のアーキテクトとして、技術戦略から組織構築などに携わる。 同社メディア開発部長、開発部部長、サービス本部長執行役員を務めた後、2015年退社。 現在は、株式会社レクターを創業し、技術と経営をつなぐ技術組織のアドバイザリーとして、 多数の会社の経営支援を行っている。 著書『エンジニアリング組織論への招待~不確実性に向き合う思考と組織のリファクタング』 が第6回ブクログ大賞・ビジネス書部門大賞、翔泳社ITエンジニアに読んでほしい技術書大 賞2019・技術書大賞受賞。一般社団法人日本CTO協会理事。内閣官房、経産省、IPA、デ
ジタル庁などでDX/リスキリングに関する委員を歴任。 2022年9月、株式会社朝日新聞社社外CTO就任 2022年11月、株式会社グッドパッチ社外取締役就任 自己紹介
None
まずはデモをご覧ください。
None
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
複数のNLPタスクを組み合わせたUX GPTの凄さはNLPの圧倒的な民主化。これまで使わなかったところにもふんだんに使う設計 ①ソースコード生成 ③実行結果の評価と デバッグ ②スクリプト名の 提案 ④概要文の生成 ⑤ユーザー言語の 推定
GPTのすごさはNLPの民主化 (こんなところにも使うの?がUXになる。)
スクリプトの生成プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
実行結果から反省とデバッグ bashの出力をteeして、実行結果を systemプロンプトに抜粋して入力 もし、問題があればコードの修正をサジェスト。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
これまでの指示をまとめて概要文を作成
ユーザー言語を推定して、その言語で対話 プロンプトの能力は、英語の方が日本語よりやや高い。 また、論文やライブラリなど例が豊富。 一方、ユーザーへの応答は入力言語から自然と対応してほし い。(ときどき、英語で話し出すのを防ぐ )
Prompt Engineeringも 普通のエンジニアリング。 (既知のパターンの組み合わせと試行錯誤)
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
LLMソフトウェア =組織プロセス設計
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
メンバーが提案し、マネージャが決める AIと人間の関係は、メンバーとマネジメントの組織設計に似ている。 メンバーの仕事:実装したり提案する マネージャの仕事:目的の提供と意思決定
すべての人が AIをマネジメントする マネージャになる。