Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語による シェルコマンドラインチャー wanna の紹介
Search
hirokidaichi
April 05, 2023
Technology
0
2.6k
自然言語による シェルコマンドラインチャー wanna の紹介
hirokidaichi
April 05, 2023
Tweet
Share
More Decks by hirokidaichi
See All by hirokidaichi
エンジニアリング組織論〜不確実性に向き合う組織の現在と未来
hirokidaichi
2
370
大規模言語モデル時代の開発生産性
hirokidaichi
20
14k
内製化のコツとワナ
hirokidaichi
2
2.4k
心理的安全性とソフトウェア化する社会/ Psychological Safety and Software-based Society
hirokidaichi
40
12k
Power Theory of Software Architecture
hirokidaichi
21
8k
Cultural Capital Theory in Software Engineering
hirokidaichi
48
15k
エンジニアリング組織論への招待:第1章(プレゼン)
hirokidaichi
6
3.5k
エンジニアリング組織論への招待:第2章(プレゼン)
hirokidaichi
3
1.3k
2つのDXと技術的負債-YAPC Tokyo 2019
hirokidaichi
55
26k
Other Decks in Technology
See All in Technology
MagicPod導入から半年、オープンロジQAチームで実際にやったこと
tjoko
0
110
まずはマネコンでちゃちゃっと作ってから、それをCDKにしてみよか。
yamada_r
2
120
機械学習を扱うプラットフォーム開発と運用事例
lycorptech_jp
PRO
0
660
未経験者・初心者に贈る!40分でわかるAndroidアプリ開発の今と大事なポイント
operando
6
750
今日から始めるAWSセキュリティ対策 3ステップでわかる実践ガイド
yoshidatakeshi1994
0
120
Apache Spark もくもく会
taka_aki
0
140
はじめてのOSS開発からみえたGo言語の強み
shibukazu
3
1k
dbt開発 with Claude Codeのためのガードレール設計
10xinc
2
1.3k
COVESA VSSによる車両データモデルの標準化とAWS IoT FleetWiseの活用
osawa
1
400
Codeful Serverless / 一人運用でもやり抜く力
_kensh
7
450
20250913_JAWS_sysad_kobe
takuyay0ne
2
250
いま注目のAIエージェントを作ってみよう
supermarimobros
0
360
Featured
See All Featured
Building Applications with DynamoDB
mza
96
6.6k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6k
Making Projects Easy
brettharned
117
6.4k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
The Pragmatic Product Professional
lauravandoore
36
6.9k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Site-Speed That Sticks
csswizardry
10
820
Transcript
自然言語による シェルコマンドラインチャー wanna の紹介 株式会社レクター 広木大地
広木 大地 1983年生まれ。筑波大学大学院を卒業後、2008年に新卒第1期として株式会社ミクシィに 入社。同社のアーキテクトとして、技術戦略から組織構築などに携わる。 同社メディア開発部長、開発部部長、サービス本部長執行役員を務めた後、2015年退社。 現在は、株式会社レクターを創業し、技術と経営をつなぐ技術組織のアドバイザリーとして、 多数の会社の経営支援を行っている。 著書『エンジニアリング組織論への招待~不確実性に向き合う思考と組織のリファクタング』 が第6回ブクログ大賞・ビジネス書部門大賞、翔泳社ITエンジニアに読んでほしい技術書大 賞2019・技術書大賞受賞。一般社団法人日本CTO協会理事。内閣官房、経産省、IPA、デ
ジタル庁などでDX/リスキリングに関する委員を歴任。 2022年9月、株式会社朝日新聞社社外CTO就任 2022年11月、株式会社グッドパッチ社外取締役就任 自己紹介
None
まずはデモをご覧ください。
None
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
複数のNLPタスクを組み合わせたUX GPTの凄さはNLPの圧倒的な民主化。これまで使わなかったところにもふんだんに使う設計 ①ソースコード生成 ③実行結果の評価と デバッグ ②スクリプト名の 提案 ④概要文の生成 ⑤ユーザー言語の 推定
GPTのすごさはNLPの民主化 (こんなところにも使うの?がUXになる。)
スクリプトの生成プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
実行結果から反省とデバッグ bashの出力をteeして、実行結果を systemプロンプトに抜粋して入力 もし、問題があればコードの修正をサジェスト。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
これまでの指示をまとめて概要文を作成
ユーザー言語を推定して、その言語で対話 プロンプトの能力は、英語の方が日本語よりやや高い。 また、論文やライブラリなど例が豊富。 一方、ユーザーへの応答は入力言語から自然と対応してほし い。(ときどき、英語で話し出すのを防ぐ )
Prompt Engineeringも 普通のエンジニアリング。 (既知のパターンの組み合わせと試行錯誤)
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
LLMソフトウェア =組織プロセス設計
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
メンバーが提案し、マネージャが決める AIと人間の関係は、メンバーとマネジメントの組織設計に似ている。 メンバーの仕事:実装したり提案する マネージャの仕事:目的の提供と意思決定
すべての人が AIをマネジメントする マネージャになる。