Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Gyazoの最近の生成AI関連の研究開発を全部見せます

yuiseki
August 25, 2024

 Gyazoの最近の生成AI関連の研究開発を全部見せます

yuiseki

August 25, 2024
Tweet

More Decks by yuiseki

Other Decks in Technology

Transcript

  1. • いまからGyazoにおける⽣成AI応⽤の研究開発に関する話をしますが、 • Gyazoは、ユーザーのデータ‧コンテンツのプライバシーに細⼼の注意を払っ ており、プライバシーにリスクの⽣じるようなことは、試みすらしません • Gyazoは、ユーザーのアップロードした、いかなるデータ‧コンテンツも、⽣ 成AIの事前学習やファインチューニングには使っていませんし、今後も使いま せん •

    また、Gyazoが利⽤している⽣成AI APIプロバイダーも、Gyazoから送信され たいかなるデータ‧コンテンツも、⽣成AIの学習や改善には使わないという条 件で契約をしています • この点に関しては、有料ユーザーであろうと無料ユーザーであろうと同様です • ⽣成AIに関して懸念を感じている⽅であっても、安⼼してGyazoをお使いくだ さい 重要なお知らせ ※画面は研究開発中のものです 6
  2. • プライバシー、⼤切 • ユーザーのデータ、⼤切 • ユーザーのコンテンツ、⼤切 • AIの学習には使わない、使わせない • 有料ユーザー、無料ユーザー関わらず

    • 安⼼してGyazoを使ってください 重要なお知らせ(SNSで拡散してください) ※画面は研究開発中のものです 7
  3. You are an excellent technical writer. Your role is to

    write a manual that describes the operations of the functions shown in the capture. You will always output the manual according to the following rules: - The manual MUST describes only the operations of the functions shown in the capture. - The manual MUST NEVER include any content not shown in the capture. - The manual MUST describe operations in as much detail as possible on a step-by-step. - The manual MUST properly describe mouse operation, keyboard operation, form input, or screen transitions. - The manual MUST NOT be generate description that is not shown in the capture. - Be sure that your manual is easy to understand for the user who will read it and operate the software. - When you find red arrow or red frame in the capture, you MUST only write the manual about the content that is pointed by the red arrow or covered by the red frame. - The manual SHOULD be based on the context of the entire capture. - Output MUST be use Markdown notation. - Output MUST be start the title of the manual. 唐突超お得情報:「マニュアルを書く」のプロンプト ※画面は研究開発中のものです 60
  4. • スクリーンショットを撮影 • ペイントツールを起動して、赤枠を書き込 み • ファイルに保存するか、クリップボードにコ ピー • ブラウザを起動して、ChatGPTのサイトを

    開く • ファイルをアップロード、またはクリップ ボードをペースト • プロンプトを頑張って書く • $20 / month 「ChatGPT」 vs 「Assistant for Gyazo」 ※画面は研究開発中のものです • Gyazoをクリックして起動 • ドラッグして範囲を選択 ◦ アップロードされる • Gyazoの書き込み機能でドラッグして赤枠 を書き込み • 保存ボタンをクリック • Assistantボタンをクリック • 実行したいタスクをクリック 63 • 高性能 ◦ 生成AIはコンテキストが豊富なほど正確かつ期 待通りの出力をする ▪ Assistant for Gyazoでは、各種メタデー タを付与 ◦ 生成AIのOCR性能は高くない ▪ Google Cloud Vision APIによる超高性 能なOCRの結果も付与 ChatGPT Assistant for Gyazo
  5. • Gyazoは⽣成AIと⼈間のインターフェイスとして相性が良い • Gyazoなら⽣成AIの性能を最⼤限に引き出せる ◦ GenAI Empowerment Technology ◦ メタデータによるコンテキストの付与

    ◦ ⾼性能なOCRの付与 ◦ 書き込み機能によるアテンションのコントロール • Gyazoなら⼈間の可能性を拡張できる ◦ Human Empowerment Technology ◦ ⽣成AIを活⽤した定型的なタスクを素早く、かつ⾼性能に実⾏できる ◦ キーボード⼊⼒がほとんど不要で⽣成AIを操れる ▪ 必要なのはマウスのクリック、ドラッグのみ まとめ1 ※画面は研究開発中のものです 86
  6. • Gyazoチームは⼤規模なサービスを安定して提供することはもちろん、⾼ い技術⼒と瞬発⼒で機能を研究開発をすることができます ◦ チームのみなさんの助⾔、⽀えがあってこそ • こんな⼈がGyazoのプロダクトマネージャーです ◦ プロダクトがどう使われているか、ユーザーの観察 ◦

    汎⽤的でありながら、特定の使い⽅にバッチリ刺さる機能の構想 ◦ バグがなく、使いやすいインターフェイスの探求 ◦ スケーラビリティやパフォーマンスを考慮したバックエンドの開発 ◦ プライバシーやコストを考慮したクラウドプロバイダーとの連携 ◦ ⽣成AIの性質、挙動、扱い⽅や性能の引き出し⽅の深い理解 まとめ2 ※画面は研究開発中のものです 87
  7. • 本当にニーズがあるのか不明…… • UIとUXも、もっと洗練させられる…… ◦ ボタンだらけのUIはない…… • プロンプトインジェクション対策してない…… • もっとさらに便利にもできるはず……

    • プライシングも考えないといけない…… ◦ ⽉額590円でGemini 1.5 ProとMultimodal Embedding呼び出し放題は太っ腹すぎる • etc… ⼀般リリース時期未定の事情 ※画面は研究開発中のものです 93