この資料は次のオンラインイベントの投影資料です。
<イベント名>
生成AIアプリを観測してみよう!
<イベントページ>
https://ibm-developer.connpass.com/event/325658/
<概要>
現在、⽣成AIに関する関⼼が⾼まっており、⼤規模⾔語モデル(LLM)を活⽤したAIアプリケーションに注目が集まっております。
そのような中、代表的なLLM (GhatGPT, Gemini, IBM Watsonx など)のサービスプロバイダーの多くははinput / outputのトークン利用量に応じた課金体系を取っている状況です。
しかし、LLMを活用したAIアプリケーションを管理する上で、実際のトークン利用量を把握するのは難しく、トークン利用量を管理しながらLLMコスト自体を適切にコントロールすることへのニーズが高まっています。
このようなLLMのトークン利用量やコストの把握に対する課題を解決するためのオープンソース・ソフトウェアの「OpenLLMetry」を今回のイベントでは学習します。
OpenLLMetryを活⽤することえ、⽣成AIが組み込まれたLLMアプリケーションの可観測性を獲得し、トークン使用量、レイテンシー、コストなどの追跡をすることでLLMアプリケーションの可観測性を強化することができます。
なお、今回の発表は、生成AIに興味があるエンジニア向け、生成AIのエンジニア向けを対象に対象にしております。
・座学として、生成AIの近況・課題・解決策について学習内容を基に発表します
・デモとして、LLMを活用したAIアプリケーションのトークン使用量、レイテンシー、コストなどを追跡できるところを見てみましょう!
また、デモではInstanaというAPM (Application Performance Monitoring)ソリューションを利用して可視化を体験していただく予定です。
事前準備などは特に必要ございませんので、初学者の方もお気軽にご参加ください!
※スピーカーの勉強内容を基に発表いたします。