プロンプトの自動最適化を用いて生成アプリの精度向上を行うワークフローを構築しました。 Human annotationを用いて信頼できるLLM-as-a-Judgeを構築し、構築したLLM-as-a-Judgeを用いてアプリケーションのプロンプトを自動チューニングする仕組みです。 成果物GitHub: https://github.com/eycjur/wandb_agent_hackathon/tree/main/llm-as-a-judge-mvp