【技術検証】Gemini 3 Flash × Pythonで「辛口英語コーチ」を作った話 (E...

December 24, 2025

310

【技術検証】Gemini 3 Flash × Pythonで「辛口英語コーチ」を作った話 (EchoPerfect AI)

Googleの最新モデル「Gemini 3 Flash」を活用し、音声波形レベルで発音を矯正するAIアプリ「EchoPerfect」の技術解説スライドです。

Vercel Serverlessの「10秒の壁」などの制約を、アーキテクチャとUXの工夫でどう乗り越えたかをまとめています。

【主なトピック】
・Deep Phonetic Analysis: 文字起こしではなく、音声波形を直接比較・推論するアーキテクチャ
・Vercelの10秒制限対策: 「マイクロフレーズ方式」によるUXの再設計
・Read-Onlyファイルシステムの攻略: io.BytesIO を使ったオンメモリ音声処理
・厳格な出力制御: JSONスキーマによるGeminiの「コーチング」品質担保

【技術スタック】
Frontend: Next.js (App Router) Backend: Python (FastAPI) on Vercel AI Model: Gemini 3 Flash (Multimodal)

【関連リンク】
GitHub: https://github.com/nekoai-lab/Echo-Perfect-AI
Zenn: https://zenn.dev/nekoai_lab/articles/30bfd478ca72e4

月ねこAI

December 24, 2025

More Decks by 月ねこAI

See All by 月ねこAI

AI論文を「自分の知識」にするRAGアプリの設計と実装

0

20

【個人開発】Gemini API × Canvas × Next.jsで作る「感情に寄り添う」AI名言アプリ開発録

0

140

Google製OSS「Meridian」を用いた広告予算最適化：MMM実装検証レポート【Python / ベイズ推定】

0

380

【技術検証】Gemini API × Reactで「プロンプト著作権チェッカー」を作った話

0

150

【保存版】「ガチャ」からの脱却：Gemini × Veoで作る、意図を反映するAI動画制作ワークフロー

0

470

Google Stitch 大型アップデートが実現するアイデアとコードの完全なる融合

0

340

Other Decks in Technology

See All in Technology

DI コンテナ自動生成ツールを実装してみた / intro-autodi

0

720

AsyncStreamでマルチブロードキャストを実装する

1

180

マンション備え付けのネットワークとLTE回線を組み合わせたネットワークの安定化の考案

1

140

インプロセスQAのための要因から捉えるプロジェクトリスクマネジメントnano #1 開発リソース効率状態への対処 #jasstnano

0

210

Redmine次期バージョン7.0の注目新機能解説 — UI/UX強化と連携強化を中心に

1

220

AIのために、AIを使った、Effect-TSからの脱却〜テストを活用した安全なリファクタリングの進め方〜

PRO

1

180

[続・営業向け誰でも話せるOCI セールストーク] セールストーク総集編(2026年5月15日開催)

oracle4engineer

PRO

1

110

Cortex(Code) を ML モデルの精度改善サイクルに組み込む.pdf

0

250

続運用改善、不都合な真実〜物理制約のない運用改善はほとんど無価値 / 20260518-ssmjp-kaizen-no-value-without-physical-constraints

2

290

Gaussian Splattingの実用化 - 映像制作への展開

gpuunite_official

0

210

TypeScriptはどのようにどこまで推論できるのか ─ とにかく as は禁止で

1

270

PdM・Eng・QAで進めるAI駆動開発の現在地/aidd-with-pdm-eng-qa

0

260

Featured

See All Featured

The Psychology of Web Performance [Beyond Tellerrand 2023]

49

3.4k

Skip the Path - Find Your Career Trail

1

120

AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference

1

1.2k

How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.

0

120

Designing Powerful Visuals for Engaging Learning

1

370

Unsuck your backbone

672

58k

The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)

PRO

0

330

Lessons Learnt from Crawling 1000+ Websites

PRO

1

1.2k

Navigating Algorithm Shifts & AI Overviews - #SMXNext

1

1.2k

The Web Performance Landscape in 2024 [PerfNow 2024]

12

1.1k

GitHub's CSS Performance

1033

470k

Efficient Content Optimization with Google Search Console & Apps Script

PRO

1

550

Transcript