Slide 1

Slide 1 text

Kotoba Technologies 同時翻訳への挑戦 発表者: 笠井淳吾 (Co-founder & CTO at Kotoba Technologies, Inc.)

Slide 2

Slide 2 text

自己紹介 / 会社紹介 笠井淳吾 Co-founder & CTO Kotoba Technologies ● 2023年7月創業 ● 音声に特化した生成AIの研究開発を行う。 ● 経産省GENIAC採択企業 (第1.5/2回) ● 累計資金調達額: 7.2~億円 (2024年10月)

Slide 3

Slide 3 text

Take-home Messages 1. 個人的な話: 起業までの経緯・考えていたこと 2. Kotobaの話:開発技術・ビジネス・サービス展開 生成AIツール AI領域のノーベル賞受賞

Slide 4

Slide 4 text

個人的な話:笠井 淳吾 (カサイ ジュンゴ) TTIC 研究助教授 ​​2023年8月 ワシントン大学コンピューターサイ エンス博士課程卒業 NAACL 2022 Best Paper、孫正義育英財団 研究分野: ● Machine Translation ● Efficiency, Generation 2017年5月 イェール大学統計学部 卒業 2018年9月 ワシントン大学 入学 高校生の時は哲学。。。

Slide 5

Slide 5 text

Chapter 2: PhD 1st Year 多言語での構造解析 Chapter 3: PhD 2nd Year 高速機械翻訳 Chapter 4: PhD 3rd Year 機械翻訳全般 Chapter 5: PhD 4-5th Year モデルの高速化、効率化、 評価、大規模言語モデル Chapter 1: Pre-PhD 構造解析、文法理論 個人的な話:笠井 淳吾

Slide 6

Slide 6 text

Chapter 2: PhD 1st Year 多言語での構造解析 Chapter 3: PhD 2nd Year 高速機械翻訳 Chapter 4: PhD 3rd Year 機械翻訳全般 Chapter 5: PhD 4-5th Year モデルの高速化、効率化、 評価、大規模言語モデル Chapter 1: Pre-PhD 構造解析、文法理論 個人的な話:笠井 淳吾

Slide 7

Slide 7 text

個人的な話:Fugaku-LLM 世界最大級の国内スパコン富岳を使って日本語LLM(生成AIを学習)

Slide 8

Slide 8 text

個人的な話: Kotoba Technologiesの創業 日本からも生成AIの開発をリードできる企業が必要 生成AIのスピード感を出すためにスタートアップという場 六本木 (2023年9月) 従業員2名 大手町 (2024年12月) 従業員13名 小島 熙之 博士 CEO 笠井 淳吾 博士 CTO 共同創業者

Slide 9

Slide 9 text

Kotoba:開発チーム AIのトップ国際会議でのベスト ペーパー賞などの研究実績 ● Best Paper Award @ EMNLP 2022 ● Best Paper Award @ NAACL 2022 ● AAAI Best Paper Award @ AAAI 2020 ● ACL Outstanding Paper Award @ ACL 2017 source: https://www.itmedia.co.jp/aiplus/articles/2405/10/news186.htm l Fugaku-LLMを始めとするスパコンを 活用した豊富な大規模AI学習の実績 富岳 ABCI TSBUBAME4.0

Slide 10

Slide 10 text

Kotoba:音声基盤モデルの開発 日本から音声生成AIの基盤を作る! 音声書き起こし HuggingFaceで50万以上のダウ ンロード。NVIDIA AI summit fireside chatや病院、メディアな どで使用される。 音声生成・ 音声チャットボット 駿台やKDDI音声チャットなど 同時通訳 同時通訳 Speech-to-Speech Speech-to-Text

Slide 11

Slide 11 text

Kotoba-Whisper:超高速音声認識(ASR)

Slide 12

Slide 12 text

Kotoba-Whisper:超高速音声認識(ASR)

Slide 13

Slide 13 text

Text vs. Speech 音声とテキストの非対称性 • Sampling Rate (Hz), Noise • Data Storage, Preprocess • Latency Requirements

Slide 14

Slide 14 text

技術デモ:日本語音声生成 多様で流暢な日本語生成が可能・声真似(voice cloning)も可能

Slide 15

Slide 15 text

技術デモ:マルチリンガル展開

Slide 16

Slide 16 text

NVIDIA AI Summit Japan Live Transcription @AI Summit Japan 2024 Simultaneous Translation (What we actually wanted to do) https://youtu.be/x8O6ChAWBxs Kotoba’s model with 500k+ downloads on HuggingFace was used for live transcription. Kotoba:同時通訳技術へのフルコミット

Slide 17

Slide 17 text

Kotobaの情報発信 Kotoba Technologiesは音声基盤技術を通じて 日本を代表する生成AI技術を開発する事にコミットします。 代表メールアドレス 小島、笠井:{nkojima, jkasai}@kotoba.tech 公式X 採用ページ 創業秘話 & 採用情報