Kotoba Technologies 同時翻訳への挑戦 / Kotoba

Slide 1

Slide 1 text

Kotoba Technologies 同時翻訳への挑戦発表者: 笠井淳吾 (Co-founder & CTO at Kotoba Technologies, Inc.)

Slide 2

Slide 2 text

自己紹介 / 会社紹介笠井淳吾 Co-founder & CTO Kotoba Technologies ● 2023年7月創業 ● 音声に特化した生成AIの研究開発を行う。 ● 経産省GENIAC採択企業 (第1.5/2回) ● 累計資金調達額: 7.2~億円 (2024年10月)

Slide 3

Slide 3 text

Take-home Messages 1. 個人的な話: 起業までの経緯・考えていたこと 2. Kotobaの話：開発技術・ビジネス・サービス展開生成AIツール AI領域のノーベル賞受賞

Slide 4

Slide 4 text

個人的な話：笠井淳吾 (カサイジュンゴ) TTIC 研究助教授 2023年8月ワシントン大学コンピューターサイエンス博士課程卒業 NAACL 2022 Best Paper、孫正義育英財団研究分野： ● Machine Translation ● Efficiency, Generation 2017年5月イェール大学統計学部卒業 2018年9月ワシントン大学入学高校生の時は哲学。。。

Slide 5

Slide 5 text

Chapter 2: PhD 1st Year 多言語での構造解析 Chapter 3: PhD 2nd Year 高速機械翻訳 Chapter 4: PhD 3rd Year 機械翻訳全般 Chapter 5: PhD 4-5th Year モデルの高速化、効率化、評価、大規模言語モデル Chapter 1: Pre-PhD 構造解析、文法理論個人的な話：笠井淳吾

Slide 6

Slide 6 text

Slide 7

Slide 7 text

個人的な話：Fugaku-LLM 世界最大級の国内スパコン富岳を使って日本語LLM(生成AIを学習)

Slide 8

Slide 8 text

個人的な話： Kotoba Technologiesの創業日本からも生成AIの開発をリードできる企業が必要生成AIのスピード感を出すためにスタートアップという場六本木 (2023年9月) 従業員2名大手町 (2024年12月) 従業員13名小島熙之博士 CEO 笠井淳吾博士 CTO 共同創業者

Slide 9

Slide 9 text

Kotoba：開発チーム AIのトップ国際会議でのベストペーパー賞などの研究実績 ● Best Paper Award @ EMNLP 2022 ● Best Paper Award @ NAACL 2022 ● AAAI Best Paper Award @ AAAI 2020 ● ACL Outstanding Paper Award @ ACL 2017 source: https://www.itmedia.co.jp/aiplus/articles/2405/10/news186.htm l Fugaku-LLMを始めとするスパコンを活用した豊富な大規模AI学習の実績富岳 ABCI TSBUBAME4.0

Slide 10

Slide 10 text

Kotoba：音声基盤モデルの開発日本から音声生成AIの基盤を作る！音声書き起こし HuggingFaceで50万以上のダウンロード。NVIDIA AI summit fireside chatや病院、メディアなどで使用される。音声生成・音声チャットボット駿台やKDDI音声チャットなど同時通訳同時通訳 Speech-to-Speech Speech-to-Text

Slide 11

Slide 11 text

Kotoba-Whisper：超高速音声認識（ASR)

Slide 12

Slide 12 text

Kotoba-Whisper：超高速音声認識（ASR)

Slide 13

Slide 13 text

Text vs. Speech 音声とテキストの非対称性 • Sampling Rate (Hz), Noise • Data Storage, Preprocess • Latency Requirements

Slide 14

Slide 14 text

技術デモ：日本語音声生成多様で流暢な日本語生成が可能・声真似(voice cloning)も可能

Slide 15

Slide 15 text

技術デモ：マルチリンガル展開

Slide 16

Slide 16 text

NVIDIA AI Summit Japan Live Transcription ＠AI Summit Japan 2024 Simultaneous Translation (What we actually wanted to do) https://youtu.be/x8O6ChAWBxs Kotoba’s model with 500k+ downloads on HuggingFace was used for live transcription. Kotoba：同時通訳技術へのフルコミット

Slide 17

Slide 17 text

Kotobaの情報発信 Kotoba Technologiesは音声基盤技術を通じて日本を代表する生成AI技術を開発する事にコミットします。代表メールアドレス小島、笠井：{nkojima, jkasai}@kotoba.tech 公式X 採用ページ創業秘話 & 採用情報