Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
標本化と量子化 (20221007_sampling_and_quantization)
Search
Koki Senda
October 07, 2022
Technology
0
9
標本化と量子化 (20221007_sampling_and_quantization)
2022年10月7日にVoicy社内のエンジニア発表会で話した内容です。
関連した話
https://speakerdeck.com/thousanda/20221111-32float
Koki Senda
October 07, 2022
Tweet
Share
More Decks by Koki Senda
See All by Koki Senda
eBPF超入門「o11yに使える」とは (20250424_eBPF_o11y)
thousanda
1
160
音声プラットフォームのアーキテクチャ変遷から学ぶ、クラウドネイティブなバッチ処理 (20250422_CNDS2025_Batch_Architecture)
thousanda
0
590
VoicyのTiDB移行とトラフィック量の変化に応じたリソース管理 (20241211_Findy_replace_Voicy_TiDB)
thousanda
0
20
VoicyのTiDB移行 失敗ポイント集 (20240613_Findy_TiDB)
thousanda
0
21
[Go Conference 2024] golang/goのbuiltin packageを覗いてみる (20240608_Go_Conference_2024_builtin_package)
thousanda
0
14
[Qiita Conference 2024] 音声プラットフォームVoicyがTiDBを検証し採用に至るまで (20240418_Qiita_Conference_PingCAP_Voicy_TiDB)
thousanda
0
11
パイプラインの並行化により音量正規化を8倍高速化した話 (20230705_concurrent_normalization)
thousanda
0
23
GASをバックエンドにしたLINE BotをChatGPTに作ってもらった話 (20230331_LINE_Bot_GAS_ChatGPT)
thousanda
0
5
FluxからArgo CDに移行したら お手製カナリアリリースが動かなくなった話 (20230317_k8s_flux_to_argocd)
thousanda
0
9
Other Decks in Technology
See All in Technology
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual Localization
takmin
0
390
生成AIによるデータサイエンスの変革
taka_aki
0
3.1k
[CV勉強会@関東 CVPR2025 読み会] MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos (Li+, CVPR2025)
abemii
0
180
AIエージェント就活入門 - MCPが履歴書になる未来
eltociear
0
210
生成AI活用のROI、どう測る? DMM.com 開発責任者から学ぶ「AI効果検証のノウハウ」 / ROI of AI
i35_267
4
150
LLM時代の検索とコンテキストエンジニアリング
shibuiwilliam
2
1.1k
新卒(ほぼ)専業Kagglerという選択肢
nocchi1
1
1.8k
いま、あらためて考えてみるアカウント管理 with IaC / Account management with IaC
kohbis
2
660
Backboneとしてのtimm2025
yu4u
3
1.3k
[OCI Skill Mapping] AWSユーザーのためのOCI(2025年8月20日開催)
oracle4engineer
PRO
2
110
歴代のWeb Speed Hackathonの出題から考えるデグレしないパフォーマンス改善
shuta13
6
580
2025新卒研修・Webアプリケーションセキュリティ #弁護士ドットコム
bengo4com
3
10k
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Mobile First: as difficult as doing things right
swwweet
223
9.9k
Statistics for Hackers
jakevdp
799
220k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.8k
Site-Speed That Sticks
csswizardry
10
780
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
For a Future-Friendly Web
brad_frost
179
9.9k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
560
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.4k
Transcript
標本化と量子化 2022/10/07 千田 航己
©2022 Voicy, Inc. はじめに 背景 • デジタル化された音データの話がしたかった • が、前提知識を揃えておかないとおもしろい話にならない気がした •
たぶん全3回くらいのシリーズになります 今日の内容 • 音声のデジタル化についての話 ◦ 標本化 (Sampling) ◦ 量子化 (Quantization) 標本化と量子化
©2022 Voicy, Inc. 標本化の元の意味 • たくさんあるものから一部を取り出すこと Sampling
©2022 Voicy, Inc. 標本化の元の意味 • 例: 国民全員にアンケートをとるのは大変 Sampling
©2022 Voicy, Inc. 標本化の元の意味 • 例: 国民全員にアンケートをとるのは大変 ◦ 一部の人を代表として選ぶ
Sampling
©2022 Voicy, Inc. 標本化 • 音のデジタル化の文脈の場合 ◦ 信号を時間方向に離散化する ◦
無限の連続性があるものの一部を取り出すイメージ Sampling
©2022 Voicy, Inc. 標本化 • 音のデジタル化の文脈の場合 ◦ 信号を時間方向に離散化する ◦
無限の連続性があるものの一部を取り出すイメージ Sampling
©2022 Voicy, Inc. 標本化 • 音のデジタル化の文脈の場合 ◦ 信号を時間方向に離散化する ◦
無限の連続性があるものの一部を取り出すイメージ Sampling
©2022 Voicy, Inc. 標本化 • 音のデジタル化の文脈の場合 ◦ 信号を時間方向に離散化する ◦
無限の連続性があるものの一部を取り出すイメージ Sampling
©2022 Voicy, Inc. 量子化 • 得られた信号を振幅方向に離散化する Quantization
©2022 Voicy, Inc. 量子化 • 得られた信号を振幅方向に離散化する Quantization
©2022 Voicy, Inc. 量子化 • 得られた信号を振幅方向に離散化する ◦ 各値はintの配列に入れるイメージ ◦
CD音源なら16 bit signed integer Quantization
©2022 Voicy, Inc. 量子化 • 量子化ビット数 ◦ 量子化するときに使うデータ量 ◦
N ビットのとき 2^N 段階に離散化する • 量子化の方法 ◦ データを格納する変数の型みたいなイメージ ◦ 整数表現を使うと一定間隔になる ◦ 浮動小数点表現を使ってもいい Quantization
©2022 Voicy, Inc. PCM • 一定間隔でサンプリングする方法 ◦ 「一定間隔でサンプリングしたデジタル音源なんだな〜」と思えばいい パルス符号変調
(Pulse Code Modulation)
©2022 Voicy, Inc. リニアPCM • リニア (Linear) = 線形
◦ 量子化の間隔も一定 ◦ 「データをIntで持ってるんだな〜」と思えばいい パルス符号変調 (Pulse Code Modulation)
©2022 Voicy, Inc. むすび 今日の発表 • 音声のデジタル化についての話 ◦ 標本化 (Sampling)
◦ 量子化 (Quantization) 次回 • 続きを話します ◦ 「デジタルの波形ってギザギザでしょ?サンプリング周波数が大きくすればするほどそれがなめらかになって音質が良 くなるんだよ!」という誤解 標本化と量子化
音声×テクノロジーでワクワクする社会をつくる