#昀哥看数# 身边的约定俗成从何而来——为什么录制音频的时候选择44.1kHz?
人耳可以听到的频率上限约为 20 kHz,根据奈奎斯特采样定理(采样率需 > 2倍信号最高频率),将一个连续的模拟信号离散化,高于采样频率的一半的部分会发生混叠,造成信号的失真。
↑——所以人耳听到的 20 kHz 需要至少 40 kHz 的采样频率——↑
早期的数码音乐,其实是通过 U-matic 录像带和 PCM 适配器存储在录像带上的。
↑——所以采样率必须与电视制式兼容——↑
而电视刚开始发展的时候,不同地区制定了不同的标准。除了北美和日本等地的NTSC制式(525线/60场),还有欧洲、中国等地的PAL制式(625线/50场),这些差异部分源于当地电力标准。比如说NTSC制式采用每秒60场(隔行扫描下为30帧)的刷新率,与北美地区交流电的 60Hz 频率同步,这样可以有效避免电源频率干扰导致的屏幕闪烁,反映在画面就是会有一个黑色的长条向一个方向滚动。
如果要求采样率高于 20kHz,又不高于 PAL 支持的上限 46.875kHz(每场总行数312.5行/场 × 50场/秒 × 3个采样点/行 = 46,875 Hz),如果想要同时兼容 PAL 和 NTSC 标准,以下频率满足需求:
40.5 kHz, 41.4 kHz, 42.3 kHz, 43.2 kHz, 44.1 kHz, 45 kHz, 45.9 kHz 和 46.8 kHz。
工程师经过权衡:
第一,44.1kHz 既能满足奈奎斯特定理(>40kHz),又同时低于PAL和NTSC两者实际可用上限的频率;
第二,理想的低通滤波器在现实中无法实现,从通带到阻带需要一个过渡带(即“额外频宽”)。44.1kHz 相比 40kHz 提供了这 2.05 kHz 的宝贵过渡带,使得设计能够有效滤除 20 kHz 以上信号、又不会对可听频段造成严重相位失真的模拟滤波器成为可能。
总结一下就是生理极限(20kHz)→ 理论要求(>40kHz)→ 历史路径依赖(视频设备存储)→ 技术约束(PAL/NTSC制式参数)→ 工程优化(在兼容频率中选择,为滤波器留余量)→ 最终标准(44.1 kHz),由此CD-DA红皮书标准得以统一全球,为我们带来了数十年的高质量数字音频体验。
