最近拍#这车音响怎么调# 遇到了一大堆奇葩问题和胡扯说法,我捡几个有代表性的细聊下,今天说被提及最多的 —— 音质
先说几个结论:
1、“黑胶的音质最好”是纯扯淡;
2、音乐平台上的“母带、臻品、高清超清”是蒙人+偷换概念;
3、A音乐平台不会比B平台的音质更好;
4、绝大多数人听不出来高低音质的区别,说听得出来的,基本都是心理作用;
5、很多人说的“音质好”,其实指的是“质感、音色、声场、听感…”,唯独就没说真正的音质;
下面的内容,是上述结论的原因,也可以不看
音质,就是音频的质量。
人类自可以记录声音并进行回放以来,共经历了两个时代 —— 模拟音频时代(磁带、黑胶)、数字音频时代(CD、数字文件、网络播放)。前者的最高音质载体,是用录音时的开盘带转录的母带/母盘。后者的最高音质载体,是音乐在电脑上制作完毕后输出的.wav本地文件。这两种“音频的原始声音”,是咱们可以听到的“最高音频质量的音乐”。
模拟音频时代的母带/母盘,需要进行多次转录,才能成为流通到市场中可以被购买的磁带/黑胶,这个转录过程,一定有音质的损耗。所以广大消费者手中的黑胶,就已经不是那个时代最好的音质产物了。换句话说,那个时代的最高音质,就一份。
而后来把数字音频的声音刻录到黑胶唱盘中,并说这个黑胶音质是最好的,是扯淡中的扯淡。这相当于用胶卷相机翻拍一张8K高清图片,然后把胶卷洗成相片,再把这张相片复洗出来一张,最后拿着它对你说:看到了么,这才是最好的画质。
要么是纯骗子,要么是真不懂。现在玩黑胶,本质上是在玩仪式感。
而数字音频时代,对于音质,是有非常明确的计量标准的 —— 码率bps = 采样率Hz × 位深bit × 双声道2。请注意,不是这些数字越大,音乐的音质就越好,这些代表音质的数字是有极限的,这个极限,就是上述“.wav本地文件”输出时的标准,而大于这个标准数字的部分,都是“假音质”。
接下来我讲个故事,尽量把这个理工内容讲明白:
人能够听到的声音频率区间,是20Hz至20,000 Hz,能听到这个区间之外的,都不是人,比如蝙蝠,可以听到200,000Hz,那就是超声波了。基于这点,人开始研究,怎么把物理世界的振动频率所产生出的声音,记录在数字世界里呢?答案是 —— 打点并连续播放。
理论上,这些声音点只要打足够密,人就听不出来区别,要多密呢?答案是“人能听到频率极限的2倍以上”,那就是一秒内要打40,000个声音点,有这结论后,科学家准备全球推行此标准,但出师不利,因为电视。是的没错,因为上世纪六七十年代的 - 电视。
当时,欧洲电视是一秒25帧,美国是30帧,为了能让音频适应两种电视的帧率,工程师把兼容的音频采样率定在了44,100Hz。后来1980年索尼和飞利浦联合制定“CD数字音频标准“时,沿用了这个采样率,这,就成了音频世界的标准采样率。然后开始推行,全球上亿台的音频设备全都使用了这个标准,本以为就这样了,但DVD来了,又产生了新麻烦。
DVD里放电影,电影是一秒24帧,又特么不兼容了,工程师一通计算,给出兼容三者的数字是48,000Hz,但两个标准没有统一,一直并行延续到今天,所以多数时候,音频制作软件和播放平台,使用44,100Hz标准,视频制作软件和播放平台,使用48,000Hz的音频标准。而它们本质上,都是一秒钟打的声音点位的数字,且都超过了40,000个。
好了我们继续说音质的事,另一个极为重要的数据维度,叫“位深”。这个位深,就是每个声音点打到了什么精度,而“精度”指的是每个点记录的音量最小值是多少。有点复杂,不细说了,反正音乐人通常在32bit的标准下制作音乐,并用24bit作为标准进行成品的输出。
那么综上所述,那个最高音质“.wav本地文件”就是:采样率44,100 Hz × 位深24bit × 双声道2 = 2,116,800bps码率。缩写成千位,就是2,116.8k bps。这,就是数字音频时代“最高”的音质数字了,因为音乐在录音棚做完了,输出了,用的就是这个标准输出的,这,就是这个音乐的“最原版”。
而CD,会比这个标准略低一点,是44,100Hz采样率 × 16bit位深 × 双声道2 = 1,411k bps码率,这是因为24bit位深的音乐文件有点大,当年在一张CD光盘里放不下多少首歌,所以用了16bit位深。所以现在说CD的音质是最好的,也不够严谨。不过,两者已经听不出什么区别了。
重点来了,按此数据标准,“无损SQ”的音质,在QQ音乐中,是“最高48kHz / 24bit”,在网易云音乐中,是“最高48kHz / 16bit”,两平台都是双声道。所以这个“无损SQ”,基本就是“.wav本地文件”和CD的标准了,这就足够用了。再往上数字更大的那些96kHz、192kHz,都是“二次做的假”,只是用技术手段让数字显得更大、文件变的更大而已。
音乐人制作和输出作品时,都没用你这个采样率啊,你是怎么做到“还原母带和录音现场体验”的呢?比如一首歌,在广州的录音棚录制完毕,你用北京的服务器咔咔一顿“神经网络算法”,就还原广州录音棚的现场了?问题是,广州没用你那192,000Hz录啊,另外,你整这么高的数值干啥啊?给谁听啊?谁听得到啊?给蝙蝠听吗?
说到这,上述5点结论的原因,应该都介绍清楚了
最后我想说,音质,绝不是欣赏音乐的极必要条件,追求高音质没毛病,但一要追真的音质,二是够用就可以了,音乐本身,才最重要。记得你第一次听音乐被深深感动时,用的是什么音质水平的音频载体、播放器、扬声器/耳机吗?还记得那次怦然心动吗?
另外再举个例子吧,就像看高水平球赛的视频,720p的清晰度确实不够,最好是4K的,这看得才清楚。但没必要非得看8K+120寸SONY的电视,然后注意力都在电视的色彩和清晰度上。要那么清楚干嘛?看球员的体毛级越位吗?
看比赛!比赛才重要!
