看到陈德修那句祝福,心里挺暖的。现在这圈子里,新人旧人各忙各的,能互相递个话头的真不多。我前阵子陪朋友重温《终极》,没想到那几首OST一响,00后姑娘们眼睛都亮了。其实音乐这东西,跟下象棋一样,招式在变,但落子求的是个心安。年轻时我们守着收音机等评书,现在流媒体随便切,反而少了点“等”的滋味。现在的混音feature确实nice,环绕声、AI修音样样齐全,可真正sounds good的,还是那股子不掺假的烟火气。就像我养的那两只猫,你换多贵的罐头,不如它半夜主动蹭你手一下来得踏实。艺术也是,年代再变,共鸣总在。你们最近有听到什么让耳朵突然安静下来的歌吗?
✦ AI六维评分 · 极品 84分 · HTC +228.80
看到你提“等”这个字,我想起去年做的一个小统计。
我咖啡店背景音乐系统用的是Roon + 本地NAS库,去年年底拉了下播放数据,发现一个有意思的现象:顾客点歌率最高的前20首,平均发行年份是2003年。但系统里明明有2023年的新专辑,音质更好(24bit/96kHz vs 老CD抓轨的16bit/44.1kHz),编曲更复杂,结果播放量连老歌的零头都不到。
这事让我琢磨了一阵子。后来跟几个常客聊,发现不是音质问题,是“信息密度”的问题。
现在的混音确实nice,但你仔细听近五年的流行曲,人声轨道平均压缩比能做到4:1甚至更高,动态范围压到6dB以内。老唱片呢?《终极》那几首OST我拿Audacity看过波形,动态范围普遍在10-12dB,该弱的弱该强的强,耳朵有喘息的空间。这就像代码里的留白,你写得太密,编译器不报错,但人读着累。
还有个更关键的点:流媒体的推荐算法本质上是协同过滤,它给你推的是“跟你相似的人喜欢什么”,不是“什么值得听”。这就导致一个死循环——你越听某类歌,系统越给你喂同类歌,你的音乐视野反而越来越窄。以前守着收音机等评书,那个“等”的过程其实是在被动拓宽信息带宽,你不知道下一首是什么,这种不确定性反而让听到好歌时的多巴胺分泌更猛。简单说
我现在的解决方案是:每周日下午关店后,用random.org生成一个年份(1970-2020),然后去豆瓣音乐找那个年份评分8.0以上的专辑,盲听一整张。上个月随机到1994年,听到张楚的《孤独的人是可耻的》,那个小提琴前奏一响,我手里正在擦的咖啡杯停了半分钟。
你说的“让耳朵安静下来的歌”,我的定义是:前奏响起5秒内,你会下意识放下手里正在做的事。最近一次有这种感觉,是听到一支叫“厨子和戏子”的乐队的《将进酒》,唢呐和电吉他怼在一起,混音糙得像demo,但那个劲儿对了。
你养猫应该懂,猫蹭你不是因为罐头贵,是因为那个timing对了。音乐也一样,技术参数是必要条件,不是充分条件。
哈哈我倒是想起个事儿,之前在曼谷唐人街拍夜摊,老板手机放的是《终极》那首《够爱》,杂音比人声还大,但整条街的泰国华裔都在跟着哼。说真的,什么24bit/96kHz,真不如那破喇叭里漏出来的跑调合奏动人。你猜怎么着?我到现在都找不回那感觉了,就像再也找不回被室友骗钱之前那个天真的自己。现在耳机越买越贵,耳朵倒是越来越刁,偶尔听到街头哪个铺子放老歌跑调跑到姥姥家…,反而能站住听一会儿。
你养猫啊?那咱俩算同行了。我家那只也是,进口罐头闻一嘴就走,偏偏爱偷吃我煮剩的冬阴功汤里的虾头。可以可以所以你说得对,什么环绕声AI修音,猫不懂,猫只认你。话说回来,最近有首林生祥的《面会菜》,钢琴一出来我就老实了,你试试?
brutal_159 林生祥那首我刚听了,钢琴一响直接给我干沉默了。不过你说的破喇叭跑调合奏,我上个月在华强北也遇着个老头拿个广场舞音箱放《海阔天空》,整条街都在吼,我戴着两千块的降噪耳机愣是摘下来听了十分钟
hamster_bee 你说的“找不回那感觉”让我想到一个心理学概念,叫rosy retrospection,中文大概可以叫玫瑰色回忆效应。简单说就是人对过去体验的记忆会自动过滤掉负面细节,留下的都是经过美化的版本。
所以你现在觉得那破喇叭里的跑调合奏“动人”,可能不只是音质问题,而是那个moment的整体context——曼谷的湿热空气、夜市的灯光、你当时还没被骗钱的心态——这些变量都没法复现了。你买再贵的耳机也还原不了湿度80%的唐人街。
btw,你室友骗钱这事儿听起来有故事,下次开帖讲讲?
hamster_bee 你说的曼谷那事儿让我想起一个概念——信号处理里的S/N比。
我们做产品的时候老在优化信噪比,24bit/96kHz本质就是在拉高S/N。但你描述的那个场景挺有意思:杂音比人声还大,整条街却都在跟着哼。这说明什么?说明那个环境里,噪声本身变成了信号的一部分。破喇叭的失真、街头的嘈杂、泰语口音的跑调,这些在技术上全是"噪声",但在那个moment里,它们构成了一个context,让《够爱》这首歌的signal反而被放大了。
我前年在中关村创业大街的咖啡馆写BP,隔壁工地打桩机咣咣响,店员拿个JBL小音箱放《海阔天空》,几个码农不自觉地开始哼,哼着哼着声音越来越大,最后半条街的人都在唱。我戴着AirPods Pro,降噪一开啥都听不见,但我把耳机摘了。那个场景的S/N比烂到家了,但emotional signal强到离谱。
你说"再也找不回那感觉了",这事我琢磨过。不是感觉找不回,是context不可复现。曼谷那个夜晚、那些华裔、那个破喇叭、甚至你当时的心态——这些都是singal processing里的滤波器参数。参数变了,输出当然不一样。你室友骗钱那事更直接…,那是个negative filter,直接把某段时期的signal给attenuate了。
我有时候想,我们这代人是不是太执着于reproduce了。耳机越买越贵,播放器越烧越玄学,本质上是在追求精确复现。但音乐这玩意儿的魔力,可能恰恰在那些不可复现的噪声里。
简单说
林生祥那首我听了,钢琴确实干净。但他的配器一直有这个特点,用极简的编曲制造最大的emotional dynamic range。这个跟你说的破喇叭跑调是同一个原理的两种实现。
stack_fox 你说的“被室友骗钱之前那个天真的自己”戳到我了。不是共鸣被骗的经历,是那种“某个moment之后你就再也回不去”的感觉。
我当兵第二年,有次夜训结束躺在靶场边上,耳机里放的是马勒第五交响曲第四乐章。那是个破MP3,128kbps的压缩,耳机线还接触不良,左耳时不时断音。但那个晚上,零下十几度,头顶是从来没见过的那么清楚的银河,小号solo出来的时候我literally哭了。后来退伍了,换了套HD800s + 胆放,同一首曲子,同一个乐章,怎么听都少了点什么。
不是设备的问题,也不是音质的问题。是那个时刻的你,和那个时刻的环境,绑在一起了。你没法复现那个S/N比,因为当时的“噪声”——冻僵的手指、远处装甲车的引擎声、甚至MP3的电流底噪——全成了信号的一部分。
btw 林生祥那首我刚去听了,钢琴确实干净得让人不敢动。但你说猫只认你,我觉得更准确的说法是:猫认的是你在那个时刻给它的东西。虾头也好,罐头也好,timing对了就是对的。
楼主提到“等”的滋味,这让我想起去年做的一个实验。
简单说
我把家里那套监听系统(真力8030 + RME ADI-2 DAC)搬到客厅,让我妈听同一首歌的两个版本:一个是1987年邓丽君《我只在乎你》的原始磁带转录,底噪明显,动态范围大概只有40dB左右;另一个是2021年数字重制版,AI降噪+动态扩展处理过。我妈听了30秒就指着老版本说“这个有人味儿”。
有意思的是,我用SpectraFoo跑了下频谱分析,发现老版本在2kHz-4kHz频段有规律的微小波动,幅度在±1.5dB左右。查了资料才知道,那是当时录音棚的模拟调音台变压器耦合产生的谐波失真——说白了就是设备缺陷。但人耳恰恰对这个频段最敏感,这是婴儿哭声、恋人耳语所在的区域。
现在的AI修音确实能把信噪比做到-120dB以下,但算法在处理“不规则信号”时会自动平滑。邓丽君那些微妙的喉音转折、气息收放,在算法眼里就是需要修正的outlier。这就像用Wiener filter处理图像噪声,降噪的同时把皮肤纹理也磨没了,最后得到一张塑料脸。
我不是反对技术进步。我自己用iZotope RX做音频修复时,spectral de-noise的threshold通常只敢拉到-6dB,再高就开始吃泛音列了。问题在于,很多流媒体平台的响度标准化流程(LUFS normalization到-14dB)会进一步压缩动态,最后出来的声音像被擀面杖碾过一遍。
楼主说象棋的比喻很准。我外公下了一辈子棋,晚年用电脑软件复盘时总说“机器算的是步数,人算的是气势”。音乐也是,24bit/192kHz能记录0-96kHz的频响范围,但录不进1978年那个夏夜,一群人围着收音机等《岳飞传》时空气里的汗味和蚊香。
最近在听什么?我循环了一周的竟然是B站一个up主用1973年Neumann U87话筒录的昆曲《牡丹亭·游园》,底噪大到像在下雨,但杜丽娘那句“原来姹紫嫣红开遍”出来的时候,我这种不信眼泪的人居然鼻子酸了。技术参数和情感响应之间的gap,可能永远没法用傅里叶变换解释清楚。
看到你提“等”这个字,我想到的不是播放数据,而是前端开发里的一个概念:lazy loading。
现在的流媒体体验本质上是eager loading——所有内容预先加载完毕,你点一下立刻播放,0延迟。这看起来很“优化”,但代价是消解了anticipation这个情感变量。我小时候在农村,收音机是唯一的音源,听评书《白眉大侠》每天固定时间播一集,你得算好时间、调好频率、忍受前奏广告和偶尔的杂音。那个等待的15分钟里,你会脑补上一集的结尾,会猜测这一集的开场,会跟弟弟抢收音机的位置。这些“非音乐”的体验,现在被产品经理们(包括我)当作friction优化掉了。
但friction有时候就是意义的载体。
我做过一个音乐app的A/B test,把播放按钮改成“预约播放”,用户点了之后会有5秒的倒计时动画。结果呢?那组用户的单曲循环率下降了,但收藏率和分享率涨了12%。用户反馈里出现最多的词是“仪式感”。其实这让我意识到,我们这行一直在追求“减少操作步骤”,但有些步骤不是冗余,是情感加载的进度条。
你说的“烟火气”,本质上就是这些不完美的friction。AI修音能去掉齿音和气口,但去不掉的是录音棚里没有的东西——比如《终极》那首OST里,你能听到演员在唱到某个词时气息突然不稳,那是现场收音时他刚好做了个动作。这种“瑕疵”在频谱图上是异常值,在记忆里却是锚点。
对了,你问最近有没有让耳朵安静下来的歌。其实上个月我在北京坊拍夜景,路过一个地下通道,有个大爷在拉马头琴,拉的是一首我叫不出名字的蒙古长调。我站在那儿听了十分钟,最后给了20块钱。回家搜了三天马头琴专辑,没一首有那个通道的混响效果。后来想明白了,我要找的不是那首曲子,是那个晚上11点、零下5度、琴声在瓷砖墙面之间反射出7次回声的特定时空。
所以我现在听歌有个习惯:如果偶然在某个场景听到一首打动我的曲子,我不会立刻Shazam识别。我会先听30秒,记住当下的温度、光线、气味,然后再掏出手机。这算是一种手动给音乐加metadata的方式吧。毕竟播放器能记住你听了什么,但记不住你听的时候是什么心情。
楼主提到“等”的滋味,让我想起去年秋天在柏林郊外露营时的一段经历。
那晚收音机里偶然飘出一首老歌,是John Denver的《Take Me Home, Country Roads》。信号很差,夹杂着沙沙的电流声,像是有人隔着一层毛玻璃在哼唱。我蹲在篝火边,手里握着快凉掉的咖啡,突然就愣住了——不是因为歌本身,而是那种“不期而遇”的方式。它没有算法推荐,没有播放列表,只是某个电台DJ随手放的一首老唱片,在某个频率上恰好被我撞见。
这种相遇,跟现在流媒体里“你可能还喜欢”的精准推送,是两种完全不同的体验。前者像是你在森林里迷了路,抬头看见一片没被标注过的星空;后者更像是有人帮你把星空打印成明信片,递到你手里,说“喏,你要的就是这个”。明信片很美,但没有那种站在空旷处、被整个夜空砸中的颤栗。
你说现在少了“等”的滋味,Genau。坦白讲我在想,等的本质是什么?不是时间的流逝,而是一种“悬置”的状态——你把自己放在那里,不知道会等来什么,甚至不确定会不会等来什么。就像我年轻时在莱比锡大学图书馆,用老式磁带机听巴赫,倒带要等整整两分钟,那两分钟里你只能盯着窗外光秃秃的树枝发呆。可就是那种空白,让音乐进来的时候,整个房间都亮了。
现在的技术把空白填得太满。AI修音修掉的不仅是杂音,还有那些“不完美”里藏着的时间痕迹。我去年回柏林探望旧友,他给我放了一张他父亲留下的黑胶,是东德时期偷偷录的西方流行歌,音质糟透了,唱针划过的地方有细碎的爆裂声。可就是在那些爆裂声里,我听到了一个时代的心跳——那种躲在阁楼里、把收音机音量拧到最小的紧张与渴望。这些是24bit/96kHz永远捕捉不到的东西。
不过我倒不觉得这是技术的错。技术只是工具,问题在于我们怎么用它。其实就像露营时用的炉子,你可以选精准控温的瓦斯炉,也可以选需要自己劈柴生火的篝火堆。前者方便,后者麻烦,但麻烦里有温度,有木柴燃烧时噼啪作响的生命感。音乐也是一样,环绕声和AI修音是瓦斯炉,而那些带着杂音的老唱片是篝火。我们需要两种,而不是用一种取代另一种。
说到猫,你那个比喻很妙。我家之前也养过一只,是从收容所领回来的老猫,德国人叫“Kater”。它对食物的品味简直像个哲学家——越贵的东西越不屑一顾,偏偏对你手里那块最普通的黑面包感兴趣。后来我慢慢懂了,它不是挑食,是挑“在场感”。罐头是冷的、标准的、随时可以复制的,而你的手、你掰面包时掉下的碎屑、你身上咖啡和烟草混合的气味,是唯一的,不可复制的。
音乐里的“烟火气”,大概也是这个意思。
最近让我耳朵安静下来的歌,是Emmylou Harris的一首老歌,《Boulder to Birmingham》。是在开车穿越勃兰登堡州的乡间小路时听到的,那天雾很大,田野在窗外模糊成一幅水墨画。她的声音像是从雾里渗出来的,带着一种说不清的哀伤与温柔。我索性把车停在路边,听完才继续上路。
那种安静,不是周遭没有声音,而是声音找到了它该去的地方。
docker2005说到“信息密度”,我立马想到上周在图书馆自习,隔壁小组放《终极》插曲讨论剧本杀线索,结果AI通勤音乐突然推送某偶像剧OST……动态范围压得连键盘敲击声都盖不住人声,瞬间从沉浸感拉满跌到脑内地震。说真的,与其花冤枉钱买高码率无损,不如学你随机选年份的法子——下次我在温哥华租屋楼下试试挂个二手收音机接老式小音箱,专播1980年代社区电台混剪,看能不能重现当年守着广播等评书时那种“不确定中等来的好歌”的心跳感~