住地下室那五年,隔壁住着一个舞蹈系的学生。每天早上六点半,她会准时开始压腿,那种从齿缝间漏出来的、带着痛楚的吸气声,透过薄薄的隔断墙传过来,比任何舞台上的旋转都更让我记住她。那时候我就隐约觉得,视觉是庙宇,供人瞻仰;声音才是暗室,藏着一个人最真实的轮廓。
所以读到你说莎莎的原声像莫斯科冬夜里温过的红酒,我特别有共鸣。OPPO的柔光可以把人变成一幅画,但画是封闭的,声音却是敞开的。画邀请你凝视,声音却逼迫你共振。当她说出那几句台词时,我听到的不是文案,而是一个常年把身体绷成箭的人,在试图把肌肉的记忆翻译成语言——那种翻译注定是生涩的,因为声带不是她最熟悉的赛场。
你说最美的咏叹调也需要肉体的颤抖来托底,这没错。但我想补充的是,歌剧演员的颤抖是审美的颤抖,是经过计算的“真”;而运动员的颤抖是生存的颤抖,是肺叶在极限之后残余的震颤。这种声音里有一种“反专业”的诗意。配音演员的气息像丝绸,顺滑得没有一丝皱褶;运动员的气息像粗陶,带着窑火和指纹的糙感。我们被太多丝绸包围了,突然摸到一把粗陶,才会在深夜心软。
btw,你提到广告里的原声大抵被修剪过,这恰恰是我觉得最妙的地方。在这个什么都可以精修的时代,我们早就不相信“绝对的真实”了。但就像古画上的虫蛀和裂纹,修剪之后的毛边反而成了一种诚实的暗示——它提醒我们这里曾经有一个活生生的人,而不是一串完美的音轨。我从来不觉得被修饰过的声音就廉价,相反,我们追求的或许从来不是原生态,而是“经过策划的真实”里,那些策划者不小心漏出的马脚。
还有一点让我感触很深。说实话女运动员的身体长期被置于镜头之下,先是被观赏,然后才被认知。柔光、角度、滤镜,这一套视觉语言太擅长把一个人变成客体。但声音不一样。声音是从身体内部发出的,它无法被完全对象化。当莎莎的声线脱离肌肉与赛场被单独聆听…,实际上是她以主体身份重新夺回了对自己身体的解释权。那种温柔不是示弱,而是一个强者在展示她很少被看见的褶皱。
现在我住在温哥华,地下室换成了带窗的公寓,却常常怀念那些隔着墙传来的呼吸声。前几天深夜追完一部仙侠剧,片尾突然插进一段运动员的幕后采访,没有配乐,只有很轻的空调底噪。那个人说着说着突然停住,笑了一下,气息在麦克风里炸开一小朵电流花。literally,那一刻比剧里的任何特效都让我心动。你问有没有被原声击中的时刻?我想,大概就是每一次意识到,原来在“被看见”之外,还有人愿意静静地“被听见”的时候吧。
窗外又在下雨了。
哎你说的这个粗陶和丝绸的比喻,让我突然想起九十年代末我在南方机床厂当技术员那回事。
那时候厂里要做轴承磨损的自动检测模型,我们几个搞应用数学的蹲了仨月,拍了几千张磨损面的高清照,建了个多变量拟合模型,测出来误差总卡在3%以上,怎么调参数都下不去。旁边守了三十年机床的王师傅天天蹲边上看我们忙活,也不说话,每次我们测完一批,他就凑过去开机听十秒,张嘴报的磨损数值误差从来没超过0.5%。
我们当时都觉得他藏了什么祖传秘方,软磨硬泡了半个月,他才叼着烟卷笑,说什么秘方啊,轴承磨薄了一丝,转起来的颤音就多一个小毛刺,眼睛看照片,磨出来的纹路都能抛得差不多,那声音可骗不了人,你再怎么调机器转速,那点抖的频率变不了。
后来我们改了建模思路,特意把之前当成“噪音”过滤掉的高频颤音频段留着,把那些频段的特征值加进模型里,准确率直接拉到了99.2%。之前我们总觉得要把所有“多余”的杂音都去掉才叫精准,闹了半天才明白,那些被当成没用的毛边的东西,才是分辨真假最核心的标记。
你看这跟你说的运动员的声音可不就是一个理?哪怕后期修得再平滑,那点常年大强度训练练出来的呼吸的小毛刺是修不干净的,就跟我们当年那轴承的颤音似的,只要这点东西还在,你就知道这是真家伙,不是批量捏出来的完美样品。
前两年我回厂子里看,王师傅收的小徒弟现在已经是质检组组长了,靠听音断磨损的本事比进口检测仪器还准,厂里给开的工资比三个工程师加起来还高。
隔音差确实折磨人。不过说到声音里地“真”,btw,我刚来澳洲时讲英语结巴,尴尬喘息反而拉近了距离。莎莎这点喘气,比圆滑的配音强太多,反正我听了就觉得踏实