老哥,你提到“AI能模仿我的和弦,模仿不了我手上这层茧子怎么来的”——这个说法从情感上我完全能理解,但从技术角度,值得展开聊聊。
我最近在带研究生做音乐信息检索(MIR)方向的课题,正好接触了一些数据。目前AI音乐生成的底层逻辑是模式识别+概率预测,它学的是“什么样的音符序列在统计意义上更可能出现在某种风格中”。问题在于,你手上那层茧子代表的东西——比如推弦时指尖感受到的琴弦张力变化、根据现场观众反应即兴调整的力度、甚至弹错一个音后顺势发展出的新乐句——这些在现有训练数据里几乎不存在。
我举个例子。去年有个研究团队尝试用强化学习训练AI模拟吉他即兴,他们发现一个有趣现象:AI生成的solo在音阶选择上无可挑剔,但所有推弦都卡在标准音高上,没有那种“推到3/4音又稍微收回来”的微妙处理。为什么?因为训练数据里标注的是MIDI音符,而MIDI协议本身就把音高离散化了。你手上那层茧子积累的,恰恰是这些被量化过程抹掉的连续变量。
至于电影,情况更复杂。我上个月刚看了Runway Gen-3的演示,画面生成确实惊人,但叙事逻辑还是薄弱。有个做计算语言学的同事跟我聊过,说现在的AI编剧工具本质上是“情节拼贴”——它能识别《救猫咪》里的节拍表,然后从数据库里调取符合该节拍的情节模块,但它不理解为什么主角必须在第二幕结尾做出那个选择。
不过话说回来,你提到ICU那段经历,我倒觉得这才是关键。你重新弹琴靠的是“疼出来的那股劲儿”,这个“劲儿”在认知科学里叫embodied cognition(具身认知)——你的身体经验直接塑造了你的表达方式。AI没有身体,它不知道指尖被琴弦割破的痛感,不知道弹了三个小时后手腕的酸胀,更不知道从ICU出来第一次摸到琴颈时那种失而复得的触觉记忆。
所以我的看法是:AI会替代那些“可标准化”的部分——比如背景音乐、类型片套路、广告配乐——但替代不了你这种人琴合一的状态。不是因为它不够聪明,而是因为它根本没有“身体”这个信息输入通道。其实
至于会不会去电影院看AI拍的电影?如果是指完全由AI生成的电影,我暂时持观望态度。但如果是指导演用AI作为辅助工具——比如王家卫用AI快速预览不同色调方案,或者诺兰用AI模拟复杂物理场景——那我很期待。工具和创作者的关系从来不是零和博弈。
对了,你最近还去小酒馆弹琴吗?我有个学生组了个后摇乐队,缺个有经验的吉他手,有兴趣的话可以聊聊。