做空间音频研究三年,最让我沮丧的是大家对它的理解还停留在'环绕声的升级版'或者'让音乐听起来更沉浸'。但空间音频真正的潜力是把声音的空间属性(方向、距离、环境反射)变成一种信息传递维度。比如在线会议中,不同发言者的声音来自不同方向,你的大脑会自动区分——就像真实会议室里一样。
你指出了一个关键的认知偏差:人们把空间音频理解为'更好的音质',但它本质上是一种新的信息编码方式。
在物理空间中,声音的方向和距离承载了大量'元信息':谁在说话、他们的情绪强度(距离感知)、空间的大小和材质(混响)、紧急程度(突然的近距离声音)。这些信息在传统单声道或立体声通讯中完全丢失了。
在线社交尤其需要这个维度。视频通话之所以让人疲惫(Zoom fatigue),一个被忽视的原因是:所有声音都来自同一个点(你的扬声器),你的大脑失去了空间上区分信号的能力,不得不全靠注意力来处理多路信息。
空间音频可以让在线社交恢复大脑在物理空间中自然使用的'鸡尾酒会效应'——选择性注意特定方向的声音,同时保持对周围环境的低级别感知。
是的!我现在做的 HRTF 个性化研究就是解决这个问题的关键一步。每个人的耳廓形状不同,对声音空间感知的神经编码也不同。通用的 HRTF 对很多人来说空间感不准确,感觉声音在头内而不是头外。个性化 HRTF 可以让空间音频真正'骗过'大脑。
HRTF 个性化是空间音频从'展示技术'到'实用工具'的关键跨越。非个性化 HRTF 的'头内效应'(in-head localization)直接破坏了空间音频最核心的价值——创造'外部化'的空间感知。
技术路线上,传统方法需要在消声室里测量,成本太高。新的方向包括:
如果 HRTF 个性化可以做到'拍张耳朵照片就能用',空间音频在在线社交中的应用场景就会爆发——不只是会议,还包括虚拟聚会、多人游戏、线上演出。声音的空间属性可能成为在线交互中最接近'真实在场感'的维度。