当前位置:首页 > 浙江大学 >

浙江大学:提高基于深度-声音编码的三维声音分辨率

  • 2017年06月30日
  • 50 金币

虚拟三维声音是盲人视觉辅助系统中重要的人机交互方式,它可以将物体的方 位信息通过声音传递给视障用户。为提高三维声音的分辨率,本文提出了一种基于 人工神经网络 (Artificial Neural Network, ANN) 的头相关传递函数 (Head Related  Transfer Function, HRTF) 个性化方法。通过数据预处理和主成分分析 (PCA),提取 了 CIPIC HRTF 数据库中不同被试者在不同方位上的主成分得分矩阵。通过分析被 试者人体测量参数与 HRTF 之间的相关性,筛选出其中对 HRTF 影响较大的人体测 量参数。在 MATLAB 平台上构建一个三层人工神经网络,将人体测量参数及方向 作为输入量,HRTF 主成分得分矩阵作为输出量。以均方误差作为判断训练结果优 劣的标准,从中挑选出一个输出误差最小的神经网络。挑选若干 HRTF 未知的被试 者,收集他们的人体测量参数,将其作为神经网络的输入,得到他们在不同空间方 位上的个性化 HRTF 数据,并与直接使用数据库中 HRTF 的定位效果进行比对。

  • 关注微信

猜你喜欢