您的位置: 首页 - 科普园地

让“蒙娜丽莎”开口说话

发稿时间:2017-04-25    来源:光明网-《光明日报》

  声纹鉴定的秘诀

  我们知道,每个人的发音器官都有小的差异,发音和调音方法也不完全相同。声纹鉴定正是利用人的声音各有特色这一特点,将声音输入声谱仪中,把人声的机械振动变成可见的频谱图像(这种图像就叫声纹)来加以鉴别。声纹犹如指纹各不相同,也可以说是每个人特定的身份证。

  由录音用集成电路存储器和在各频率分析声音的计算机共同构成的声谱仪,能够分析50赫兹至8000赫兹的声音。计算机中分析声音的滤波器有两种,一种是宽带,一种是窄带,能够连续调节。显示装置可以将分析的结果显示在荧光屏上或专用记录纸上。显示的图像称为声纹,其中颜色的深浅表示了声音的强度。

  通常,我们说话与所传达的信息比较,总是带有大量多余的话语。据大脑机械论专家统计,一分钟内一个人所说词句的完整声纹图含有近200万比特,或每秒约35000比特。而普通人大脑里处理信息的速度不超过每秒45比特。换句话说,我们大约只利用了词句声纹图的千分之一,就能懂得其中含义。其余大量多余的话不仅能使我们了解交谈者,还能从成千上万的其他人中辨认出他。

  由于不同的说话人在发同一语音时,产生有相当差别的声纹,这种差别就体现了个人特征,所以声谱仪可以帮助我们分辨出许多人的语言。有时即使言语很模糊,甚至词不达意,也都可以辨明。而声音的这一特征,已经被很多国家用于刑事案件的侦破。

  

  蒙娜丽莎 资料图片

  如何让名人声音“再生”

  人的声音是由振动声带并通过喉咙在口腔或鼻腔共振而发生的,因此,声带的形状或大小以及从喉咙到口腔的容积,成为决定个人声音的主要因素。科学家们认为,若有容颜的形状或身高的数据,借助语言合成器,就有可能惟妙惟肖地模仿出历史人物的声音。

  语言合成器主要由发出一个个单音的发生器、模拟人声道的电子等效电路、模拟鼻腔及口腔的电路等三部分构成。发生器由产生辅音的白噪声发生器和产生元音的三角波发生器组成;模拟人声道的电子等效电路制成尺寸能自由改变的喉咙模型,当输入脸的外形尺寸时,就清晰地显示出那人声音成分中的个人特性。

  在日本科学家开发出的声音发生器PC-6001MKII系统中,至少要输入十二项数据,包括颧骨的宽度,从眼睛下到鼻尖每隔1厘米的大小以及从其下到下巴每隔1厘米的大小,嘴宽,从两眼间中心到嘴的位置,鼻尖和枕骨部每隔1厘米的大小,身高、年龄、性别等。如果数据不足,也可设定最相近的值补充。

  “蒙娜丽莎”和达·芬奇的声音都是这样合成的——科学家们通过肖像画或照片推测求得最合适的数据。然而,“蒙娜丽莎”脸型的尺寸光靠这张神秘的微笑画像是不够的。所幸,在意大利米兰还保存着达·芬奇所画的“蒙娜丽莎”的侧面素描,将这两张画像测得的数据合在一起才做出“蒙娜丽莎”脸的立体模型。

  人们对这项研究还有很多疑问,但大家更期待仪器能不断改进,让我们听到更多历史人物的声音。