会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 柯南变声器的算法原理解析!

柯南变声器的算法原理解析

时间:2024-05-02 01:34:31 来源:不龟手药网 作者:知识 阅读:407次

柯南变声器的算法原理解析

柯南昨天上热搜了,柯南今天分享下一个在刑侦破案中非常有用的变声技术—变声器的实现效果

0 1

小时候特别喜欢看柯南,里面有个变声蝴蝶结,算法让我印象深刻。原理变声蝴蝶结的解析作用就是可以把输入的语言转化成其它人的声音。举个例子,柯南如果我有这个语音转换功能,变声下次录歌的算法时候就可以用周杰伦的声音录制(唱功还是自己的
)。


如果要实现变声功能,这里面包含哪些技术点呢,解析首先要提取出语音中的柯南3种表征:

  1. 内容表征:输入语音的具体内容

  2. 声纹表征:可以理解为人的声色,每个人都是变声不同的

  3. 说话风格表征:说话的语气、强弱、算法快慢等风格相关

通过上述分析,原理如何实现变声功能就比较好理解了。解析首先把语音分解为内容表征、声纹表征、说话风格表征3种特征,然后把声纹表征替换成其他人的声纹特征即可实现。


0 2

那么声纹识别如何实现就成了变声功能的关键。先看下声音信号是什么样的:


大家应该在各种k歌工具中都多少了解些声音信号的样子,基本上声音信号就是一堆脉冲。脉冲是一个时序信号数据,很难处理。需要对声音时序信号进行傅里叶转换,才能转换成频谱图(学过通信的同学应该比较好理解,通信专业的我当年碰到傅里叶这3个字就抖),转换效果如下图:


傅里叶转换后的图其实就成了一个与时间无关的图,所以就可以通过深度学习CNN算法去学习规律,对于深度学习有了解的同学应该知道CNN可以快速学习图像中的一些细节差别,其实根本原理跟人脸识别或者文字识别等场景都是一致的,于是就可以基于这种方法实现对于语音信号的声纹的分析和识别。

0 3

上文大概讲了下变声这个功能的大体理论以及声纹识别的算法原理,接下来讲一个适用场景吧,早在14年我在某外资手机巨头做手机软件开发的时候就想到一个场景,通过声纹识别解决骚扰电话。

当时想的方法是这样的:首先通过声纹识别把用户所有有关联的人的声纹pattern都识别出来,存储到手机内。一旦有个电话进来,先不着急接通,而是要求拨电话的人说一句话,这时候马上识别他的声纹与手机中存储的声纹pattern作比对。如果拨电话的人的声纹是一个新声纹,则判定为骚扰电话,拒绝接通~

现在想想,那时候这种通过声纹识别拦截骚扰电话的想法还是挺超前的。好啦,今天就简单分享到这里,谢谢大家,希望能对大家有所帮助~







(责任编辑:休闲)

相关内容
  • 柳岩的不为人知的故事,50亿身家揭秘,惊人经历曝光!
  • “阿里女员工案”二审维持原判:被告人张国因强制猥亵罪被判一年六个月
  • 旅游圣地稻城亚丁,怎么突然不香了?游客坦言: 再也不想去了!
  • 偷一句,去惊艳你的朋友圈
  • 浮沉全本免费阅读,浮沉全文完整版,言情小说笔趣阁
  • 就在此刻,武汉全网爆红!
  • 每日一县——广东省湛江市徐闻县
  • 一场遇见,惊艳了时光,一场相逢,醉美了浮生
推荐内容
  • 三霄娘娘封了什么神 三霄娘娘的官职大不大师傅是谁
  • 别让自己失去灵气,提升灵气的8个方法
  • 你的个人信息就是这样暴露的,还不知道吗?
  • “烟花三月”只会下扬州?快来看这六个免费古镇,每个都媲美乌镇
  • 原创甘肃地震,中国公开感谢20国领导人,第一名普京,却没见美国踪影
  • 谨以此文献给“1970~1979”出生的人,说好了只能看,不许哭啊!