百度AI框架飞桨这个声音克隆的机器人,能模仿你说话

2022-07-03  本文已影响0人  机智客

昨晚上看PaddleSpeech开发群里,他们官方丢出一个音色克隆机器人,加滑稽狗头说限时内测。晚会儿就截止关闭了。测试方法其实是一个借用微信的形式,加好友后,直接发语音就可以聊天。而这个用PaddleSpeech技术的微信机器人,回复你的也是语音,而且是模仿你的声音。

想想看,微信里的对方用和你一模一样的声音和你聊天。是不是有点你和你自己聊天的感觉?而且对方还是另外一个“灵魂”。刚看到这个,机智客觉得挺有趣,于是问了群里,是否可以截屏公开(当然不公开微信信息)。得到肯定后,于是截屏将语音对话过程分享开。

我先打招呼(这里用文字表示),你好,你是男生还是女生呢?然后我听到我的声音回答我:哈哈,我是美女,我是女生,你是男生还是女生呢?于是三十年找不到女朋友的我听着我自己粗犷的声音陷入了沉思。然后我又问你是女生怎么用我男生的声音?于是……这货的回答,简直惨绝人寰,让我唯恐不及。妥妥的妈见打系列。

这个后端是百度飞桨PaddleSpeech的微信机器人,显然比前几年的技术比如Real-Time-Voice-Cloning这样的项目更进一步。它可以说几乎不用你精心准备的5秒以上音频素材,你完全可以像正常聊天一样,问它你好吗今天吃饭了吗,非常简短自然的自然语言。而这个音色克隆机器人,用你的声音回答你问题的时候,也不像RTVC这些老技术一样,需要执行一段时间输出音频。快的时候,给人的感觉更像是,对方听了你的语音停顿了一下再回复你。所以延迟可以接受。

当然刚开始的时候,大概短时间多人申请,有点阻塞了。所以好友申请看似成功,不过并没有响应。当研发盯着后台,将最开始克隆好的信息传输出来后,这才正常可以随便聊。也由于是限时内测,听PaddleSpeech的研发说,这个语音机器人是在他们PM自己的机器上,所以太晚了就下班关机了,运行了几个小时到晚上10点语音机器人就关闭了。

这几年,伴随着AI的不断成熟,语音技术、图像技术的发展还是很快的。感觉,如果以后随着元宇宙到来,数字人进一步成熟普及,你在元宇宙的分身是你的数字人,你在物理世界的分身是你的AI机器人。他们都克隆了你的外貌(当然根据需要你可以调节)特征,克隆了你的声音和性格。你就有了另一个人,千千万万的你。

上一篇下一篇

猜你喜欢

热点阅读