人工智能语音合成,能否实现真人语感?
2020-05-18 本文已影响0人
小胖妹V5
近日,阿里推出Vlog产品“粗盐”,爱奇艺推出“PAO”。小编不禁感叹,大佬们纷纷布局视频创作平台,都在想些什么?
没错,依旧是老生常谈的话题,5G时代已经来临,视频领域会出现亿级爆发。
视频领域的爆发,会出现4K、8K 、VR等相关技术的更新升级。同样的,与视频所能匹配内容输出的语音产品,也会出现同量增长。
但是对于很多视频创作者来说,文案撰写、拍摄技术、后期制作都是可以靠自身学习进修提升,而视频配音却不是每个创作者能驾驭的。毕竟,文案风格、场景对话、人物设定等,需要不同的音色和语感来匹配。而一期视频制作成本本就很高,大多数视频制作团队便不会选择专业的配音团队支撑。毕竟费用高、周期长、量产难,是阻碍多数视频创作者的主要原因。
在这种情况下,人工智能语音产品并应运而生。
大多数人的刻板印象,人工智能语音就是机械化配音,机器化的发声和语感,在一定程度上会影响文案质量的。
但其实,当下很多人工智能的配音,已经基本还原真人声音和语感了。比如,标贝悦读这款一键文字转语音产品,已实现语句停顿、词组连读,多音字、数字读法修改,背景音添加等多项文字转语音功能。并提供40个角色,满足用户单角色合成、多角色合成等多个场景需求,现已获得数万名老用户认证使用。
标贝悦读
而这些角色的场景,包括小说朗读、新闻播报、 广告配音、搞笑、动画、儿童剧等等。那声音到底如何?我们可以先来看一段使用其中几个声音来做的短视频。
https://yuedu.data-baker.com/index.html?source=jianshu
因此,对于人工智能的配音,能否实现真人语感的问题,只有尝试了才真的清楚。
那么,你愿意尝试一键文字生成语音,助力自己短视频制作吗?