人工智能语音合成，能否实现真人语感？

2020-05-18 本文已影响0人小胖妹V5

近日，阿里推出Vlog产品“粗盐”，爱奇艺推出“PAO”。小编不禁感叹，大佬们纷纷布局视频创作平台，都在想些什么？

没错，依旧是老生常谈的话题，5G时代已经来临，视频领域会出现亿级爆发。

视频领域的爆发，会出现4K、8K 、VR等相关技术的更新升级。同样的，与视频所能匹配内容输出的语音产品，也会出现同量增长。

但是对于很多视频创作者来说，文案撰写、拍摄技术、后期制作都是可以靠自身学习进修提升，而视频配音却不是每个创作者能驾驭的。毕竟，文案风格、场景对话、人物设定等，需要不同的音色和语感来匹配。而一期视频制作成本本就很高，大多数视频制作团队便不会选择专业的配音团队支撑。毕竟费用高、周期长、量产难，是阻碍多数视频创作者的主要原因。

在这种情况下，人工智能语音产品并应运而生。

大多数人的刻板印象，人工智能语音就是机械化配音，机器化的发声和语感，在一定程度上会影响文案质量的。

但其实，当下很多人工智能的配音，已经基本还原真人声音和语感了。比如，标贝悦读这款一键文字转语音产品，已实现语句停顿、词组连读，多音字、数字读法修改，背景音添加等多项文字转语音功能。并提供40个角色，满足用户单角色合成、多角色合成等多个场景需求，现已获得数万名老用户认证使用。

标贝悦读

而这些角色的场景，包括小说朗读、新闻播报、广告配音、搞笑、动画、儿童剧等等。那声音到底如何？我们可以先来看一段使用其中几个声音来做的短视频。

https://yuedu.data-baker.com/index.html?source=jianshu

因此，对于人工智能的配音，能否实现真人语感的问题，只有尝试了才真的清楚。

那么，你愿意尝试一键文字生成语音，助力自己短视频制作吗？

人工智能语音合成，能否实现真人语感？

猜你喜欢

热点阅读