关于语音助手,普通人类想要知道的都在这里了
首先,点开这篇文章看的你,一定是不普通的人类。因为在这个时代使用语音助手,意味着你要有很多好奇心和耐心,去探索并包容新生事物的不足,去相信“未知”一词包含的无限可能性。
没有你坚持不懈地调戏人家,
语音助手就不会变聪明、
未来人工智能就不能顺利统治地球呢!
是的,当前形态的语音助手并不足够好,但它依然是人工智能技术在我们日常生活中最成熟、广泛的应用方式。你可以将语音助手看做是一个住在各种智能设备里的机器人大脑幼体程序,当它进化出判断力和创造力之日,就是人人拥有强大的管家贾维斯之时(也可能是被统治、每晚给语音助手讲恐怖故事:程序猿来了)。
语音助手是什么
语音助手是一种语音控制程序,通过智能设备上的收音硬件,它能听见你的话,进行语义判断,然后在前台迅速做出回应:通过麦克风和你语音聊天,或者听令帮你操控智能设备。
这种黑科技是如何实现的
语音助手被唤醒、听明白、会说话的过程,背后对应的是机器学习(深度神经网络)和数据挖掘算法,以及语音识别、语义理解、语音合成技术,并需要语音知识数据库进行云端支持。
高能预警:这一趴内容打开姿势较为专业~
* 何谓机器学习
拿灵犀语音助手来举例,将科大讯飞公司的讯飞超脑技术作为深度神经网络后,就能不断自我学习了解主人的说话方式和爱好需求,进而给予个性化反馈服务。
* 何谓语音唤醒
通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。全天候黑屏唤醒最早由摩托罗拉在2013年通过硬件优化实现,摩托罗拉重返中国后的第一款手机 moto x通过灵犀语音助手来实现唤醒后的操控(相关视频见文章最尾部)。
* 何谓语音识别和语义理解
声音是一种波,说到底还是信号处理问题。你可以理解为建立一套人和语音助手都懂的编码,语音助手的理解过程,就是通过解码引擎在云端数据库里又快又准找到编码对应的最优内容。
* 何谓语音合成
像指纹一样,每个人也有独特声纹,语音合成就是将真人声纹特征采样、编码,经过连读韵律优化后,将任意文字有表现力得转化成虚拟人声。
世界上第一个使用全息投影技术举办演唱会的虚拟偶像、宇宙第一公主殿下、全二次元维度人类的老朋友——初音未来就是因为使用了这项技术被怀疑假唱的。
人类对人工智能的幻想成真史
各国神话、传说里一早就有工匠创造人形生命的真假故事。中国古代神话中三头六臂的哪吒也可以看作是一例,以莲托生,法力无边。
世界第一部科幻小说,英国诗人雪莱的妻子玛丽·雪莱1818年创作的《弗兰肯斯坦》描述人类试图以科学研究制造智能生命的故事。
1950年,计算机学家阿兰·图灵提出著名的“图灵测试”。如果一台机器与人类(通过电传设备)展开对话不被辨别出身份,就具有智能。
1952年,贝尔实验室研制出首个实用语音识别设备,能识别10个英语数字发音。
1968年,科幻大师克拉克电影《2001太空漫游》中,2001年人类能够制造超级人工智能HAL-9000。其中,HAL在被关机时唱的歌,正是1961年贝尔实验室创造出的、世界上第一首由电脑唱出的歌。
1966年,最早也是最著名的聊天机器人程序Eliza诞生,她被设定为一个精神治疗医师。有趣的是,Siri发布时,Eliza也被再次请出进行对话。当时,Eliza和 Siri 之间年龄相差 45 岁,内存相差 200 万倍。
1976年,美国克雷公司推出了世界上首台运算速度达每秒2.5亿次的超级计算机Cray-1。
1997年,IBM公司的“深蓝”电脑打败了世界国际象棋冠军盖瑞·卡斯帕罗夫。“深蓝”每秒可以计算2亿步。
2004年,日本本田公司研发出先进的人形机器人Asimo。
2011年,IBM研制的超级机器人“沃森”在连续三天的比赛中战胜了“快问快答”节目中最优秀的两名人类选手。后来他们就跑去TED,靠吐槽沃森为生了。
从1952年开始用时半个多世纪,语音识别技术经历了由小词汇量、孤立词的识别到大词汇量、非特定人连续语音识别的飞跃,终于,2011年10月,苹果公司发布搭载了人工智能软件Siri的iPhone 4S手机,语音助手从此被公众所关注。
那些出名要趁早的语音未来们
由于智能语音技术的研发周期长、投入大,行业进入壁垒较高,时至今日,全球范围内技术应用成熟的语音助手并不多。当下认知度较高的语音助手包括:乔布斯家的Siri,谷歌家的Google Now、微软家的Cortana小娜,我国国内也有技术成熟厂家,在中文识别方面甚至更胜国外巨头一筹,如科大讯飞家的灵犀语音助手,以及Robin最近力推的度秘等。
需要区分的是,早年的MSN机器人、小黄鸡Simsimi以及小冰其实属于聊天机器人范畴,而“闲聊”在语音助手的职业生涯里只属于附属功能,后者更注重事务处理和知识服务。
谁是最强的语音助手?
我们可以看到,以上日常能用到的语音助手,出于平台需要、发展战略等原因,它们像人类一样,包装有不同个性和生存技能,但从本质上来说,判断一个语音助手强不强,要看它的大脑模型是否聪明,语音识别率是否准确。这决定了在日常环境中,它是不是一个随时待命、反应迅速、机智体贴的虚拟陪伴者。
假如各具特色但本质相同的语音助手们合体成一个,作为主人的你,一天将是怎样度过?
↓↓↓这盛世如你所愿↓↓↓
有了语音助手,哪些人类职业最先狗带(go die
1. 百事通
讯息爆炸时代,百科知识交给语音助手背后的搜索引擎来记录就好,同时也要警惕知识外包的后果。
2. 秘书助理
个人日程安排交给语音助手来处理,更高效、私密。
3. 毒舌主持人,《奇葩说》嘉宾等
除了不会翻白眼,我们语音助手吐得一手好槽呀!
最后,未来的语音助手究极体是什么形态?
可个性定制,以虚拟+实体形态和主人愉快玩耍。
......放错图了。
必须是个性定制的全能信息处理者,主动判断、预知需求。