嵌牛IT观察

拥有自己idea的输入法

2018-12-27  本文已影响1人  5e7a8ff18ced

姓名:洪丹楠

学号:16020188006

转载自:https://www.zhihu.com/question/68577879/answer/269054447

【嵌牛导读】:现在简直是全民大唱人工智能,看到新闻里说,输入法都用上了人工智能技术,这有什么实际用处吗?是否只是一个吸引眼球的炒作噱头?

【嵌牛鼻子】:人工智能、输入法

【嵌牛提问】:用了“人工智能”和没用“人工智能”的输入法有什么区别?

【嵌牛正文】:

随着技术发展,题主的问题其实是:

“好用的输入法”和“不好用的输入法”之间最大的区别。

估计提问者新闻里看到的输入法+人工智能,指的应该是搜狗吧。搜狗最近在美国IPO上市,确实动静比较大。这几年人工智能技术成为了热门词汇,几乎各行各业都开始绑定AI智能化的宣传,其中不乏一些滥竽充数的家伙,搞一个人工智能的幌子出来忽悠骗钱,为了创新而创新,回头跑得比香港记者都快。

不过,输入法与人工智能相结合的模式,确实有其优势,算不上是炒作噱头,而且对我们这些普通用户很有实用意义。其实以搜狗为例,我们可以从两个部分谈一谈人工智能+输入法的价值吧。

一、对用户的价值:好用

很多人可能觉得,打字无非就是拼音+检索,和人工智能没什么关系。牛逼闪闪的人工智能技术,对于输入法来说无非就是炒作一个概念罢了。

会这样想,那是因为他们不了解输入法的运行机制。

平时我们输入词句时的机制,除了常见词汇,句式外,在遇到一些新鲜词汇,冷门词汇,专业词汇时基本上都是输入法根据云端大数据来进行检索完成的。在不断更新的云端词库的辅助下,用户的输入效率能获得不小的提高。像是最近“打call”一词走红网络,在各大社交平台中异常火爆,自然被迅速收录。原本输入“dacall”后会识别为“大擦来了”的结果,被“打call”这个热门候选词所替代。

然而,仅靠云端热词大数据,只能构成一系列由热词组成的句子,并不足以支撑起我们平时的语句表达,很可能会出现语义不通的情况。尤其是当我们手机遇到网络信号不好、内存已满、云端热词未及时更新等情况时,在线词库的联想辅助功能就无法极致发挥,更加难以体现出云端辅助的价值了。

这种时候,就需要输入法自身具备本地深度学习计算能力,感知用户的输入意图,给予更加准确的文字结果。单纯起到辅助作用的云端力有未逮,LSTM深度学习语言模型就应运而生了。

(LSTM可以让你在断网的飞行模式下,通过前文中的“偶像”一词,依旧号召起小伙伴们一起“打call”)

LSTM,其实就是一种模拟人脑记忆细胞功能的循环神经网络。它通过三个“门”结构,多层次选择神经元传递的记忆特征流。它继承了传统RNN的大部分特性,同时解决了梯度回传过程中的消失和爆炸问题……(听不懂吧?那就对了,否则我还写这文章干啥)

好吧,听起来它确实有点复杂,其实说穿了很简单。

意思就是:传统的N元模型本质是统计模型,只是机械的记忆,远距离及语义泛化都是它的弱项,搜狗通过LSTM技术,能够让输入法后台系统,“看懂”我们输入的文字,去除一些n元统计不能查到的,实际不靠谱的候选。

举个栗子吧。当我们输入“我爷爷的zhizi(zhiyi)”(九宫格键盘94494)的时候,传统的算法可能会结合九宫格键盘的输入路径,直接给出最常用的“之一”一词作为首选。而深度学习语言模型会综合考虑上文,如“我”、“爷爷”等,所以使用iOS 5.0以上版本的新版搜狗输入法打字的结果,会首先展现更优候选词“侄子”而不是“之一”。

同时,在输入系列评测集方面,加入了LSTM深度学习语言模型后,搜狗输入法比之前有了不小的进步。比如说,当我们打字的上下文+输入串中,有“这是、早饭、还是、94664326”等文字出现的前提下,我们再打字输入“zhongdan”(九宫格键盘里,d和f是同一个按键),传统的搜狗输入法会给出网络上流行的热词“中单”,而新版的搜狗输入法会自动判定首选词,将“中单”更改成“中饭”,更加符合前后文的语义,显得十分智能化。

另一方面,LSTM深度学习语言模型,对于输入法的组词评测集也有着显著的提高。所谓组词,就是我们输入了一长串的拼音字母后,系统会自动排列组合后的结果。组词的准确率,关乎着我们平时打字时的效率,一个词一个词自己手动去选择,无疑是最耗费时间的。

一般来说,系统都会根据每个拼音字母所能组成的最热门词汇,来为用户提供候选结果。比如说,当我们想撰写文稿输入“角色的性格设定”时,运用键盘打出的是“juesedexinggesheding’”,传统的输入法只能帮助我们拟定一个大概的范围,给出“绝色的性格设定”或是“觉得的性格设定”等等不太准确的结果,需要我们再对“角色”一词手动调整,而使用搜狗输入法iOS5.0版输入,结果就完全不同了。

其他输入法

搜狗输入法

智能化的输入法之所以好用,体现在了很多细节方面。大家知道,手机屏幕是很小的,在尺寸狭窄的手机键盘上打字时,我们经常会打错。像是和别人说话时搞不清楚对面的意思时,常常反问一句“说什么啊到底”,而一着急却输成了“shuoshenmeadd”。传统输入法难以做对这种简拼且输入串带有英文单词的输入内容,进入了一脸懵逼状态,只能勉强组织语言构成一个“说什么add”的奇葩结果。而使用搜狗输入法iOS5.0版输入,就能给出一个正确的答案。

其他输入法

搜狗输入法

值得一提的是,手机打字时未必都需要把全部字母都一一输出来。比如,我们想要输入一个名为“唐僧的佛法”的句子,有时输成了“tangsengdefof”。面对这一连串并不能组成准确句子的拼音字母,其他的传统输入法会先排列出“唐僧的佛佛”的结果作为第一候选项,而加入了深度学习模型后的新版输入法,就能根据前文语句中的“佛教感”,给出“唐僧的佛法”的首选词,实现“末字简拼”的效果。通过语义理解达成这种句尾汉字的简拼输入,在少输入一个拼音字母时也能识别出准确结果,能够有效的节省了输入代价,提高了我们的打字效率。

其他输入法

搜狗输入法

总的来讲,如果说当年搜狗输入法将搜索技术运用到输入法上,让选词更准,打字更快属于颠覆性的创新话,那么现在将人工智能技术运用到输入法中就是输入法的再一次革命,他不仅仅会提升打字效率,甚至会重新定义输入这件事。未来的输入法,甚至不需要你敲击键盘。

怎么样,是不是相当的因吹斯听?

二、对人工智能发展的价值:基础

根据前文,我们都知道了人工智能技术对于输入法很重要。问题来了,对于人工智能来说,输入法又是它的什么呢?

当然是优乐美啊

想要回答这个问题,先得明白人工智能的概念。

人工智能,是一个让机器自动学习、思考并像人类一样做出判断决策的过程机制。从这个机制的描述中,我们可以看出再高大上的人工智能产品,都需要让机器听得懂人话,才能展开下一步的行为动作。众所周知,中文文本领域博大精深,一贯以灵活性高和难度大著称,折磨死了无数慕名跑来学汉语的国际友人,更别提机器了。一旦人机交互陷入了技术瓶颈,不单单是输入打字时的效率低下,连带着各行各业的AI智能产品都会变得“呆萌、蠢萌”。

比如说,我们家家户户都有智能电视了。可是,有的电视智能化水平太差,用户只能拿着遥控器,累死累活的按键检索找片源。有的电视我们说一声“我想看岳云鹏”,它自动寻找岳云鹏的相关片子并呈现出来,这就是基本的人工智能,而稍微聪明一点的则可以理解更为复杂的含义,比如说“我要看豆瓣评分8分以上的恐怖片”。

再比如,以后的家居一定是智能家居,但是智能家居不可能完全依靠云端的快速计算来接受和处理各种指令,这里面既有安全隐私之类的考虑,也有一旦断网,这些过分依赖云端支持的家电罢工的问题,毕竟,谁也不希望在十几年后家里的常用电器一下子操作体验倒退在现在的水平。所以单机状态下具备人工智能的能力,理解人类通过语言发出的指令需求实在太重要了。

通过上面这看似简单基础的示例,就是我们就知道背后真正考验人工智能走进现实生活的,其实就是输入法在语音识别和语义理解等领域的功底。要知道,各种看上去充满“黑科技”意味的炫酷智能产品,背后都需要依托语义理解来完成人机交互。只有通过深度学习,掌握人类的思维习惯,帮助机器完成更多的行为操作。

其实人工智能最后发展就是和人一样,一方面要通过不断的进化学习实践积累经验,具备各种高级能力,像人类一样一代更比一代强,而且和人类依靠书籍,依靠教育花了成千上万年迭代不同,人工智能依靠大数据,依靠互联网,这个进程会大大缩短,也许只需要100年甚至50年,类人型人工智能就会出现(PS.颤抖吧,人类!)。另一面,人工智能也必须要像人一样,哪怕没有网络支持,,把他放到任何场景,他也能正确的交流,计算,乃至行动,通俗的讲就是具备一个人类“吃喝拉撒,打屁唠嗑”的基本能力,才能真正走进我们普通人的生活。

所以,输入法作为最直接的人机交互端口,掌握着人工智能最为关键的语言部分奥秘,自然是可以称为人工智能领域的基石技术之一。

上一篇下一篇

猜你喜欢

热点阅读