我在高通人工智能展会上体验了一下未来生活
人工智能是兵家必争之地,在高通的骁龙移动平台之外,还有苹果A11仿生芯片、华为Kirin970内置的寒武纪NPU等产品。但直到高通5月24日的人工智能创新论坛,人工智能应用生态才算真正意义上开始组建和落地。
论坛的核心部分是骁龙710的发布、高通AI实验室成立以及高通公布与大批AI厂商合作。除了展示对人工智能的景愿和布局外,论坛之后,高通还用了多达9个展区进行了人工智能产品的DEMO展示。
当中涵盖了端侧个人助理、加速算法硬件、骁龙AI手机、AI优化物联网、未来汽车等多个领域。顺着高通的展区规划,就能一路看到高通和它的合作伙伴眼中的人工智能未来。
智能手机AI体验
小米、OPPO、vivo、黑鲨、一加、锤子等大家熟悉的手机厂商,都出现在了高通的产品展示。现场的骁龙845和骁龙660AIE手机上,运行着一些我们或许熟悉但未曾留意到的AI应用。
高通骁龙人工智能平台由Hexagon DSP、Adreno GPU 和 Kryo CPU组成的人工智能引擎(即AIE),其构架可以直接运行商汤科技和旷视Face++的预先训练的神经网络。诸如单摄像头的背景虚化、人脸解锁、情景识别检测等摄像头相关的人工智能应用,很多其实都已经被厂商应用在量产机上了。
例如OPPO R15梦境版等手机中提供AI智慧美颜,能根据人脸特征点、肤色、年龄选择特定的美颜方案,而小米、vivo、OPPO等厂商能在离线非云端的情况下,进行场景和标签识别,然后配合特定场景自动选择优化方案的AI智能场景识别,相信大家都比较熟悉了。
同样是起源于AI物体识别的,现场也展示了2D面部解锁,和之前在OPPO手机上使用的前置单摄像头的AI背景虚化应用。
在论坛中宣布和高通合作的网易有道,则展示了非云端的实景AR翻译功能。在高通的AI Engine(AIE)人工智能引擎,AR实景翻译无需按下快门,而是直接对视频流进行动态跟踪及目标识别,宣称带来了超过10倍的动态最终范围提升,减少运动中70%的无效识别,全面提升了识别准确度。
腾讯手机QQ应用中的“高能舞室”和旷视Face++的Animoji,等AI和AR交融的应用中,则是使用了骁龙人工智能引擎加速帧率,暴力的实时非云端视频流处理,让用户可以和画面中的虚拟物体进行实时的交互。另外也有Elliptic Labs的深度人像和超声波手势操控等看起来很科幻的应用。
高通视觉智能平台
在展区2到展区4,是使用高通骁龙845工程机作为样板的人工智能视觉展示。人工智能视觉主要方向很宽,从简单到复杂,囊括了二维码、手势识别、车辆检测、人脸、人体检测等多种应用,它们被广泛地应用在监控、智能交通、新零售、自然交互等场合。
此前基于深度学习的目标检测技术运算量巨大,无法在嵌入式设备中实际部署。而高通在现场的骁龙845工程机,则使用MobileNet的物体检测神经网络。后者是Google推出的移动端本地神经网络,优点的轻量化、计算消耗小、速度快,因此很适合用于手机或嵌入式视觉应用。
MobileNet的高效模型,其将卷积过程分为3×3深度方向的卷积和1×1点对点的卷积,构建轻量级深度神经网络,可以让移动平台进行实时、非云端的物体检测。
现场的另外一个智能视觉展示,来自于商汤科技的人脸检测和识别。商汤的主业是计算机视觉和深度学习,是中国最大的人工智能算法供应商之一。其智能视觉用途涵盖了人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等领域。
现场的骁龙845工程机运行的端侧智能视觉网络,可以实时对视频流中的人脸进行检测和比对识别。在现场26帧左右的视频流中,3人脸出现的动态负载在50%以下,移动端的AI视觉性能和模型优化已经达到了较高的可用度了。
嵌入式自动浯音识别与纵目主泊车系统
在嵌入式和移动端的语音识别,则是得益于AI的加入而不断提高精度,在不同的噪音环境,不再需要特定人声就能完成精准识别。
AI时代,人机语音交互依旧需要先把语音转为电脑能理解的文字,随后就是三角兽等AI语义理解公司的移动端语音交互、多轮对话等人工智能应用。
而这个自动语音识别,被称为VOICE UI。高通用骁龙845平台展示了终端侧的非云端神经网络,对语音进行的实时识别和自动语音处理。这个和Google百度的语音技术最大的分别是本地性,非云端,在隐私保护、及时响应和随时感知上有巨大的优势。
自动驾驶演示
在智能驾驶这边,则是纵目的主泊车系统。虽然没有自动驾驶那么凶残的性能要求,而自动泊车也是低速的自动驾驶应用,涉及毫米波雷达、障碍物感知、人体识别等多个人工智能领域,当中的重点是低能耗和实时性的嵌入式开发。纵目在上一年末已经使用高通骁龙820A平台,集成了自主泊车系统,宣称系统功耗已经控制在15W以下。而根据现场介绍,搭载骁龙820A的这套系统甚至可以达到低速L4自动驾驶级别。