2020年人工智能趋势预测:计算机视觉项目将大量落地
计算机视觉项目正在蓬勃发展,为2020年采用率的提高奠定了基础。在过去的几年中,尽管各种形式的人工智能得到了发展,但其中一种形式(计算机视觉)在2020年显示出了特殊的前景。
在《自然》杂志上发表的一项最新研究中,人工智能(AI)系统早在2020年就击败了人类专家。参与该项目的研究人员(包括Google员工以及美国和英国的医学专家)进一步推动了计算机视觉的发展。市场上的计算机视觉应用程序可以完成从扫描放射图像到确定冰箱内容的所有工作。
Zededa生态系统副总裁Jason Shepherd表示,各种计算机视觉项目可能会在2020年扩大。“计算机视觉将成为AI的杀手级应用程序。”
Forrester副总裁兼首席分析师Thomas Husson对今年的消费电子展(CES)上的主要趋势进行了推测时,对计算机视觉感到乐观。 Husson期望在CES上,人们将越来越关注计算机视觉以及增强现实和高级音频技术。
尽管企业采用计算机视觉的速度快于消费者,但计算机视觉也在消费者领域升温。鉴于人脸识别功能现在可以解锁智能手机,因此公众更加接触了该技术。Pinterest等消费类网站已帮助普及了视觉搜索。 Husson说:“与其他技术(例如增强现实或IoT)配对使用时,在上下文中检测对象还将打开新的用例。”
IP摄像头的普及也推动了计算机视觉项目的发展。 IHS Markit的一份报告预测,到2021年,监控摄像头将达到10亿个。此外,摄像头正越来越多地部署在工业部门,自动驾驶汽车,无人机,增强现实等领域。 Shepherd认为,相机“是获得丰富,高带宽信息的最佳传感器之一”。
对于科技公司和学术界的研究人员而言,计算机视觉仍然是一个热门话题。像IBM,亚马逊,中国公司百度和腾讯,微软和谷歌这样的技术巨头,以及许多著名的国际学术机构,都拥有大量的计算机视觉计划。
分析公司也对计算机视觉的前景感到乐观。计算机视觉是2019年Gartner人工智能炒作周期中最成熟的技术之一。Gartner预测AI子行业距离主流采用尚需两到五年,而最近的Forrester New Wave致力于计算机视觉平台计有11个供应商。 Forrester文件还得出结论,计算机视觉平台市场正在“光速”发展。
当然,计算机视觉项目被夸大了,但也有望带来超人的结果。例如,在执法中,配备计算机视觉的监控摄像头理论上可以在数百人中找到通缉的逃犯。
这项技术有可能被用来解决美国和英国等国家放射科医生的短缺。
纽瓦克(Newark)的区域解决方案营销经理Ankur Tomar还指出,计算机视觉技术可以改善工业环境中机器人和检查系统的本地化。如果将计算机视觉与传感器融合一起使用,Tomar预计该技术将具有一系列潜在应用。
“在工业计算机视觉应用中,” Tomar说,“质量控制检查员除了使用组装产品的图片外,还可以使用组装过程中记录的多个传感器的数据来评估其是否合格。”
尽管计算机视觉的采用正在不断扩大,但仍处于初期阶段。计算机视觉的普遍挑战是数据过载。很少有组织能够自动处理大量图像或视频数据。
至少对于监视应用程序而言,广泛采用计算机视觉的另一个障碍是隐私问题。 “与涉及结构化/二进制数据的边缘计算工作负载相比,除了消耗高带宽并利用不同的工具集之外,计算机视觉工作负载的独特之处还在于它们往往引起人们对隐私的最大关注,” Zededa的Shepherd说。
Husson同意,计算机在感知周围环境方面已经有所进步,“因此带来了海量数据和隐私。”
与面部识别有关的隐私问题已受到广泛关注。在2019年,旧金山和加利福尼亚州奥克兰以及马萨诸塞州的三个社区禁止在执法中使用面部识别工具。俄勒冈州波特兰市也计划这样做。
同时,越来越多的政府优先考虑与隐私相关的立法,其中《通用数据保护条例》和《加州消费者隐私法》就是两个突出的例子。
Shepherd说,对监视的计算机视觉的兴趣与日俱增,将导致“致力于确保正确处理PII(个人身份信息),并在根据政策创建数据时删除细节”。
Athena Security是德克萨斯州奥斯汀市的一家初创公司,生产探测安全摄像头系统,它正在使用这种方法。该系统模糊了被摄对象的面孔,并且不使用基于云的存储设备。雅典娜安全局首席执行官丽莎·法尔佐恩(Lisa Falzone)表示,这种方法可以帮助防止或加快对大规模威胁安全事件的反应,而不会侵犯公众的隐私。
Shepherd预测,支持公共利益的数据集共享将有所增加。他认为这种趋势特别相关,“适用于涉及共同模式的用例,例如,识别人员的人口统计资料并识别常见对象(例如汽车,公共汽车,自行车)”。
当前,训练计算机视觉模型通常是耗时且昂贵的。数据模型的商品化可以帮助简化此培训阶段,从而有助于增加各种计算机视觉项目的数量。 “差异化的重点将转移到针对特定环境的编程模型,例如在每个生产的产品都是唯一的工厂中识别质量问题,” Shepherd预测。
值得指出的是,计算机视觉系统的性能和训练数据一样好。正如最近的《麻省理工新闻》的一篇文章所解释的那样,位于偏僻角度且背景不同的常见对象甚至会难倒高级计算机视觉程序。由麻省理工学院和麻省理工学院研究人员等组成的团队正在努力提高遇到非典型图像时此类系统的准确性。 “我们需要更好,更智能的算法,”一位麻省理工学院的研究科学家告诉《麻省理工新闻》。
幸运的是,世界各地的研究人员已经解决了计算机视觉和对抗性机器学习等相关领域的问题,这可以帮助提高此类算法的智能性。
就目前而言,相对简单的计算机视觉用例可能会首先起飞。从长远来看,如果组织可以开发出释放计算机视觉所需的必要数据和隐私成熟度,则它们可以更接近某些人认为的AI:理解和预测环境。
支持计算机视觉与语音识别
Gravitylink推出钛灵AIX是一款集计算机视觉与智能语音交互两大核心功能为一体的人工智能硬件,Model Play是面向全球开发者的AI模型资源平台,内置多样化AI模型,与钛灵AIX结合,基于Google开源神经网络架构及算法,构建自主迁移学习功能,无需写代码,通过选择图片、定义模型和类别名称即可完成AI模型训练。