2020年计算机视觉技术5大最新趋势和应用
计算机视觉软件正在改变着行业,使消费者的生活不仅更加轻松,而且更加有趣。作为一个新兴领域,计算机视觉受到了广泛的宣传和相当可观的投资。北美计算机视觉软件市场的总投资额为1.2亿美元,而中国市场激增至39亿美元。让我们看一下使计算机视觉软件开发市场如此快速增长的最有前途和更有趣的技术。
深度学习的进展
深度学习由于其提供准确结果的优势而广受欢迎。尽管传统的机器学习算法可能非常复杂,但它们的核心仍然非常简单。他们的培训需要大量的领域专业知识(这很昂贵),发生错误时需要人工干预,最后,机器学习只擅长于经过培训的任务。
另一方面,深度学习算法通过神经元网络了解当前任务,这些神经元将任务映射为概念层次。每个复杂的概念由一系列更简单的概念定义。所有这些算法都可以自己完成。在计算机视觉的背景下,这意味着先识别明暗区域,然后对线条进行分类,然后再进行形状识别,然后再进行全面的图像识别。
当你向深度学习算法提供更多数据时,它们的性能也会更好,这不是机器学习算法的典型特征。对于计算机视觉来说,这是一个了不起的消息。它不仅允许将更多的图片和视频用于深度学习算法的训练,而且还减轻了与注释和标记数据有关的许多工作。
零售业一直是实施计算机视觉软件的先驱。 ASOS于2017年在其应用程序中添加了按照片搜索选项,此后许多零售商也紧随其后。有些人甚至更进一步,并使用计算机视觉软件将在线和离线体验更紧密地结合在一起。
一家名为Lolli&Pops的美食糖果零售商使用面部识别技术来识别经常逛商店的购物者。因此,商店的员工能够通过提出个性化的产品推荐和偶尔的忠诚度折扣来个性化购物体验。特殊待遇可灌输品牌忠诚度,并将偶尔的购物者转变为普通购物者。两者都对业务有利。
边缘计算的兴起
连接到互联网和云的机器可以从整个网络收集的数据中学习并进行相应调整,从而优化系统性能。但是,连接互联网和云并不总是保证。这就是边缘计算的用武之地。
边缘计算是指附加在物理机器上的技术,例如燃气轮机,喷气发动机或MRI扫描仪。它允许在收集数据的地方进行处理和分析,而不是在云或数据中心中进行处理。边缘计算并不能取代云。它仅允许机器在需要时独自对新的数据洞察采取行动。换句话说,处于边缘的机器可以根据自己的经验进行学习和调整,而与大型网络无关。
边缘计算解决了网络可访问性和延迟的问题。现在,可以将设备放置在网络连接不良或不存在的区域,而不会影响分析结果。此外,边缘计算可以抵消用于数据共享的云计算的使用和维护成本。对于计算机视觉软件,这意味着可以实时做出更好的响应,并且仅将相关的见解移动到云中以进行进一步的分析。此功能对自动驾驶汽车特别有用。
为了安全操作,车辆将需要收集和分析与其周围环境,方向和天气状况有关的大量数据,更不用说与道路上的其他车辆通信了,所有这些都没有延迟。依靠云解决方案来分析数据可能很危险,因为延迟会导致事故。
点云物体识别
点云是最近在对象识别和对象跟踪中更常用的一项技术。 简而言之,点云是在三维坐标系中定义的数据点的集合。此技术通常在空间(例如房间或容器)内使用,其中每个对象的位置和形状由坐标列表(X,Y和Z)表示。 坐标列表称为“点云”。
这项技术可以准确地表示物体在空间中的位置,并且可以准确跟踪任何运动。点云的应用层出不穷。以下仅是一些行业示例,以及这些技术带来的好处:
1)文档:资产监控,施工现场跟踪,恶意破坏检测。
2)分类:城市规划,便于分析的审核工具,必要的公用事业工作图
3)变更检测:资产管理,货物跟踪,自然灾害管理。
4)预测性维护:对资产和基础架构进行持续监控,以预测何时需要维修。
融合现实:增强了VR和AR
如今,任何VR或AR系统都可以创建沉浸式3D环境,但与用户所在的真实环境几乎没有关系。大多数AR设备都可以对环境进行简单的扫描(例如,Google ARCore可以检测平坦的表面以及光线条件的变化),VR系统可以通过头部跟踪,控制器等来检测用户的运动,但是他们的能力就不止于此。
计算机视觉软件正在将VR和AR推进到被称为合并现实(MR)的开发的下一阶段。
借助可绘制环境的外部摄像头和传感器以及眼动追踪解决方案和陀螺仪来定位用户,VR和AR系统能够:
感知环境并引导用户远离障碍物,例如墙壁,物品或其他用户。
检测用户的眼睛和身体移动并相应地采用VR环境。
在室内环境,公共场所,地下等场所提供指导和指示。
五金店Lowe的商店已在使用此商品。每个购物者都可以借用一个AR设备,在其上列出购物清单并获得商店中每个商品的路线。 AR设备实时使用楼层平面图,库存信息和环境地图以提供准确的方向。
语义实例分割
为了了解什么是语义实例分割,我们首先将这一概念分为两部分:语义分割和实例分割。
实例分割在像素级别识别对象轮廓,而语义分割只是将像素分组到特定对象组。让我们用气球图像来说明这两种技术与其他技术的比较。
分类:此图像中有一个气球。
语义分割:所有这些都是气球像素。
物体检测:此图像中的这些位置有7个气球。我们开始考虑重叠的对象。
实例分割:在这些位置有7个气球,它们是每个像素的像素。
如果放在一起,语义和实例分割方法将成为一个强大的工具。该工具不仅可以检测图片中属于对象的所有像素,还可以确定哪些像素属于哪个对象以及对象在图片中的位置。
语义实例分割是用于土地覆盖分类的有用工具,具有多种应用。通过卫星图像进行的土地制图对于政府机构监视森林砍伐(尤其是非法森林砍伐),城市化,交通等方面可能很有用。
许多建筑师事务所还将此类数据用于城市规划和建筑开发。有些人甚至更进一步,将其与AR设备结合使用,以了解其设计在现实生活中的外观。
延伸阅读:钛灵AI市场是由Google AI技术推广伙伴Gravitylink打造的全球化AI算法和解决方案交易市场,致力于帮助来自全球的优秀AI解决方案与需求方建立更加高效的直接连接,加速AI技术在各个领域的落地和应用。
无论是AI开发者,还是IT服务商、硬件设备制造商、集成商,或是新一代各行业AI服务商,入驻钛灵AI市场都将是不错的选择。这里不仅有基于企业需求对接的AI商业平台,更提供了AI产业所需的多维度机器学习模型、算法及硬件商品。基于同Google的合作关系,平台将努力提供更多的企业采购服务,打造一站式AI赋能业务的领先平台。如果团队拥有自主知识产权AI 产品(软硬件均可)及解决方案,均可申请入驻,并获得相关技术资源及商业支持。(更多请关注公众号:钛灵创新)