2022-05-06《当产品经理遇到人工智能》读书笔记09 计算
计算机视觉产品应用
计算机视觉 Computer Vision ,CV 的本质是让计算机具备“看” 的能力。机器视觉通常涉及对图像霍视频的评估,讲摄像机和计算机代替人眼实现对目标的识别,以让机器具备“看”的能力。
1、认识计算机视觉
发展历史
自然视觉能力
是指生物视觉系统体现的视觉能力,是人类重要的能力之一
计算机视觉是一种典型的交叉学科研究领域,包含了生物、心理、物理、工程、数学、计算机科学等领域
基本流程:计算机视觉处理4步骤:图像获取、图像校准、立体匹配和三维重建
图像质量评估
开始训练模型前做好图像质量的评估,很重要。避免出现实际数据和实验室数据相差过大,造成实验室数据训练出来的模型根本无法应用到实际场景中的现象
影响图像质量的因素:光照影响、运动影响、设备影响
2、计算机视觉的主要任务
对象检测
图像分类
目标跟踪
图像分割:图像分割包括语义分割和实例分割
图像描述
3、计算机视觉的产品案例
1)主要应用领域:生物识别、文字识别、图像识别
2)生物识别:包括人脸识别、指纹识别、虹膜识别
人脸识别
目前运用最为广泛的生物识别技术
基于人脸识别的应用包括人脸检测、人脸对比、人脸查找、活体检测等
人脸识别的主要过程:人脸采集、人脸检测、特征提取、匹配识别
指纹识别
虹膜识别
3)文字识别
计算机文字识别,俗称光学字符识别Optical Character Recog,OCR,文字识别是指利用光学技术和计算机技术把印在霍写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式,这是实现文字高速录入的一项关键技术
应用场景:卡片证件识别、手写字体识别
4)图像识别
图像识别分析可以分为动态视频识别分析和静态图片识别分析
5)综合应用案例
运用深度学习描述照片
提高模糊图片的分辨率
神经网络生成告诉摄像头
利用深度学习的读唇程序
机器的艺术创作
4、计算机视觉面临的挑战
1)计算机视觉存在的问题
图像采集设备的局限
场景不可预估
2)人脸识别应用的图像指标
图像大小
图像分辨率
光照环境
模糊程度
遮挡程度
采集角度
3)其他指标
除精确率和召回率以外,还有其他指标需要关注
误报率
速度
数据库架构
阈值的可配置性
输出结果排序
云服务的稳定性