三维视觉将成为人工智能的“杀手级应用”-睿象云平台

三维视觉将成为人工智能的“杀手级应用”

本站部分文章、图片属于网络上可搜索到的公开信息，均用于学习和交流用途，不能代表睿象云的观点、立场或意见。我们接受网民的监督，如发现任何违法内容或侵犯了您的权益，请第一时间联系小编邮箱jiasou666@gmail.com 处理。

三维视觉将成为人工智能的“杀手级应用”

三维视觉在强人工智能阶段必将是不可获取的组成部分，是机器智能和企业变革的重要技术。接下来我们就三维视觉的技术方案给做一个系统介绍。

其中三角测距中的非编码方式的方案常见于工业检测领域，这种方案我们暂且不讨论。我们在这一期着重讨论其它几种方式的近距离三维视觉方案。

三角法测距中的采用编码方式的方案业内均定义为结构光方式。结构光法不依赖于物体本身的颜色和纹理，是采用主动投影编码图案（比如散斑、条纹光等）的方法来实现快速鲁棒的匹配特征点，能够获得较高的精度，也大大扩展了适用范围。

苹果iPhone X的“齐刘海”——TrueDepth系统

那是否有方案可以实现高精度的三维数据呢？答案是肯定的。这就是我们接下来要讲的动态结构光的时间编码方案，此种方案的深度相机的原理如下：

它同样由一个摄像机和一个结构光投影仪组成，结构光投影仪向被测物体投射多组明暗相间的光栅图像（随时间可调制），摄像机同时拍摄经被测物体表面调制而变形的多组光栅图像，通过一定算法计算出被测物体的三维数据。

这种动态结构光方案的三维视觉其实在工业界早有应用，主要应用在逆向工程、三维检测、三维建模等领域，这就是传统的三维扫描仪，既然将它称为仪器，也就可想而知其体积通常比较大，价格也很昂贵。

基于MEMS微振镜的深度相机与传统的三维扫描仪最大的区别是结构光投影方式上，三维扫描仪采用DLP、LCOS等进行动态结构光的投影，而此深度相机是采用MEMS微振镜与激光来进行扫描投影。

采用MEMS微振镜的投影方式，不仅克服了体积和成本上的缺点，同时由于这种投影系统是激光扫描式，投影并无光学放大镜头，也就没有焦距的概念，是一个无需调焦的系统（free-focus projector），这也就使得基于MEMS微振镜深度相机的工作范围要比三维扫描仪要大很多。

基于MEMS微振镜的深度相机可以实现亚毫米级，甚至更高的深度精度，相比较同样小体积的散斑静态结构光方案的深度相机，精度提升有至少一个数量级。而相比同样精度的三维扫描仪，其体积小、重量轻、无需调焦等优势特点扩展了高精度三维视觉的应用场景。

以下将结构光的三维视觉方案做一个综合对比：

MEMS深度相机所采集的亚毫米精度数据可以满足三维人脸识别需求，实现真正用三维数据来作为识别判定依据。而非像iPhoneX中三维信息只能用于活体判断，也避免出现如新闻中所报道的母子二人均可解锁iPhone X的情况。

同时这种高精度深度相机所采用的MEMS微振镜尺寸通常只有几个毫米，功耗也只有几十毫瓦，非常适合集成于如智能手机、平板电脑等便携式的设备中，为其增加三维人脸识别、三维扫描建模等功能。目前采用这种技术方案的国内外厂家有Intel的RealSense，知微传感（Zhisensor）的Argus等。

853 2022-12-09

三维视觉将成为人工智能的“杀手级应用”