侵权投诉
搜索
更多>> 热门搜索:
订阅
纠错
加入自媒体

【深度分析】3D成像:行业的再次创新

2017-02-28 01:17
科技那回事
关注

2.2 已实现商用,预计成为2017年顶级品牌手机杀手锏

从技术角度来说,3D成像并不是近年才新出现的。自2009年微软发布基于3D成像的游戏体感交互设备Kinect已经有8年时间,而Google的Project Tango也提出了4年。随着图像处理芯片技术的更新换代,AR需求的不断涌现以及AI大数据技术的风起云涌,进一步坐实了一个事实:3D成像已经过了技术基础期,即将进入长达5年以上的高速成长期。

2.2.1 微软Kinect,体感识别游戏终端

2009年6月2日,微软在东京电玩展上首次发布针对XBOX360的体感周边外围设备Kinect,当时的代号为Project Natal(初生计划)。首日便超过了WII主机的发售数据,之后再以光速超越游戏市场上的所有记录,让微软在北美乃至全球市场都可以扬眉吐气。不仅如此,这样具备着强大潜在实力的技术吸引了多达世界上8成左右的游戏厂商加盟,为后续的游戏产业链奠定了坚实的基础。

Kinect彻底颠覆了以往游戏的人机交互方式,相比对手任天堂Wii依靠游戏杆上的传感器Wii Remote识别用户动作的限制,Kinect不需任何手持设备,能捕捉玩家全身上下的动作,直接用身体来进行游戏,带给玩家“免控制器的游戏与娱乐体验”,也让游戏类型更加丰富。

Kinect V1采用PrimeSense(2013年被苹果收购)结构光方案,硬件上由三个镜头组成,中间的镜头是 RGB 彩色摄像头,用来采集彩色图像。左右两边镜头则分别为红外激光发射器和红外CMOS 摄像头所构成的3D结构光深度感应器,用来采集深度数据(场景中物体到摄像头的距离)。彩色摄像头最大支持640*480分辨率成像,红外摄像头最大支持320*240成像。同时,Kinect V1还搭配了追焦技术,底座马达会随着对焦物体移动跟着转动。Kinect V1也内建阵列式麦克风,由四个麦克风同时收音,比对后消除杂音,并通过其采集声音进行语音识别和声源定位。

PrimeSense的结构光方案,通过Infrared projector发射一副具有三维纵深的“立体”编码近红外激光(光源通过准直镜头和DOE器件形成衍射光斑),再通过接收端的Infrared camera收集经人体反射回来的红外光线。这种光斑具有高度的随机性,而且随着距离的不同会出现不同的图案,也就是说在同一空间中任何两个地方的散斑图案都不相同。只要在空间中打上这样的结构光然后加以记忆就让整个空间都像是被做了标记,然后把一个物体放入这个空间后只需要从物体的散斑图案变化就可以知道这个物体的具体位置。

当然,首先后台需要保存空间标定数据,假设Kinect规定的用户空间是距离电视机的1米到4米范围,每个10cm取一个参考平面,那么标定下来我们就保存了30幅散斑图像,需要进行测量的时候,拍摄一副待测量的散斑图像,作为基准数据信息。将这幅图像和我们保存下来的基准数据信息依次做互相关运算,这样我们会得到30幅相关度图像,而空间中的物体存在的位置,在相关图像上会显示出峰值,把这些缝制一层层叠加在一起,在经过插值运算就会得到整个场景的三维形状了。

2.2.2 Google Project Tango, 全球首款AR智能手机

Tango在谷歌已存在4年时间,2013年初谷歌的ATAP(先进科技与计划)团队就已开始着手相关的研发。Project Tango的技术主要是使用传感器和摄像头来对室内建筑进行3D建模,同时还具备无限宽广的应用场景,包括绘制3D地图,帮助盲人在陌生的地方导航,让人们能利用家中的环境玩拟真的3D游戏等。

2014年2月,Project Tango的原型机亮相,只面对开发者提供首批200台原型机。根据拆机图片,前置摄像头已省去,后置包含4颗镜头,分别是普通的400万像素 RGB摄像头,用于3D成像的红外发射器和红外接收器,以及一颗鱼眼镜头用于动作捕捉。这三颗摄像头模组均由大陆模组厂商舜宇光学提供。

另值得一提的是,硅谷初创公司Movidius(2016年9月被Intel收购)的处理器用于辅助CPU进行图像的运算处理。整机配有一颗容量3000mAh容量的锂电池。

搭载Tango的首款商用机型联想Phab2 Pro于2016年Tech World大会正式发布,价格为499美元,Phab2 Pro尺寸达到了6.4"。同时,配有全金属机身和2.5D盖板玻璃。

由于PrimeSense被苹果收购,Google在Phab 2 Pro改用TOF技术进行3D 成像,设有三种摄像头:最上方一颗是三星的1600万像素RGB CMOS摄像头,用于常规拍照;最下方是OV鱼眼镜头,用于动作捕捉;两者之间则是TOF系统构成,有上方的Princeton提供的IR VCSEL,和下方英飞凌及pmd共同提供的IR Depth sensor。这三颗摄像头模组均由大陆模组厂商舜宇光学提供。

为了提供三维场景,三种摄像头各司其职,并与其它传感器“合作”,以实现以下功能:

(1)运动追踪(Motion Tracking):通过移动设备自带的多种传感器,在不通过外界信号的情况下,实时获取设备的姿态与位置,追踪设备在三维空间中的运动轨迹。Tango创新性地采用了摄像头与惯性测量单位(IMU)结合的方法来实现精确的运动追踪功能。

(2)环境学习(Area Learning):利用视觉信息记录与索引外界环境,自动矫正环境构建与运动追踪中积累的误差,识别重复环境。该功能描述起来很容易,但实施起来则相当的困难,首先设备会对其拍摄的每一帧照片提取特征,然后对出现的特征进行保存和引索,再利用一些高效的储存和搜索算法,实时地判断新的一帧是否跟过去曾经拍摄的环境有相似之处,如果匹配准确的话,设备可以立即利用之前已经收集的环境信息。

(3)深度感知(Depth Perception):利用自带的三维飞行时间摄像头扫描外界三维环境,构筑三维模型,再配合运动追踪,即可告诉设备在空间中的位置,与四周障碍物的距离。

<上一页  1  2  3  4  5  6  下一页>  余下全文
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号