分享到:
场景流算法可同时估计场景中物体的三维位置与三维运动矢量,光流是场景流映射到二维图像坐标系的投影,应用价值广泛。为提升场景流估计精度,我们团队优化了一系列算法模块。首先,基于yolact++网络进行实例分割,从场景中分割出行人、车辆、自行车等前景目标,然后基于最新架构的GANet计算初始视差图,得到更精细的视差图,在使用RAFT网络得到精细光流图,最后通过多阈值融合等策略,进一步优化场景流估计结果。
在测评中,场景流和光流算法的效果和计算结果如下:
▲输入图像
▲T0时刻视差图
▲经光流映射后的T1时刻视差图
▲T1时刻到T0时刻的光流图
▲场景流误差图
该项技术已在华普冠科研发中的双目摄像机、全景摄像机等设备中得到初步测试,提升多目摄像机的目标深度数据计算、目标行为分析等算法性能;同时,该技术也成功应用于AR融合领域,实现单个及多个摄像机图像的AR语义融合应用,极大提升了行业解决方案的用户体验。
双目摄像机行为检测应用场景
▲双目图像图
▲视差图
▲光流图(目标三维运动矢量)
AR语义融合应用场景
▲真实图像
▲AR语义融合,增强目标类别、位置、运动矢量等信息
近年来,在算法商业化落地方面,华普冠科积极应用主导个性化AI方案敏捷交付,构建人工智能端到端研发的全链路能力,实现AI从基础能力到算法研发到产业化应用落地,构建了围绕视图智能、3D智能、多维智能、控制智能等核心算法体系,实现了在各业务领域的人工智能算法、产品与解决方案的全面覆盖,赋能百行百业。
华普冠科面向用户需要开放全栈能力,赋能行业生态,并在实战中持续积累人工智能核心技术,针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的技术挑战,开展实践探索,并已取得实战应用成果。
未来,华普冠科将继续深挖AI技术与各行业场景的深度融合,充分发挥科技创新,推动AI等新一代技术。