阿里达摩院XR实验室提出新三维定位地图压缩算法

金江
2022-05-20 11:23

5月20日消息,据报道,阿里巴巴达摩院XR实验室提出新的三维定位地图压缩算法,在保证视觉定位精度的前提下将地图压缩250多倍,使之可存储于手机等端侧设备。相关论文被计算机视觉顶会CVPR 2022收录。此外,该实验室持续优化自研三维算法,在建图、定位等核心技术模块屡有创新,多个论文成果先后被国际顶会收录。

据了解,在前人工作基础上,达摩院XR实验室提出新方法SceneSqueezer,将3D地图压缩250倍以上,并使精度损失控制在较小范围,实现模型大小和定位精度的平衡。

format-jpg根据论文SceneSqueezer: Learning to Compress Scene for Camera Relocalization,达摩院团队采用分层策略对3D地图进行压缩,首先利用成对的共可见性信息对数据库图像进行聚类,将场景划分为多个集群分别压缩;其次,基于最终的位姿估计精度,学习选择每个图片的特征点;最后通过特征量化方法压缩特征点的描述。该算法在Cambridge Landmarks、Aachen Day-Night等室外场景数据集上取得了优于既有方法的表现。

达摩院XR实验室高级算法专家董子龙介绍,XR团队自研三维算法体系,在建图、定位等核心技术模块屡有突破,今年已有多篇论文入选顶会。

format-jpg值得一提是,XR实验室是达摩院新近成立的实验室,致力于研究下一代互联网技术,该团队研发的AR、VR技术已落地跨境电商、数字城区等多个场景,如为杭州文三数字生活街区建造1:1还原的三维“数字孪生体”,为杭州奥体中心10万平米地下停车场开发AR导航服务等。

format-jpg

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
11月9日消息,今年双11期间,阿里影业旗下IP交易与创新平台阿里鱼与阿里巴巴达摩院XR实验室合作 ,通过淘宝APP的“IP新势力”首次推出VR技术驱动的虚拟IP场景,建造一座沉浸式虚拟街区。除了淘宝APP内的虚拟街区,手机天猫APP也在双11期间推出3D购物服务,并将3D购物视作天猫APP常态化体验。
1月12日消息,阿里巴巴达摩院发布2023十大科技趋势预测,涵盖人工智能、云计算等领域的前沿科技。达摩院预计,这些技术将加速突破,并于经济和社会方面对各核心产业产生积极影响。其中,备受关注的生成式AI预计将进一步发展,不断拓宽应用边界并将为数字化内容的制作方式带来变革。生成式AI是利用现有文本、图像或音频文件创建新内容的技术。目前,生成式AI通常被用来生成产品原型及初稿,应用场景涵盖游戏、广告、平面设计等。
12月22日消息,阿里云官微披露,12月22日,阿里巴巴达摩院发布新一代语音识别模型Paraformer,这是业界首个应用落地的非自回归端到端语音识别模型。目前,该模型于魔搭社区面向全社会开源,适用语音输入法、智能客服、车载导航、会议纪要等众多场景。
今日,阿里巴巴达摩院发布新型联邦学习框架FederatedScope,该框架支持大规模、高效率的联邦学习异步训练,能兼容不同设备运行环境,且提供丰富功能模块。
1月25日消息,昨日,在 “中国工程院院刊:信息领域青年学术前沿论坛”上,阿里巴巴达摩院、上海浙江大学高等研究院、上海人工智能实验室联合发布“洛犀”端云协同平台。该平台提供一站式的端云协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用大模型应用潜力的新一代人工智能体系。
今日,阿里巴巴达摩院发布2022十大科技趋势,这是达摩院连续第四年发布前沿科技趋势预测。
今天,阿里巴巴达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP。
昨日,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。