Schalal

localization

OpenStreetMap-based LiDAR Global Localizationin Urban Environment without a Prior LiDAR Map

【略,雷达点云数据比较专业】

OrienterNet: Visual Localization in 2D Public Maps with Neural Matching

人类可以在3D环境中使用2D地图导航,但视觉定位的算法往往依赖于复杂的3D点云数据。本文提出的OrienterNet可以基于人使用的2D地图完成亚米级别的图像定位,检索图像会匹配OSM地图来实现位置和角度定位。影像数据集是12个城市的车、自行车和行人等的多角度图像。代码仓库为: github.com/facebookresearch/OrienterNet。

Introduction

人类可以本能地理解二维地图和真实三维场景的关系,在位置的环境中人类可以通过比较地图和周围环境的地理要素准确地完成定位。但准确的视觉定位算法通常很复杂,因为其依赖于图像匹配且需要详尽的点云数据和视觉描述。在世界尺度上使用雷达或摄影测量构建三维地图成本高昂,且需要更新数据以捕获其视觉变化。三维地图在存储方面代价也更高,因为其比二维地图的组成巨大的多。这对可执行的on-device定位造成阻碍,且需要成本高昂的云存储设施。因此对于大尺度部署的机器人或增强现实设备空间定位成为瓶颈。人与机器在定位范式之间存在的差异于是引出了本研究的问题:如何使机器像人一样从二维地图中定位?

本文首次提出了给定使用的地图,亚米级精度的定位单张图片或者图片序列的方法。设计的平面地图仅对位置、重要物体的粗糙形状进行了编码,不涉及其外观和高度,从而其极其简洁,与三维地图相比其大小减小了一万倍,因此可以存储在设备中。本文使用OSM地图阐述了这些特性,既不需要成本高昂的三维地图,也不需要潜在收集敏感数据。

具体地说,本文算法估计了三自由度姿态,作为在二维地图中校准图片的位置和朝向。此估计是概率的,可以与GPS的先验知识或多视角多图片融合。结果比消费者级别的GPS传感器精准得多,达到了基于特征匹配的传统方法的准确率级别。

OrienterNet是一个深度神经网络,端到端地学习视觉数据和语义数据的匹配,其速度极快且高度可解释。训练单个模型在其他城市中也效果良好,关键之一是训练使用了Mapillary平台的大尺度的多城市训练数据集。

Our experiments show that OrienterNet substantially outperforms previous works on localization in driving scenariosand vastly improves its accuracy in AR use cases when applied to data recorded by Aria glasses. We believe that ourapproach constitutes a significant step towards continuous, large scale, on-device localization for AR and robotics.

difference 多种类型的数据地图比较

精准定位的三种数据源:

Localizing single images in 2D maps

problem formulation:

三姿态问题:$\xi=(x,y,\theta)$,输入$I,\xi_{prior}$,$I$是被校正过的影像,$\xi_{prior}$包括消费者级别的粗定位(误差可以在20米量级)和从OSM检索的区域地图(一系列点线面以及类别的语义信息)。OrientNet包含以下三个模块:

overview

具体而言:

$P$是概率$W\times H\times K$, $K$是常见的旋转角采样数量;$M$是图像-地图匹配得分,最后使用最大的$P$

result

Sequence and multi-camera localization

通过多帧影像联合定位,视角$i$的姿态$\xi_i$未知,从$j$到$i$的相对姿态$\hat\xi_{ij}$已知,则对任意视角$i$,有:

\[P(\xi_{i}|{I_j},map)=\Pi_{k}P(\xi_i\oplus\hat\xi_{ij}|{I_j},map)\]

result 2

Training a single strong model

Experiments

1 1

2 3

Conclusion

limitations:如果环境中缺乏独特的元素或地图中缺乏某些要素,则本方法应用会受限,OSM中也可能在空间上不准确。

conclusion:

OpenStreetSLAM: Global Vehicle Localization Using OpenStreetMaps

Efficient Localisation Using Images and OpenStreetMaps

定位是机器人导航的关键,本文描述了一种基于视觉的定位方法,该方法组合了sequential Monte Carlo Tracking和地面街景图片-2D地图制图匹配机制。

overview