TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
3D Place Recognition	CS-Campus3D	Minkloc3Dv2	AR@1%	76.68	# 3
3D Place Recognition	CS-Campus3D	Minkloc3Dv2	AR@1	67.06	# 3
3D Place Recognition	CS-Campus3D	Minkloc3Dv2	AR@1% cross-source	83.48	# 3
3D Place Recognition	CS-Campus3D	Minkloc3Dv2	AR@1 cross-source	52.46	# 3
Point Cloud Retrieval	Oxford RobotCar (LiDAR 4096 points)	MinkLoc++ (LiDAR only)	recall@top1%	98.2	# 8
Point Cloud Retrieval	Oxford RobotCar (LiDAR 4096 points)	MinkLoc++ (LiDAR only)	recall@top1	93.9	# 8
Visual Place Recognition	Oxford RobotCar (LiDAR 4096 points+RGB)	MinkLoc++ (LiDAR+RGB)	recall@top1%	99.1	# 1
Visual Place Recognition	Oxford RobotCar (LiDAR 4096 points+RGB)	MinkLoc++ (LiDAR+RGB)	recall@top1	96.7	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/minkloc-lidar-and-monocular-image-fusion-for/visual-place-recognition-on-oxford-robotcar-1)](https://paperswithcode.com/sota/visual-place-recognition-on-oxford-robotcar-1?p=minkloc-lidar-and-monocular-image-fusion-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/minkloc-lidar-and-monocular-image-fusion-for/3d-place-recognition-on-cs-campus3d)](https://paperswithcode.com/sota/3d-place-recognition-on-cs-campus3d?p=minkloc-lidar-and-monocular-image-fusion-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/minkloc-lidar-and-monocular-image-fusion-for/point-cloud-retrieval-on-oxford-robotcar)](https://paperswithcode.com/sota/point-cloud-retrieval-on-oxford-robotcar?p=minkloc-lidar-and-monocular-image-fusion-for)`

MinkLoc++: Lidar and Monocular Image Fusion for Place Recognition

12 Apr 2021 · Jacek Komorowski, Monika Wysoczanska, Tomasz Trzcinski ·

We introduce a discriminative multimodal descriptor based on a pair of sensor readings: a point cloud from a LiDAR and an image from an RGB camera. Our descriptor, named MinkLoc++, can be used for place recognition, re-localization and loop closure purposes in robotics or autonomous vehicles applications. We use late fusion approach, where each modality is processed separately and fused in the final part of the processing pipeline. The proposed method achieves state-of-the-art performance on standard place recognition benchmarks. We also identify dominating modality problem when training a multimodal descriptor. The problem manifests itself when the network focuses on a modality with a larger overfit to the training data. This drives the loss down during the training but leads to suboptimal performance on the evaluation set. In this work we describe how to detect and mitigate such risk when using a deep metric learning approach to train a multimodal neural network. Our code is publicly available on the project website: https://github.com/jac99/MinkLocMultimodal.

PDF Abstract

Code

Add Remove Mark official

jac99/MinkLocMultimodal official

Tasks

Add Remove

3D Place Recognition

Autonomous Vehicles

Metric Learning

Multimodal Deep Learning

Point Cloud Retrieval

Visual Place Recognition

Datasets

KITTI

Oxford RobotCar Dataset CS-Campus3D

Results from the Paper

Edit

Ranked #1 on Visual Place Recognition on Oxford RobotCar (LiDAR 4096 points+RGB)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
3D Place Recognition	CS-Campus3D	Minkloc3Dv2	AR@1%	76.68	# 3	Compare
			AR@1	67.06	# 3	Compare
			AR@1% cross-source	83.48	# 3	Compare
			AR@1 cross-source	52.46	# 3	Compare
Point Cloud Retrieval	Oxford RobotCar (LiDAR 4096 points)	MinkLoc++ (LiDAR only)	recall@top1%	98.2	# 8	Compare
Point Cloud Retrieval	Oxford RobotCar (LiDAR 4096 points)	MinkLoc++ (LiDAR only)	recall@top1	93.9	# 8	Compare
Visual Place Recognition	Oxford RobotCar (LiDAR 4096 points+RGB)	MinkLoc++ (LiDAR+RGB)	recall@top1%	99.1	# 1	Compare
Visual Place Recognition	Oxford RobotCar (LiDAR 4096 points+RGB)	MinkLoc++ (LiDAR+RGB)	recall@top1	96.7	# 1	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

MinkLoc++: Lidar and Monocular Image Fusion for Place Recognition

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove