综述:激光雷达全景分割的传统点云聚类方法的技术总结-程序员宅基地

技术标签: 聚类  算法  机器学习  计算机视觉  人工智能  

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

bb2f510e5fc909b168074cf157895aee.png

作者丨paopaoslam

来源丨泡泡机器人SLAM

标题:A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR Panoptic Segmentation

作者:Yiming Zhao Xiao Zhang Xinming Huang

来源:ICCV 2021

编译:廖邦彦

摘要

c2880413860920fa8db86f7a4ddca6e5.png

激光雷达全景分割是一项新提出的自动驾驶技术任务。与流行的端到端深度学习解决方案相比,我们提出了一种结合现有用于提取语义信息的语义分割网络的和一种传统的激光雷达点云聚类算法用于分割每个实例对象的混合方法。我们认为,在SemanticKITTI 数据集的全景分割排行榜上,基于几何信息的传统聚类算法相较于所有已发表的端到端深度学习解决方案达到SOTA性能值得考虑。据我们所知,我们是第一个尝试用聚类算法进行点云全景分割。因此,本文对四种典型的聚类方法进行了全面的技术调查,以及其在基准上的性能。这四种聚类方法是最具有代表性的、具有实时运行能力的方法。它们在本文中使用C++实现,然后包装为一个python函数,与现有的深度学习框架无缝集成。我们为同行研究人员开源了代码,代码地址 https://github.com/placeforyiming/ICCVW21-LiDAR-PanopticSegmentation-TradiCV-Survey-of-Point-Cloud-Cluster

7a62500b941cefd8892102f2f4535584.png

主要贡献

f0a9182bb1211c7f24dd41d8595c2949.png

  • 我们提出了一种新的激光雷达全景分割框架。我们首次演示了用语义网络和传统的聚类方法来求解激光雷达全景分割的可行性。此解决方案优于最近发布的所有端到端神经网络解决方案。经典的聚类方法在CPU上以毫秒级运行,减轻了实例部分的标记工作,并有机会更好地适应全新的未训练过的场景,因为它对训练集没有偏好。作为一种传统的方法,它不是一个网络风格的黑盒,因此可以让人们清楚地知道该方法何时表现好或坏。

  • 我们建立了一个激光雷达聚类算法的基准。以往关于激光雷达聚类方法的一个研究问题是,由于存在大的非物体表面,比如墙壁和地面,所以对于这些物体存在评价度量模糊。在这篇文章,我们通过使用具有已发布代码和检查点的语义模型框架来过滤掉所有这些非对象点。因此,聚类算法只会关注属于对象的点。我们进一步使用公认的全景分割的评价指标来直接评估和比较不同聚类方法的有效性。感谢SemanticKITTI数据集和排行榜,未来关于激光雷达聚类主题的研究可以遵循我们的基准作为实际的比较基线。

487eb24646b76c29f19b86ab3cae6e07.png

方法概述

b07ccc137227e0adf2f069371f249f6f.png

Selected Reviewed Methods

现有的点云聚类方法可以被大致总结为四种类型,基于3D欧式空间的方法,使用超栅格或者超点来聚类点云的方法,在深度图上的改进单通道连通域标记方法,和在深度图上的的改进两通道连通域标记方法。在这个方法回顾部分,我们在每种算法中选取最具代表性的算法并且基于更加详细的介绍。

Euclidean Cluster

欧式聚类是一种简单的聚类方法。首先在整个点云上构造kd树,然后将半径阈值内的所有邻点聚类成为一个实例。

97f5707649e2e97a53fd3b6ec6cf88e5.png

Supervoxel Cluster

Supervoxel(SLIC)是一种著名的传统图像处理操作,它将局部像素分组为具有类似特征的更大像素。超体素被设计在RGB-D点云上,相对应于二维图像上的超像素。与超像素相比,超体素有三个主要的差异。第一个是关于初始化的种子点。在超体素中,聚类的种子点是通过三维空间分割得到的,而不是投影的图像平面。第二个区别是一个额外的约束,即在考虑聚类点的迭代聚类算法中,对被占用的体素采取严格的空间连通性约束。第三个是在k-means算法中使用的距离定义。在超体素中,不再考虑二维图像上的距离,而是进一步考虑法向量的角度以及颜色的相似性。请注意,点云库(PCL)中超体素距离的定义与原论文不同。我们选择了原论文在PCL中实现的一种。距离D在下式中定义。空间距离D_s通过种子点的分辨率进行归一化,颜色距离D_c为归一化RGB空间中的欧氏距离,法向距离Dn用于测量表面法向量之间的夹角。w_c、w_s和w_n分别为颜色权重、空间权重和法向权重。341c49e60fb8aaefccda87f0d6f6b848.png

在本文中,我们研究的是没有RGB颜色信息的激光雷达点云,因此我们将所有点的颜色距离D_c设置为零。剩余的迭代k-means算法与二维图像上的超像素SLIC相同。上式的公式能够有效平衡局部法向量和局部欧氏距离的平衡。

Depth Cluster

Depth Cluster算法是激光雷达深度图上的一种快速单通CCL(连通域标记)算法。二进制图像上的CCL算法需要检查两个相邻像素是否都有相同强度。但是,激光雷达深度图上的CCL需要确定两个相邻点是否来自同一对象的条件。在深度聚类算法中,通过使用图中所示的神奇角度β来定义该条件。作者认为,如果β大于一个角度阈值θ,那么点a和点B来自同一个对象。在本文中,我们选择θ=10o作为阈值。

4271628349a51aa1643bbd11ab7ba3cb.png

7d342b3fb64bf7fa5069c88ca3176675.png

Scan-line Run Cluster 

Scan-line Run(SLR)聚类是一种基于点云或深度图的逐行快速扫描算法。该方法是激光雷达深度图上基于图像的双通连通域标记(CCL)算法的对应方法。在SLR中,所有从相同的水平角度发出的点都被识别为一条扫描线。在一条扫描线中,所有更接近阈值Th_run的临近点都被聚类在一起,称为一个run。

一开始,SLR从第一行开始,然后将欧氏距离小于阈值Th_run的所有临近点分组在一起作为一个run。每个run都被分配一个唯一的标签作为初始聚类。接下来,SLR移动到第二行,重复运行分割,并检查第二行中的新run是否符合用新的阈值Th_merge定义的合并条件。如果两个run满足合并条件,则它们将被合并在一起。该标签也将被传递。如果第二行中的新run不符合以前任何运行的合并条件,则将分配一个新的聚类标签。对于这种情况,如果两个集群在一个新的线中相遇,SLR将把它们与较小的聚类标签合并。此过程将保持逐行移动,直到处理完所有激光雷达扫描线。我们在下图中可视化了这个过程。

该算法在下图中进行了总结。其中的查找最近邻函数的目标是在前一个扫描线中搜索最近的点。最初的论文提供了几种查询最近邻的方法。

11eeda342923b1b55237eb38747264f5.png

d4d80b63a055cdb557f244867d13e2e1.png

cc6c965818be96bc035ab7f9ffd315cf.png

实验结果

4cd9c5bfabd0f0017388b8092b844ea7.png

对于传统方法效果比较

4e79d490d327e1dab030c51cebd11f35.png

对于使用Cylinder3D + SLR的方法和其它方法的比较

1b58a4391acc9f969b3ca93a216b79f8.png

对于在SemanticKITTI数据集上使用Scan-line方法的一个可视化

c0ca295023e90d8f8673d7214159ce05.png

最后是作者在其电脑上对于传统方法运算时间的比较

c632b531218b69c5aa39736fc53b818a.png

Abstract

LiDAR panoptic segmentation is a newly proposed technical task for autonomous driving. In contrast to popular end-to-end deep learning solutions, we propose a hybrid method with an existing semantic segmentation network to extract semantic information and a traditional LiDAR point cloud cluster algorithm to split each instance object. We argue geometry-based traditional clustering algorithms are worth being considered by showing a state-of-the-art performance among all published end-to-end deep learning solutions on the panoptic segmentation leaderboard of the SemanticKITTI dataset. To our best knowledge, we are the first to attempt the point cloud panoptic segmentation with clustering algorithms. Therefore, instead of working on new models, we give a comprehensive technical survey in this paper by implementing four typical cluster methods and report their performances on the benchmark. Those four cluster methods are the most representative ones with real-time running speed. They are implemented with C++ in this paper and then wrapped as a python function for seamless integration with the existing deep learning frameworks. We release our code for peer researchers who might be interested in this problem.

如果你对本文感兴趣,想要下载完整文章进行阅读

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

c1cc0a8d163bf845b0d7c2c9e8263105.png

▲长按加微信群或投稿

2e42c2a9dd198d6c40f3ec939a446282.png

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列手眼标定相机标定激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

b79565bc1133d2390261345d3519a4a7.png

 圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Yong_Qi2015/article/details/121059240

智能推荐

while循环&CPU占用率高问题深入分析与解决方案_main函数使用while(1)循环cpu占用99-程序员宅基地

文章浏览阅读3.8k次,点赞9次,收藏28次。直接上一个工作中碰到的问题,另外一个系统开启多线程调用我这边的接口,然后我这边会开启多线程批量查询第三方接口并且返回给调用方。使用的是两三年前别人遗留下来的方法,放到线上后发现确实是可以正常取到结果,但是一旦调用,CPU占用就直接100%(部署环境是win server服务器)。因此查看了下相关的老代码并使用JProfiler查看发现是在某个while循环的时候有问题。具体项目代码就不贴了,类似于下面这段代码。​​​​​​while(flag) {//your code;}这里的flag._main函数使用while(1)循环cpu占用99

【无标题】jetbrains idea shift f6不生效_idea shift +f6快捷键不生效-程序员宅基地

文章浏览阅读347次。idea shift f6 快捷键无效_idea shift +f6快捷键不生效

node.js学习笔记之Node中的核心模块_node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是-程序员宅基地

文章浏览阅读135次。Ecmacript 中没有DOM 和 BOM核心模块Node为JavaScript提供了很多服务器级别,这些API绝大多数都被包装到了一个具名和核心模块中了,例如文件操作的 fs 核心模块 ,http服务构建的http 模块 path 路径操作模块 os 操作系统信息模块// 用来获取机器信息的var os = require('os')// 用来操作路径的var path = require('path')// 获取当前机器的 CPU 信息console.log(os.cpus._node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是

数学建模【SPSS 下载-安装、方差分析与回归分析的SPSS实现(软件概述、方差分析、回归分析)】_化工数学模型数据回归软件-程序员宅基地

文章浏览阅读10w+次,点赞435次,收藏3.4k次。SPSS 22 下载安装过程7.6 方差分析与回归分析的SPSS实现7.6.1 SPSS软件概述1 SPSS版本与安装2 SPSS界面3 SPSS特点4 SPSS数据7.6.2 SPSS与方差分析1 单因素方差分析2 双因素方差分析7.6.3 SPSS与回归分析SPSS回归分析过程牙膏价格问题的回归分析_化工数学模型数据回归软件

利用hutool实现邮件发送功能_hutool发送邮件-程序员宅基地

文章浏览阅读7.5k次。如何利用hutool工具包实现邮件发送功能呢?1、首先引入hutool依赖<dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>5.7.19</version></dependency>2、编写邮件发送工具类package com.pc.c..._hutool发送邮件

docker安装elasticsearch,elasticsearch-head,kibana,ik分词器_docker安装kibana连接elasticsearch并且elasticsearch有密码-程序员宅基地

文章浏览阅读867次,点赞2次,收藏2次。docker安装elasticsearch,elasticsearch-head,kibana,ik分词器安装方式基本有两种,一种是pull的方式,一种是Dockerfile的方式,由于pull的方式pull下来后还需配置许多东西且不便于复用,个人比较喜欢使用Dockerfile的方式所有docker支持的镜像基本都在https://hub.docker.com/docker的官网上能找到合..._docker安装kibana连接elasticsearch并且elasticsearch有密码

随便推点

Python 攻克移动开发失败!_beeware-程序员宅基地

文章浏览阅读1.3w次,点赞57次,收藏92次。整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)近年来,随着机器学习的兴起,有一门编程语言逐渐变得火热——Python。得益于其针对机器学习提供了大量开源框架和第三方模块,内置..._beeware

Swift4.0_Timer 的基本使用_swift timer 暂停-程序员宅基地

文章浏览阅读7.9k次。//// ViewController.swift// Day_10_Timer//// Created by dongqiangfei on 2018/10/15.// Copyright 2018年 飞飞. All rights reserved.//import UIKitclass ViewController: UIViewController { ..._swift timer 暂停

元素三大等待-程序员宅基地

文章浏览阅读986次,点赞2次,收藏2次。1.硬性等待让当前线程暂停执行,应用场景:代码执行速度太快了,但是UI元素没有立马加载出来,造成两者不同步,这时候就可以让代码等待一下,再去执行找元素的动作线程休眠,强制等待 Thread.sleep(long mills)package com.example.demo;import org.junit.jupiter.api.Test;import org.openqa.selenium.By;import org.openqa.selenium.firefox.Firefox.._元素三大等待

Java软件工程师职位分析_java岗位分析-程序员宅基地

文章浏览阅读3k次,点赞4次,收藏14次。Java软件工程师职位分析_java岗位分析

Java:Unreachable code的解决方法_java unreachable code-程序员宅基地

文章浏览阅读2k次。Java:Unreachable code的解决方法_java unreachable code

标签data-*自定义属性值和根据data属性值查找对应标签_如何根据data-*属性获取对应的标签对象-程序员宅基地

文章浏览阅读1w次。1、html中设置标签data-*的值 标题 11111 222222、点击获取当前标签的data-url的值$('dd').on('click', function() { var urlVal = $(this).data('ur_如何根据data-*属性获取对应的标签对象

推荐文章

热门文章

相关标签