点击空白处退出提示
自动驾驶园区车
我要开发同款作品详情
2.激光雷达目标感知算法移植
2.1在RK3399上完成激光雷达感知算法依赖的PCL和OpenCV库移植工作,验证RK3399作为激光雷达感知算法硬件平台的可行性。
2.2设计和实现激光雷达感知模块多线程框架,将激光雷达点云数据实时解析与代码集成,分析点云目标检测的性能瓶颈。
2.3利用多线程、OpenMP、GPU OpenCL等多种手段进行优化测试,最终基于RK3399硬件平台将激光雷达感知帧率从1fps以下逐渐提升到9.6~9.9fps,延迟降低到100~110ms。
3. 组合定位的嵌入式移植与测试
3.1对组合定位算法的计算复杂度进行了详细分析和测试,整个系统包括6个线程:分别是imu数据接收和解析、激光雷达数据接收、激光雷达数据解析、点云局部地图构建、激光雷达定位、定位融合。
3.2完成点云地图创建算法的优化。点云地图的更新与匹配是算法的瓶颈,首先考虑将该模块进行gpu移植,但是由于数据量非常大,在数据传输上消耗的时间比较多,总的加速效果并不明显。通过进一步分析算法,局部地图并不需要每次重新创建。因此设计了一种新的点云局部地图更新方式,保留第一次N帧点云数据创建的地图,以后每次只对最新帧的点云数据进行运算,然后根据运算结果对地图进行相应的更新,可以比较明显的降低运算量。通过这种方式优化后,该模块的耗时可以保持在100ms左右。
3.3分析激光雷达定位模块的并行性。其中粒子滤波搜索算法的并行度很好,但是内部调用了一些openCV库函数。目前完成了该模块所有函数的C语言改写,包括图像转换、直方图均衡化等。
3.4充分利用TX2嵌入式平台的计算资源,将激光雷达局部建图部分移植到GPU上,并对CUDA代码进行有针对性的优化和测试。该部分时间从原来ARM平台上的220~280ms降低到相对稳定的60~70ms。分析粒子滤波搜索算法的并行性,在ARM平台上利用多线程将耗时从90~150ms降低到70~80ms。将TX2调整到最优性能,算法稳定工作后,实测分析CPU占用率为300%~350%。CUDA核函数blockNum和ThreadNum等参数也已经接近最优值。
4.在公司自研Gemini硬件平台上完成激光雷达感知、组合定位、感知融合、决策规划模块的移植和测试。
5.负责系统底层通信库代码实现和维护。基于UDP组播,采用C语言实现协议无关的通信库函数
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论