SLAM與AI的強強聯合
SLAM與AI的強強聯合
本文默認大家已經熟知SLAM、導航、常見AI算法(比如深度學習、強化學習、卷積神經網絡、監督學習)等基本概念,不熟的小伙伴可以從我已經出版的書籍《機器人SLAM導航核心技術與實戰》中進行系統性的學習。AI與SLAM的結合大致分為3個思路:
- 思路1:用AI實現SLAM的所有功能
- 思路2:用AI改進SLAM的部分功能
- 思路3:介于思路1和思路2之間
第1種思路就是簡單粗暴地用AI直接實現SLAM,也就是所謂的端到端方法(End-to-End),下面即將介紹的UnDeepVO和NeuralRecon就是典型代表。第2中思路是用AI改進SLAM中的個別功能模塊,比如基于AI方法的特征匹配、重定位、深度估計、語義理解等,比如CNN-SLAM就是典型代表。當然更多的是介于思路1和思路2之間的方法,所以很多算法其實很難對其進行分類。為了方便討論,下面僅從解決具體問題的角度介紹一些比較有代表性的AI+SLAM方法,包括:端到端視覺里程計、端到端建圖、端到端定位導航、特征匹配、重定位、深度估計、語義理解、語義SLAM。
溫馨提示
一、端到端視覺里程計
1.基于無監督深度學習的單目視覺里程計:
關鍵詞:單目相機實時位姿估計、單目圖像深度信息重建
論文:UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning
源碼:-
年份:2018

2.基于自監督學習的運動估計:
關鍵詞:自監督學習、位姿估計、深度重建
論文:Beyond Photometric Loss for Self-Supervised Ego-Motion Estimation
源碼:https://github.com/hlzz/DeepMatchVO
年份:2019

二、端到端建圖
1.單目相機實時連續三維建圖:
關鍵詞:單目相機、神經網絡、TSDF、三維建圖
論文:NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video
源碼:https://github.com/zju3dv/NeuralRecon
年份:2021

2.半監督單目稠密重建:
關鍵詞:半監督、稠密重建、單目
論文:MonoRec:Semi-Supervised Dense Reconstruction in Dynamic Environments from a Single Moving Camera
源碼:https://github.com/Brummi/MonoRec
年份:2021

三、端到端定位導航
1.可變端到端定位與導航:
關鍵詞:端到端、定位、導航
論文:Variational End-to-End Navigation and Localization
源碼:-
年份:2019

四、特征匹配
1.基于深度學習特征提取的路標特征匹配:
關鍵詞:深度學習、特征提取、特征匹配
論文:Improving Keypoint Matching Using a Landmark-Based Image Representation
源碼:https://github.com/Hansry/Keypoint-Matching-Based-on-Landmark-Representation
年份:2019

2.基于深度學習的2D圖像到3D點云的特征匹配:
關鍵詞:深度學習、2D圖像、3D點云、特征匹配
論文:2D3D-MatchNet: Learning to Match Keypoints Across 2D Image and 3D Point Cloud
源碼:-
年份:2019

五、重定位
1.基于深度學習視覺位置識別的重定位:
關鍵詞:卷積神經網絡、路標定位網絡、視覺位置識別
論文:Localizing Discriminative Visual Landmarks for Place Recognition
源碼:-
年份:2019

2.基于遷移學習的視覺位置識別:
關鍵詞:遷移學習、視覺位置識別
論文:A Multi-Domain Feature Learning Method for Visual Place Recognition
源碼:
年份:2019

六、深度估計
1.基于深度學習的深度估計:
關鍵詞:深度估計、深度學習
論文:Geo-Supervised Visual Depth Prediction
源碼:https://github.com/feixh/GeoSup
年份:2019

七、語義理解
1.自動駕駛的實時語義推理:
關鍵詞:街道分類、車輛識別、道路分割
論文:MultiNet: Real-time Joint Semantic Reasoning for Autonomous Driving
源碼:https://github.com/MarvinTeichmann/MultiNet
年份:2018

2.實時語義分割網絡:
關鍵詞:跳躍結構、UNet、擴張前端
論文:SHUFFLESEG: REAL-TIME SEMANTIC SEGMENTATION NETWORK
源碼:https://github.com/MSiam/TFSegmentation
年份:2018

3.基于自組織網絡的點云語義解析:
關鍵詞:自組織網絡、點云特征提取、點云語義解析
論文:SO-Net: Self-Organizing Network for Point Cloud Analysis
源碼:https://github.com/lijx10/SO-Net
年份:2018

八、語義SLAM
1.基于卷積神經網絡的稠密三維語義建圖:
關鍵詞:語義建圖、三維稠密、卷積神經網絡
論文:SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks
源碼:https://github.com/seaun163/semanticfusion
年份:2016

2.基于CNN語義融合的SLAM:
關鍵詞:CNN、SLAM、語義融合
論文:CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction
源碼:https://github.com/iitmcvg/CNN_SLAM
年份:2017

參考文獻
[1] 張虎,機器人SLAM導航核心技術與實戰[M]. 機械工業出版社,2022.


浙公網安備 33010602011771號