智能服務機器人正成為行業的風口浪尖,從清掃機器人開始,家庭陪伴機器人、送餐機器人等陸續進入公眾視線。
+ v$ A- i1 G4 J0 F4 I " L) T! `. K1 `% b1 }6 m
在討論這類機器人是否能解決實際問題時,自主定位導航技術作為機器人智能化的第一步正不斷引起行業內的重視。同時,作為自主定位導航技術的重要突破口,SLAM 技術也成為關注焦點。
3 V+ i% A* N t+ T: g5 u, o
正如圖中所示,機器人自主定位導航技術中包括定位、地圖創建與路徑規劃(運動控制),而 SLAM 本身只是完成機器人的定位和地圖創建,二者有所區別。 2 `! g$ E* w9 _' R% }" _
6 S7 w& C, G# J5 S4 r6 L那么,SLAM 技術究竟是如何實現的?它有哪些難點?機器人如何實現自主移動和路徑規劃?到底什么樣的掃地機器人才算智能?
- X* ?/ {- L0 G& t: J+ |! V
這些問題,小編將為你一一解答,帶領大家了解機器人自主移動的秘密。
, \% i) K, G4 k) K2 `6 l
今天,我們先從 SLAM 說起。 : i& v7 M- `3 G, Q" Z0 Y
什么是SLAM技術?
8 X& s0 }$ p: V) y, C' r
SLAM 是同步定位與地圖構建 (Simultaneous Localization And Mapping) 的縮寫,最早由 Hugh Durrant-Whyte 和 John J.Leonard 提出。 ' \- ~8 ?* H N0 I6 ^7 W$ p
其實,SLAM 更像是一個概念而不是一個算法,它本身包含許多步驟,其中的每一個步驟均可以使用不同的算法實現。主要用于解決移動機器人在未知環境中運行時即時定位與地圖構建的問題。
, ]( j# D, S) p! W& R t
當你身處異地,怎么準確找到想去的地方?在戶外迷路時,怎么找到回家的路?沒錯,我們有導航軟件和戶外地圖。
' I6 D F4 Q8 S8 c. B) e* ~9 G
和人類繪制地圖一樣,機器人描述環境、認識環境的過程主要就是依靠地圖。它利用環境地圖來描述其當前環境信息,并隨著使用的算法與傳感器差異采用不同的地圖描述形式。 : ^! G. F7 n$ F# Z' Z
四種常見的地圖表示方法是什么?
, J4 C/ d6 H7 f t
機器人學中地圖的表示方法有四種:柵格地圖、特征地圖、直接表征法以及拓撲地圖。
7 X9 {' B6 W& W% S* T9 ^柵格地圖 / h" t9 I/ A) p& q0 @2 M( K
機器人對環境地圖的描述的方式最常見的為柵格地圖 (Grid map) 或者稱為 Occupancy Map。柵格地圖就是把環境劃分成一系列柵格,其中每一柵格給定一個可能值,表示該柵格被占據的概率。 `. M) ~8 y2 r$ l: t r1 ?+ F$ g0 y4 u
6 l+ C( c6 n5 ^ Y7 `" P
這種地圖看起來和人們所認知的地圖沒什么區別,它最早由 NASA 的 Alberto Elfes 在 1989 年提出,在火星探測車上就用到過,其本質是一張位圖圖片,但其中每個「像素」則表示了實際環境中存在障礙物的概率分布。
# ]9 _. N3 v) L2 Q: g8 u
一般來說,采用激光雷達、深度攝像頭、超聲波傳感器等可以直接測量距離數據的傳感器進行 SLAM 時,可以使用該地圖。這種地圖也可以通過距離測量傳感器、超聲波(早期)、激光雷達(現在)繪制出來。 * c' A8 {/ v9 A _. }3 l+ ]
特征點地圖 ) [6 H3 @. b2 c6 Y' m8 C
特征點地圖,是用有關的幾何特征(如點、直線、面)表示環境,常見于 vSLAM(視覺 SLAM)技術中。
: N d- W9 A2 \# @5 p$ A" v3 `( A" S# l2 b. a- r# v& y
相比柵格地圖,這種地圖看起來就不那么直觀了。它一般通過如 GPS、UWB 以及攝像頭配合稀疏方式的 vSLAM 算法產生,優點是相對數據存儲量和運算量比較小,多見于最早的 SLAM 算法中。
5 H3 U5 T P# a7 i1 Z直接表征法
- @/ {/ f3 C6 l: R! J. Y
直接表征法中,省去了特征或柵格表示這一中間環節,直接用傳感器讀取的數據來構造機器人的位姿空間。
* z5 X( m; Y4 T- I6 Q
4 B6 J1 G* k% i( m
上圖就是直接記錄了屋子內天花板畫面的圖像地圖。這種方法就像衛星地圖一樣,直接將傳感器原始數據通過簡單處理拼接形成地圖,相對來說更加直觀。
, ?) q, [2 h# s. q( _ E拓撲地圖 # z5 |$ I. u: ^( ^
拓撲地圖,是一種相對更加抽象的地圖形式,它把室內環境表示為帶結點和相關連接線的拓撲結構圖,其中結點表示環境中的重要位置點(拐角、門、電梯、樓梯等),邊表示結點間的連接關系,如走廊等。這種方法只記錄所在環境拓撲鏈接關系,這類地圖一般是由前幾類地圖通過相關算法提取得到。 , L" e+ g# W( u# j& |8 C @% D
比如掃地機器人要進行房間清掃的時候,就會建立這樣的拓撲地圖: 1 s1 Y) q$ ]& N, V5 j
小結
0 b7 A* p' u$ k4 u' n
在機器人技術中,SLAM 的地圖構建通常指的是建立與環境幾何一致的地圖。
1 h' F+ |$ O% @7 e
一般算法中建立的拓撲地圖只反映了環境中的各點連接關系,并不能構建幾何一致的地圖,因此,這些拓撲算法不能被用于 SLAM。
9 }+ J2 g- _ Q1 A* j1 Z
直接表征法類似衛星地圖,它是直接使用傳感器(一般是圖像傳感器)構建得到。這種方法的信息冗余度最大,對于數據存儲是很大的挑戰,同時,機器人要從中提取出有用的數據也要耗費一番周折,因此在實際應用中很少使用。 0 K6 S0 J1 P1 P2 g |( U
特征點地圖又是另一個極端,雖然數據量少,但是它往往不能反應所在環境的一些必須的信息,比如環境中障礙物的位置。vSLAM 技術中,多采用這種地圖來解決機器人定位問題。想讓機器人進行自主避障和路徑規劃,還需要額外配置距離傳感器,如激光雷達、超聲波來完成。
' U2 |+ O, J7 n/ Z' I- q
柵格地圖,或者 Occupancy Map(占據地圖)恰好介于其中,一方面它能表示空間環境中的很多特征,機器人可以用它來進行路徑規劃,另一方面,它又不直接記錄傳感器的原始數據,相對實現了空間和時間消耗的最優。因此,柵格地圖是目前機器人所廣泛應用的地圖存儲方式。
$ J/ G$ ^8 G& Q" |
思嵐科技的 SLAMWARE 系統內部也采用這種地圖方式。 ' Z- E4 P/ _5 p% S" U# W3 q
' q, | w$ ]/ n( c7 s
當你打開手機中的導航軟件,在選擇前往目的地的最佳路線之前,首先要做的動作是什么呢?沒錯,就是定位。我們要先知道自己在地圖中的位置,才可以進行后續的路徑規劃。 8 @* ]: ]4 E& Z* J+ G' H
在機器人實時定位問題中,由于通過機器人運動估計得到的機器人位置信息通常具有較大的誤差,我們還需要使用測距單元得到的周圍環境信息更正機器人的位置。 5 M h+ d6 e, n0 F
目前,常見的測距單元包括激光測距、超聲波測距以及圖像測距三種。其中,憑借激光良好的指向性和高度聚焦性,激光雷達已經成為移動機器人的核心傳感器,同時它也是目前最可靠、最穩定的定位技術。 : `6 S4 u: ? j- Z+ ~
自 1988 年被提出以來,SLAM 的理論研究發展十分迅速。在實際應用時,除配備激光雷達外,還需要機器人具有 IMU(慣性測量單元)、里程計來為激光雷達提供輔助數據,這一過程的運算消耗是巨大的,傳統上需要 PC 級別的處理器,這也成為限制 SLAM 廣泛應用的瓶頸之一。
( M7 W. w1 b& w
那么,實現 SLAM 的過程中,都會遇到哪些坑呢? 0 j* L& \9 C/ k# }- D1 d
SLAM 實現過程中的難點有哪些? ; I+ F- v+ d( `3 F
SLAM 主要解決機器人的實時定位與自動建圖問題,那么,在實際應用時,SLAM 究竟是如何實現的呢?在實現過程中有哪些難點? $ n% ^6 H1 ^, j+ s
這是一個完整的 SLAM 和導航系統的主要架構圖: , V# r5 [) f+ n
( S" z* |* g- V- c
其中,SLAM 核心過程包括 3 個步驟,第一步稱為預處理。我們知道,激光雷達和其他雷達設備一樣,某一個時刻只能獲取它所在位置的環境信息。 4 Q( a8 U1 c) l" j4 o6 d& O6 r
這就是我們所說的點云,它只能反映機器人所在環境中的一個部分。第一步預處理就是對激光雷達原始數據進行優化,剔除一些有問題的數據,或者進行濾波。 : S+ \7 e* ^5 _
2 c. \8 H* A0 x" K6 R% E$ c
第二步是匹配,也就是說把當前這一個局部環境的點云數據在已經建立地圖上尋找到對應的位置,這個步驟非常關鍵。
8 u/ T$ Y$ y# C8 }5 V* R
這個是 ICP 的點云匹配算法,用于實現匹配。說這個過程關鍵,就是因為它的好壞,直接影響了 SLAM 構建地圖的精度。這個過程和我們玩拼圖游戲有點類似,就是在已經拼好的畫面中找到相似之處,確定新的一個拼圖該放在哪里。 1 x) M8 w4 } ^4 b, k' q
在 SLAM 過程中,需要將激光雷達當前采集的點云(紅色部分)匹配拼接到原有地圖中。 + g' t& m7 C5 O' l: [) L; o* t4 K
) ~% p0 q6 S4 w5 h
" f* Y. d9 H T如果不進行匹配過程,所構建的地圖可能就亂成一團,變成這樣。 & [ C; T: d* z5 V
+ ~/ F( m, [* g5 }# `5 M; z在這個部分完畢以后,就進行第三步,地圖融合,也就是將這一輪來自激光雷達的新數據拼接到原始地圖當中,最終完成地圖的更新。
* T* V7 Q: G! b }5 m
就像這個圖一樣,這個過程是永遠伴隨 SLAM 過程的。
7 Z* `4 W! u9 n V
) t! N& N* I# S, j數據融合和簡單的貼圖是有很大的差異的。因為實際上傳感器描繪的世界存在一定的誤差,或者正巧在這個時間環境有了變化,例如機器人旁邊闖入了一只小貓。
5 ^. Q. ] p" S X
因此,實際要進行的過程會更加復雜,需要用很多概率算法,并采用濾波的方式進行融合。將上述這個過程逐次執行,就最終產生了我們看到的柵格地圖。 * h+ w! F6 Y2 n) ^$ @
" `& y) D7 ~. l$ O這個過程聽起來其實并不復雜,但是要處理好有很大難度。這里舉幾個例子,比如叫做 Loop Closure(回環)問題。如果匹配算法不足夠優秀,或者環境中存在很不巧的干擾,當機器人繞著環境一圈后,就會發現原本是應該閉合的一個環形走廊斷開了。
( a- }( o2 E0 M) ?
比如正常地圖應該這樣: 5 y6 u2 B6 F I4 O( u
& X( Y' [) L1 Q/ _% m0 H, Q如果處理不好,實際地圖就成這樣:
i% |; x. }2 o: @
! O& ]: R3 U) I5 E( |8 I: d對于環境比較大的場景,回環問題是不得不面對的,但現實總是不完美的,即使是激光雷達這種高精度傳感器,也難免存在誤差。而回環問題的難點恰恰在于在一開始出現少許誤差的時候,并不會被發覺,直到機器人繞著環路一圈,隨著誤差的累加,發現環路已經無法閉合時,此時已經釀成大錯,一般很難回天。 4 j0 E& N: B- M. W8 U
當然這個問題并不是無解,一個好的商用化 SLAM 系統,回環問題是否能很好的解決,就成為評判這個系統實力的指標了。
5 i; k# _+ ]8 D' Z5 E% z
這是前兩天在我們辦公室進行的測試,左邊的視頻是基于開源的 ROS 機器人操作系統進行的地圖構建,右邊的是基于 SLAMWARE 構建的地圖。 3 H! \7 R; ^7 `8 ~; f; k
6 u' a( U# e, V/ l/ Q* D4 _3 d 8 n: M+ E* N: g, H( r0 w
- D$ W) \9 A. ]- J- r1 u當機器人已經繞場一周后,ROS 構建的地圖出現了中斷,而 SLAMWARE 構建的地圖是一個完美的閉環,它與我們辦公室的設計圖完美重合。
) H) J* V6 b1 r7 ?
- l7 S, }+ K. r( G; C! L; L! Z
除了算法層面的回環問題,SLAM 實際應用中還有很多這種坑,比如走廊問題與外界干擾問題。 9 V0 D9 u# S, v" K0 n
以外界干擾問題來說,通常,激光雷達作為機器人的眼睛,一般是安裝在底盤上的,它能看到的視野很有限。當受到外界干擾(人類或者寵物等等)后,機器人很容易丟失定位精度,無法正常完成后續的建圖工作。 3 q0 G7 a, n: }% X. T ^
目前,SLAM 的開源實現代表多為學術界,實際應用有很多 Corner Case 要處理,需要傳感器、系統參數、其他輔助設備的聯合調優。
# v! ~& |( X3 U( M. Q
一般來說,上述的 SLAM 過程對于運算消耗是巨大的,雖然并沒有達到像訓練神經網絡動用服務器集群那種地步,但傳統上需要 PC 級別的處理器。 3 U4 T# x1 V# H& e$ \: g2 T. g( M
除配備激光雷達外,還需要機器人具有 IMU(慣性測量單元)、里程計來為激光雷達提供輔助數據,否則 SLAM 系統也難以得到運行??偟膩碚f,SLAM 算法本身是一個對于外部系統有著多種依賴的算法,這是一個切實的工程問題。 . U6 Q/ }8 O2 {7 e! I1 M
很多機器人,比如掃地機是不可能裝一個 PC 進去的,為了讓 SLAM 能在這類設備里運行,除了解決激光雷達成本外,還要對 SLAM 算法做出很好的優化。
7 S: F' v9 A1 L2 u8 A7 {4 D那么,機器人利用 SLAM 技術得到了有效的空間信息后,它是怎樣實現路徑規劃的?SLAM 和路徑規劃之間關系是怎樣的? - I7 p, U. D- Z, P" L( l
機器人如何實現自主移動和路徑規劃?
6 p8 P7 S, ]5 J+ y9 ~* Q
上面我們已經知道了 SLAM 與路徑規劃的關系。 2 V- z2 K7 B! k0 ?1 T
實際上,SLAM 算法本身只是完成了機器人的定位和地圖構建兩件事情,與我們說的導航定位并不是完全等價的。這里的導航,其實是 SLAM 算法做不了的。它在業內叫做運動規劃 (Motion Planning)。 , j& P$ c2 O& m3 z5 J. f" u
運動規劃是一個很大的概念,從機械臂的運動、到飛行器的飛行,再到這里我們說的掃地機的清掃路徑規劃,都是運動規劃的范疇。
2 P: S4 V, l6 ?2 A
我們先談談針對掃地機這類輪式機器人的運動規劃。這里所需的基礎能力就是路徑規劃,也就是一般在完成 SLAM 后,要進行一個叫做目標點導航的能力。通俗的說,就是規劃一條從 A 點到 B 點的路徑出來,然后讓機器人移動過去。 - m; ] e. u6 u" E0 B* i, L2 h9 R
要實現這個過程,運動規劃要實現至少兩個層次的模塊,一個叫做全局規劃,這個和我們車載導航儀有一點像,它需要在地圖上預先規劃一條線路,也要有當前機器人的位置。這是由我們的 SLAM 系統提供出來的。行業內一般會用叫做 A * 的算法來實現這個過程,它是一種啟發式的搜索算法,非常優秀。它最多的應用,是在游戲中,比如像星際爭霸、魔獸爭霸之類的即時戰略游戲,都是使用這個算法來計算單位的運動軌跡的。
& h6 d1 j6 l/ q$ a1 e
當然,僅僅規劃了路徑還是不夠的,現實中會有很多突發情況,比如正巧有個小孩子擋道了,就需要調整原先的路徑。當然,有時候這種調整并不需要重新計算一遍全局路徑,機器人可能稍微繞一個彎就可以。此時,我們就需要另一個層次的規劃模塊,叫做局部規劃。它可能并不知道機器人最終要去哪,但是對于機器人怎么繞開眼前的障礙物特別在行。
7 L4 B. J8 H2 N這兩個層次的規劃模塊協同工作,機器人就可以很好的實現從 A 點到 B 點的行動了,不過實際工作環境下,上述配置還不夠。比如 A*算法規劃的路徑是根據已知地圖,預先規劃好的,一旦機器人前往目的地的過程中遇到了新的障礙物,就只好完全停下來,等待障礙物離開或者重新規劃路徑了。如果掃地機器人買回家,必須先把屋子都走一遍以后才肯掃地,那用戶體驗就會很差。
0 n% c/ T/ d& L# [" H
為此,也會有針對這類算法的改進,比如 SLAMWARE 內我們采用改良的 D * 算法進行路徑規劃,這也是美國火星探測器采用的核心尋路算法。這是一種動態啟發式路徑搜索算法,它讓機器人在陌生環境中行動自如,在瞬息萬變的環境中游刃有余。
7 p9 q: Q3 m! {- g7 S u( {. q& O
D * 算法的最大優點是不需要預先探明地圖,機器人可以和人一樣,即使在未知環境中,也可以展開行動,隨著機器人不斷探索,路徑也會時刻調整。 - T0 R8 }9 z8 O7 j3 C8 E% B
+ i- Y5 k$ b# ^+ | {2 {* D% t
以上是目前大部分移動機器人都需要的路徑規劃算法,而掃地機器人作為最早出現在消費市場的服務機器人之一,它需要的路徑規劃算法更為復雜。
2 F& z/ f% r9 m; `7 E5 b3 q
一般來說,掃地機需要這么幾個規劃能力:貼邊打掃、折返的工字形清掃以及沒電時候自主充電。單單依靠前面介紹的 D * 這類算法,無法滿足這些基礎需要。 % S$ b+ }# n8 _! y7 ~5 V
掃地機器人還需要有額外的規劃算法,比如針對折返的工字形清掃,有很多問題要處理。掃地機如何最有效進行清掃而不重復清掃?如何讓掃地機和人一樣,理解房間、門、走廊這種概念? 針對這些問題,學術界長久以來有一個專門的研究課題,叫做空間覆蓋(space coverage),同時也提出了非常多的算法和理論。其中,比較有名的是 Morse Decompositions,掃地機通過它實現對空間進行劃分,隨后進行清掃。 - b4 T! o D! Y: j Q! S
20 世紀 70 年代,卡內基梅隴大學(CMU)完全依靠超聲波做到了現在我們掃地機的行為,當然造價也十分昂貴。
) [; L/ r! Z/ Z& n$ U9 |1 r- p
前面介紹的從 A 點到 B 點移動路徑規劃也是實現這類更高級路徑規劃的基礎。實際上,要從 SLAM 實現到掃地機器人所需要的這些功能,還是有非常多的工作要做的。
" W- {& X, L3 s0 d* A) x
/ e6 O: _ j. q* [: z S# d: z% O; E- R- H
|