【今日頭條】北京理工大學(xué)龔建偉:多元大數(shù)據(jù)遷移學(xué)習(xí)類人駕駛決策與控制技術(shù)
發(fā)布日期:2017-12-14 供稿:來源:今日頭條 編輯:薛喬丹 審核:王征 閱讀次數(shù):
原文標(biāo)題:北京理工大學(xué)龔建偉:多元大數(shù)據(jù)遷移學(xué)習(xí)類人駕駛決策與控制技術(shù)
非常高興有這么一個機會和大家一起分享,我今天演講的題目是多元大數(shù)據(jù)遷移學(xué)習(xí)類人駕駛決策與控制技術(shù)。那為什么要提多元大數(shù)據(jù)呢?我們前面一直在說個性化的學(xué)習(xí),就是如何利用一些小樣本的數(shù)據(jù)來達(dá)到學(xué)習(xí)效果,之所以一直利用小樣車數(shù)據(jù),這實際上有一個障礙沒有克服,那就是不知道怎么樣如何去利用海量數(shù)據(jù)進行學(xué)習(xí)訓(xùn)練,數(shù)據(jù)量一多也就不知道怎么樣處理了。現(xiàn)在我們的數(shù)據(jù)越來越多了,我們在進行數(shù)據(jù)采集時,單一行駛場景下的少量數(shù)據(jù),我們很快就可以處理下來,用于機器學(xué)習(xí)也可以達(dá)到一定的學(xué)習(xí)效果。但是如果是一臺車跑一天,數(shù)據(jù)量就非常多,那這些數(shù)據(jù)該如何利用,用來進行提升無人駕駛車輛的智能水平,如何進行學(xué)習(xí)訓(xùn)練?
小樣本數(shù)據(jù)學(xué)習(xí),就不可能實現(xiàn)持續(xù)的優(yōu)化學(xué)習(xí),還有可能會造成學(xué)習(xí)的負(fù)遷移,比如剛開始一個駕駛技術(shù)很好的駕駛員數(shù)據(jù)學(xué)習(xí),但是又把一個很差的駕駛員的數(shù)據(jù)放進來的話,這個樣本就可能把前面的訓(xùn)練結(jié)果損壞,那么怎么樣去做這個工作?此外,成百上千個駕駛員,怎么樣去實現(xiàn)自動駕駛智能水平的提升?數(shù)據(jù)如何采集?數(shù)據(jù)如何分類?怎么樣分析這些數(shù)據(jù),這是大量數(shù)據(jù)處理并用于機器學(xué)習(xí)時很關(guān)鍵的一個問題。
下面我結(jié)合一些研究實踐來介紹我們數(shù)據(jù)來源。北京理工大學(xué)機械與車輛學(xué)院車輛系有無人車技術(shù)工業(yè)和信息化的重點實驗室、地面無人機動武器平臺國防科技創(chuàng)新團隊、電動車輛工程實驗室、新能源車輛國家監(jiān)管平臺等,隨著新能源車輛的發(fā)展,結(jié)合無人駕駛車輛領(lǐng)域二十多年的研究積累,我們有條件采集大量駕駛員行為數(shù)據(jù),以后更可以把行駛場景數(shù)據(jù)結(jié)合起來?目前可以得到北京市部分公共交通車輛駕駛行為數(shù)據(jù),再結(jié)合我們團隊自動駕駛測試車輛數(shù)據(jù),具備了進行大量數(shù)據(jù)學(xué)習(xí)研究的基本條件。
將來如果實現(xiàn)5G無線通信,目前這些研究成果就完全可以把道路場景、包括實時檢測結(jié)果都放進來。類人駕駛行為學(xué)習(xí)的整體架構(gòu),也是我們準(zhǔn)備了很長時間的問題,現(xiàn)在從環(huán)境數(shù)據(jù)到交通場景的理解、運動規(guī)劃和車輛狀態(tài)數(shù)據(jù)都能夠結(jié)合起來,一方面進行基于我們前期的研究成果,進行基于模型的學(xué)習(xí);另一方面我們也在嘗試端到端的學(xué)習(xí)方法,但是目前端到端的輸出結(jié)果,還不是確定性的,無法實現(xiàn)預(yù)期的輸出,目前只是做一些簡單的嘗試。
在實現(xiàn)方法上,測試車輛具備自動駕駛能力,能夠感知周圍行駛場景數(shù)據(jù),并把這些數(shù)據(jù)進行在線或離線的分析、提取,同時采集駕駛員操作控制信息,以及車輛狀態(tài)特性數(shù)據(jù)。測試車輛并不一定需要自動駕駛,我們可以讓駕駛員去開車,這樣的話,就可以得到大量的樣本數(shù)據(jù),分析人類駕駛員在各種行駛場景下的行為決策和操縱控制。我們通過數(shù)據(jù)平臺的采集,一直是利用單個駕駛員數(shù)據(jù)來進行學(xué)習(xí),現(xiàn)在正在采集更多的駕駛員的數(shù)據(jù),實現(xiàn)多元大數(shù)據(jù)的機器學(xué)習(xí)。
數(shù)據(jù)來源,一方面我們從大量智能駕駛測試項目開發(fā)工作中采集,另一方面利用實際道路和交通場景,進行有目的的人類駕駛員數(shù)據(jù)采集。可以直接采集,也可以利用網(wǎng)聯(lián)車輛的數(shù)據(jù)。結(jié)合行駛場景,特別是地圖數(shù)據(jù),比如北京市北三環(huán)路段的數(shù)據(jù),還有京承高速的數(shù)據(jù),有了這些地圖數(shù)據(jù)場景加上直接的數(shù)據(jù)來源,也可以做很多的機器學(xué)習(xí)工作。
近期我們完成了一些專線運營場景的示范運行,同時在一些測試試驗場。
自動駕駛系統(tǒng)的構(gòu)成,包括環(huán)境感知、規(guī)劃決策與控制、人機交互、電動線控底盤等子系統(tǒng)。其中有一個很重要的問題,就是車輛如何實現(xiàn)精確定位,而且能夠做到低成本,位置信息結(jié)合周圍環(huán)境數(shù)據(jù),對數(shù)據(jù)的學(xué)習(xí)利用非常重要。
常用導(dǎo)航定位方式有很多,包括標(biāo)線/標(biāo)志、衛(wèi)星導(dǎo)航、航跡推算、地圖導(dǎo)航等。每一種導(dǎo)航定位方式都有自己的優(yōu)缺點。視覺車道線檢測受環(huán)境影響較大、衛(wèi)星定位則容易受到遮擋和多路徑效應(yīng)影響,比如橋洞、隧道、樓群等場景就可能沒有信號,還有航跡推算大部分情形下需要用高精度慣導(dǎo),成本太高,也不是非常合適的定位方式。如果自動駕駛系統(tǒng)的決策規(guī)劃與控制技術(shù)完全依賴高精定位,那就無法實現(xiàn)了。
再就是高精度的地圖,如果不是長期運營,成本也非常大,目前我們可以用數(shù)據(jù)采集的工作,后期處理工作較多,更多是依靠人工處理。同時要進行精定位數(shù)據(jù)我們都要進行定位的工作,還要進行精確的測點,例如用人工每一個點定位五分鐘,就可以得到該點較為精確的坐標(biāo),找?guī)讉€點能夠形成所謂的定位閉環(huán),定位精度可以就高了。
我們之所以要特別強調(diào)定位,因為我們數(shù)據(jù)學(xué)習(xí)對位置高精度的依賴性比較高,較高的位置精度可以充分利用車載傳感器的檢測信息,方便離線處理。最終的方案實現(xiàn)多源信息的綜合定位,充分利用激光雷達(dá)、視覺傳感器等信息,結(jié)合地圖定位,包括矢量地圖、特征地圖和點云地圖,實現(xiàn)低成本的精確定位。
目前關(guān)鍵技術(shù)問題是動態(tài)干擾對定位結(jié)果影響比較大,解決這個問題,有可能形成一套低成本的定位系統(tǒng),目前的高清度衛(wèi)星慣導(dǎo)組合導(dǎo)航定位系統(tǒng)動則五六十萬。
其他交通要素的檢測,包括周圍車輛檢測,目的是對周圍車輛的行為進行分析。樣本數(shù)據(jù)中其他車輛的換道等行為,對本車行為決策結(jié)果是會有影響的。自動駕駛車輛如何和周圍的車輛進行協(xié)作,目前的工作還是比較膚淺的。比如是有人駕駛時候,我們一個手勢就可以做到交互了,但要機器去理解這些情景就非常困難,今后有可能通過車車交互數(shù)據(jù)去實現(xiàn)。
另一個數(shù)據(jù)來源是仿真數(shù)據(jù)。這些仿真數(shù)據(jù)包括超車換道等行為數(shù)據(jù)。仿真數(shù)據(jù)也可以是完全的由軟件來做,目前我們的仿真架構(gòu)和嵌入式的軟件完全是一模一樣的。
道路模型、地圖屬性是環(huán)境模型的重要組成部分,我們在學(xué)習(xí)的樣本里面都是需要用到數(shù)據(jù)模型,包括這些數(shù)據(jù)和環(huán)境檢測識別結(jié)果。還需要結(jié)合車輛網(wǎng)聯(lián)數(shù)據(jù),網(wǎng)聯(lián)信息例如路基的紅綠燈信息通過廣播,自動駕駛車輛得到路口數(shù)據(jù),能夠?qū)崿F(xiàn)自動速度規(guī)劃和避讓,從節(jié)能和交通效率優(yōu)化的角度來進行評價。
在共性優(yōu)化基礎(chǔ)上的個性化,所謂的個性化,我們希望每一臺自動駕駛車輛,能夠?qū)W會每個駕駛員的優(yōu)點,經(jīng)驗和知識越來越豐富。同時能夠適應(yīng)某個駕駛員特定的駕駛風(fēng)格,實現(xiàn)所謂的個性化。
我們現(xiàn)在要實現(xiàn)多個駕駛員在多個場景下的學(xué)習(xí),對這些數(shù)據(jù)的處理,首先是基元建模。提出了一個駕駛基元的概念,我們把所有的數(shù)據(jù)分為一個一個的數(shù)據(jù)基元,可以把各種甚遠(yuǎn)數(shù)據(jù)進行組合,通過組合優(yōu)化,就可以實現(xiàn)其他的場景的遷移。比如說一個道路的環(huán)境,我可以根據(jù)道路的曲率和彎道分幾種基元,通過駕駛員的操控數(shù)據(jù),把基礎(chǔ)的基元利用起來,再把這些基元進行組合,我們就可以進行相應(yīng)的學(xué)習(xí)。這是包括了橫向、轉(zhuǎn)向、縱向的速度可以對應(yīng)起來,再和環(huán)境的數(shù)據(jù)對應(yīng)起來,很多的數(shù)據(jù)都可以進行不同的組合優(yōu)化。
一些非常簡單的場景,也在做端到端的場景輸出,這個還很不靠譜,所以目前我們主要是基于學(xué)習(xí)的模型來做,希望可以做出比較好的水平。
那關(guān)鍵的問題,組合優(yōu)化的算法怎么樣達(dá)到比較好的學(xué)習(xí)效果,怎么樣實現(xiàn)在不同的場景里,有一個度量和遷移的關(guān)系,分層的進行學(xué)習(xí),包括一些端到端的方法進行學(xué)習(xí)、仿真和構(gòu)建。
這是我們整個的基元的提取,到基元的遷移和組合的優(yōu)化,目前已經(jīng)走了兩三年的時間了,這對于整個后續(xù)系統(tǒng)的提升會有很大的幫助和提升。
我今天就先分享這些,謝謝大家!
分享到: