Nature封面罕見(jiàn)給了自動(dòng)駕駛!仿真效率2000倍提升,清華自動(dòng)化校友出品 視焦點(diǎn)訊
賈浩楠 發(fā)自 副駕寺智能車參考 | 公眾號(hào) AI4Auto
Nature正刊封面報(bào)道自動(dòng)駕駛重要進(jìn)展。
(相關(guān)資料圖)
證明自動(dòng)駕駛算法的安全可靠,專業(yè)估算仿真里程甚至要超過(guò)千億公英里。
那么,有沒(méi)有在保證可靠性的前提下,大幅降低模擬路測(cè)時(shí)間和成本的方法呢?
最新自動(dòng)駕駛仿真測(cè)試方法,可以將模型迭代效率提升2000倍!
這項(xiàng)研究背后的團(tuán)隊(duì),來(lái)自密歇根大學(xué)的劉向宏教授的實(shí)驗(yàn)室,主要作者清一色華人團(tuán)隊(duì),出自清華大學(xué)自控系。
自動(dòng)駕駛仿真提效2000倍
如今很多無(wú)人車公司都青睞仿真測(cè)試提升系統(tǒng)可靠性。甚至有的創(chuàng)業(yè)公司直接打出“仿真為主,路試為輔”的旗號(hào)。
他們的理由是:仿真測(cè)試效率更高。但沒(méi)說(shuō)的潛臺(tái)詞其實(shí)是:仿真測(cè)試不依賴車隊(duì),成本低。
因?yàn)槟M測(cè)試150億英里的Waymo,至今搞不定可商用落地的無(wú)人駕駛。仿真的效率問(wèn)題是尚未實(shí)現(xiàn)飛躍的巨大挑戰(zhàn),用仿真是因?yàn)槭″X,至于什么時(shí)候能拿出結(jié)果,誰(shuí)也說(shuō)不好。
基于此,這項(xiàng)最新研究提出的觀點(diǎn)是:
而他們基于密集強(qiáng)化學(xué)習(xí)的深度學(xué)習(xí)網(wǎng)絡(luò)D2RL,可以將目前基于NDE(自然駕駛環(huán)境)的仿真模擬效率提升2000倍。
具體來(lái)說(shuō),在雙車道400m場(chǎng)景中,D2RL生成的場(chǎng)景直接跳過(guò)(刪除)傳統(tǒng)仿真過(guò)程中95.7%的事件和99.78%步驟,最大可能給出系統(tǒng)高價(jià)值訓(xùn)練場(chǎng)景。
這樣一來(lái),算法碰撞率達(dá)成同樣的收斂標(biāo)準(zhǔn)下,NDE環(huán)境需要訓(xùn)練1.9X108次,D2RL需要9.1X104次,效率提升2100倍。
而在3車道、更長(zhǎng)距離的實(shí)驗(yàn)中,得出的效率提升效果基本都在2000倍左右。
另外,研究人員將一套開(kāi)源自動(dòng)駕駛算法Autoware23搭載在林肯MKZ上進(jìn)行了4 公里左右的實(shí)際路測(cè),并將實(shí)際道路場(chǎng)景建模,并使用D2RL進(jìn)行模擬。兩條路線分別在156和117次測(cè)試后達(dá)到收斂,而與之相比的是在NDE條件下,達(dá)成相同的標(biāo)準(zhǔn)分別需要2.5×107次和2.1×107次。
同樣效率提升2000倍左右。
也就是說(shuō),使用D2RL網(wǎng)絡(luò)進(jìn)行自動(dòng)駕駛算法的模擬仿真訓(xùn)練,能大大縮短自動(dòng)駕駛的開(kāi)發(fā)周期。
在自動(dòng)駕駛之外,D2RL還可以用在其他AI可靠性驗(yàn)證中,如醫(yī)療機(jī)器人和航空航天系統(tǒng)。
怎么做到的?
從上面的實(shí)驗(yàn)結(jié)果表格中可以看出,D2RL之所以提升效率的主要手段,就是對(duì)系統(tǒng)生成仿真場(chǎng)景的過(guò)程進(jìn)行“提純”,盡量少生成價(jià)值不大的常規(guī)場(chǎng)景,保留高價(jià)值數(shù)據(jù)。
研究團(tuán)隊(duì)認(rèn)為,無(wú)人車仿真系統(tǒng)的效率問(wèn)題,本質(zhì)上是高維空間(多維向量空間)中的一個(gè)罕見(jiàn)事件估計(jì)問(wèn)題。
如何識(shí)別并剔除高維向量空間中非安全關(guān)鍵的點(diǎn),是D2RL的核心任務(wù)。
D2RL是一種密集強(qiáng)化學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò),其基本思想是識(shí)別和去除多向量空間的非安全關(guān)鍵數(shù)據(jù),并保留安全關(guān)鍵數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
由于聲稱場(chǎng)景中只有非常小的一部分?jǐn)?shù)據(jù)是安全關(guān)鍵的,剩余數(shù)據(jù)的信息將被大大地密集化。
D2RL方法的本質(zhì)是刪除非關(guān)鍵狀態(tài),并連接關(guān)鍵狀態(tài)來(lái)重新編輯馬爾科夫決策過(guò)程,然后只對(duì)編輯過(guò)的馬爾科夫過(guò)程進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
因此,對(duì)于任何訓(xùn)練場(chǎng)景,最終的獎(jiǎng)勵(lì)都是沿著編輯過(guò)的馬爾可夫鏈反向傳播的。
直觀地說(shuō),D2RL訓(xùn)練的對(duì)象,是仿真測(cè)試場(chǎng)景中的BV(非自動(dòng)駕駛背景車輛),要求他們?cè)谔囟ǖ臅r(shí)空下執(zhí)行特定的動(dòng)作,與自動(dòng)駕駛車輛(AV)形成對(duì)抗性訓(xùn)練。
獎(jiǎng)勵(lì)函數(shù)為:
其中x表示每個(gè)測(cè)試情節(jié)的變量,IA(x) 是AV碰撞事件的指標(biāo)函數(shù),后兩項(xiàng)則是AV目標(biāo)策略和目標(biāo)行為的重要性函數(shù)。
獎(jiǎng)勵(lì)越高表示測(cè)試環(huán)境越有效。這樣的獎(jiǎng)勵(lì)設(shè)計(jì)是通用的,也適用于其他具有高維變量的罕見(jiàn)事件估計(jì)問(wèn)題。
為了確定學(xué)習(xí)機(jī)制,團(tuán)隊(duì)進(jìn)一步研究了行為策略和目標(biāo)策略之間的關(guān)系。
他們發(fā)現(xiàn)AV的最佳行為政策在訓(xùn)練過(guò)程中收集的數(shù)據(jù)幾乎是與目標(biāo)策略相反。這表明,如果使用傳統(tǒng)強(qiáng)化學(xué)習(xí)中的on-policy策略,AV的目標(biāo)行為策略將偏離最佳。這可能會(huì)誤導(dǎo)訓(xùn)練過(guò)程。
為了解決這個(gè)問(wèn)題,團(tuán)隊(duì)設(shè)計(jì)了一個(gè)off-policy學(xué)習(xí)機(jī)制,即設(shè)計(jì)一個(gè)通用的行為策略,并在訓(xùn)練過(guò)程中保持不變,用來(lái)平衡AV的策略和行為。
最終,D2RL可以在訓(xùn)練過(guò)程中使獎(jiǎng)勵(lì)最大化,有效地提高AV的碰撞率。
作者團(tuán)隊(duì)介紹
本研究的第一作者封碩,目前在美國(guó)密歇根大學(xué)安娜堡分校做博士后。
封碩本科和博士學(xué)位都在清華大學(xué)自動(dòng)化系獲得,研究方向是優(yōu)化控制、互聯(lián)和自動(dòng)駕駛評(píng)估以及交通數(shù)據(jù)分析。
封碩所在的Traffic Lab實(shí)驗(yàn)室,由劉向宏教授領(lǐng)導(dǎo)。
Sun Haowei,密歇根大學(xué)土木與環(huán)境工程專業(yè)在讀博士生,同樣在Traffic Lab實(shí)驗(yàn)室。研究興趣是車聯(lián)網(wǎng)和自動(dòng)駕駛汽車的測(cè)試和評(píng)估。Sun Haowei本科畢業(yè)于清華大學(xué)自動(dòng)化系。
本文通訊作者劉向宏博士現(xiàn)任美國(guó)密歇根大學(xué)土木與環(huán)境工程系終身職正教授、密歇根大學(xué)交通研究所(UMTRI)研究教授,北京航空航天大學(xué)客座教授、兼職博士生導(dǎo)師。
他在國(guó)內(nèi)最被外界熟悉的身份是滴滴前首席科學(xué)家。
劉向宏1993年本科畢業(yè)于清華大學(xué)汽車工程系,2000年在威斯康星大學(xué)麥迪遜分校取得博士學(xué)位。
劉教授是交通工程領(lǐng)域論文引用率最高的學(xué)者之一,他發(fā)明的用于精確測(cè)量交叉路口的排隊(duì)長(zhǎng)度和旅行時(shí)間的SMART-Signal系統(tǒng)于2012年取得美國(guó)國(guó)家專利,并已在美國(guó)明尼蘇達(dá)州和加州得到廣泛應(yīng)用。
原文鏈接:https://www.nature.com/articles/s41586-023-05732-2
如果你有好的研究成果或觀點(diǎn),歡迎來(lái)稿交流:auto@qbitai.com
—聯(lián)系作者—
—完—
【智能車參考】原創(chuàng)內(nèi)容,未經(jīng)賬號(hào)授權(quán),禁止隨意轉(zhuǎn)載。
點(diǎn)這里關(guān)注我,記得標(biāo)星,么么噠~
關(guān)鍵詞:
責(zé)任編輯:孫知兵
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與太平洋財(cái)富網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
如有問(wèn)題,請(qǐng)聯(lián)系我們!
- Nature封面罕見(jiàn)給了自動(dòng)駕駛!仿真效率20002023-03-23
- 網(wǎng)貸辦停息掛賬要注意什么?網(wǎng)貸怎么做停息2023-03-23
- HDEDU聯(lián)合創(chuàng)始人徐梓鐸榮獲2022胡潤(rùn)U30中國(guó)2023-03-23
- 網(wǎng)絡(luò)平臺(tái)停息掛賬最長(zhǎng)可以停多久?停息掛賬2023-03-23
- 一場(chǎng)或?qū)⒏淖內(nèi)蛉怂叩募夹g(shù)革新,正在2023-03-23
- 網(wǎng)貸平臺(tái)拒絕停息掛賬怎么辦?網(wǎng)上幫忙協(xié)商2023-03-23
- 網(wǎng)貸停息掛賬如何提高成功率?網(wǎng)貸逾期了暫2023-03-23
- 網(wǎng)貸停息掛賬申請(qǐng)條件是什么?如何協(xié)商申請(qǐng)2023-03-23
- 恒慧融:投資理財(cái)?shù)淖⒁馐马?xiàng)都有哪些2023-03-23
- 網(wǎng)貸停息掛賬影響多久?網(wǎng)貸逾期了暫時(shí)還不2023-03-23
- 提前還款的條件是什么?先息后本提前還款虧2023-03-23
- 如何辦理提前還款?房貸逾期可以協(xié)商還款嗎2023-03-23
- 提前還款房貸哪種還款方式最劃算?房貸可以2023-03-23
- 網(wǎng)貸逾期要怎么處理?網(wǎng)貸逾期如何正確解決2023-03-23
- 搶抓RCEP發(fā)展機(jī)遇,江蘇外貿(mào)活力持續(xù)釋放2023-03-23
- 網(wǎng)貸停息掛賬的協(xié)商技巧有哪些?網(wǎng)貸如何申2023-03-23
- 甘肅省關(guān)于做好新生兒參加城鄉(xiāng)居民醫(yī)療保險(xiǎn)2023-03-23
- 烏魯木齊市2020年城鄉(xiāng)居民基本養(yǎng)老保險(xiǎn)參保2023-03-23
- 全球新消息丨焦點(diǎn)消息!擬收購(gòu)寶靈化工加碼2023-03-23
- 當(dāng)前短訊!保利發(fā)展擬發(fā)行15億元公司債券,2023-03-23
- 臨沂市關(guān)于實(shí)行住房公積金貸款自主核算相關(guān)2023-03-23
- 【環(huán)球財(cái)經(jīng)】東京股市兩大股指小幅回落2023-03-23
- 世界要聞:美國(guó)證監(jiān)會(huì)將對(duì)孫宇晨提起訴訟 2023-03-23
- 硅業(yè)分會(huì):本周硅片價(jià)格持穩(wěn)運(yùn)行 石英砂保2023-03-23
- 網(wǎng)貸也可以做停息掛賬嗎?網(wǎng)貸突然停止催收2023-03-23
- 女生小說(shuō)網(wǎng)(現(xiàn)今有哪些女生小說(shuō)網(wǎng)?)2023-03-23
- 環(huán)球速訊:網(wǎng)頁(yè)打開(kāi)速度慢(電腦打開(kāi)網(wǎng)頁(yè)慢2023-03-23
- 全球熱訊:中農(nóng)聯(lián)合新設(shè)檢測(cè)科技子公司 含2023-03-23
- 貴常春,經(jīng)得起時(shí)間的考驗(yàn),方可成就醇正口2023-03-23
- 投資不規(guī)范,錢包兩行淚?萬(wàn)洲金業(yè)踐行理財(cái)2023-03-23
精彩推薦
- Nature封面罕見(jiàn)給了自動(dòng)駕駛!仿真效率2...
- 搶抓RCEP發(fā)展機(jī)遇,江蘇外貿(mào)活力持續(xù)釋放
- 韓國(guó)1月新生兒人數(shù)連續(xù)86個(gè)月同比減少
- 英國(guó)2月通脹意外上漲,央行加息可能性增加
- 2023年社保繳費(fèi)檔次六個(gè)檔次是哪些?社...
- 社保是什么意思?個(gè)人如何繳納社保
- 環(huán)球熱資訊!魔方公寓帶“傷”闖關(guān)港股I...
- 環(huán)球信息:072期李白石福彩3D預(yù)測(cè)獎(jiǎng)號(hào):...
- 五險(xiǎn)一金基數(shù)是什么意思?五險(xiǎn)一金的基...
- 2023年朔州市五險(xiǎn)一金繳納基數(shù)和比例是...
- 吉林延邊州:精準(zhǔn)發(fā)力促就業(yè) “春風(fēng)”...
- 濟(jì)南生育津貼一般多久能報(bào)下來(lái)?生育津...
- 靈活就業(yè)交醫(yī)保太虧了是怎么回事?靈活...
- 無(wú)錫喪葬費(fèi)標(biāo)準(zhǔn)是什么?南京喪葬費(fèi)一般...
- 全球速遞!無(wú)敵兌換 開(kāi)心小帥_無(wú)敵兌換空間
閱讀排行
- HDEDU聯(lián)合創(chuàng)始人徐梓鐸榮獲2022...
- 一場(chǎng)或?qū)⒏淖內(nèi)蛉怂叩募夹g(shù)...
- 【環(huán)球財(cái)經(jīng)】東京股市兩大股指小...
- 世界要聞:美國(guó)證監(jiān)會(huì)將對(duì)孫宇晨...
- 硅業(yè)分會(huì):本周硅片價(jià)格持穩(wěn)運(yùn)行...
- 全球熱訊:中農(nóng)聯(lián)合新設(shè)檢測(cè)科技...
- 貴常春,經(jīng)得起時(shí)間的考驗(yàn),方可...
- 守護(hù)最美海岸線,平安志愿者在行...
- 成美品牌定位:為中國(guó)企業(yè)穿越資...
- 華娛眾禾影視與黑河學(xué)院開(kāi)展校企...