首頁 > 金融 > 產(chǎn)經(jīng)資訊 > 正文

Nature封面罕見給了自動駕駛！仿真效率2000倍提升，清華自動化校友出品視焦點(diǎn)訊

2023-03-23 15:09:30來源：面包芯語

賈浩楠發(fā)自副駕寺智能車參考 | 公眾號 AI4Auto

Nature正刊封面報(bào)道自動駕駛重要進(jìn)展。

(相關(guān)資料圖)

證明自動駕駛算法的安全可靠，專業(yè)估算仿真里程甚至要超過千億公英里。

那么，有沒有在保證可靠性的前提下，大幅降低模擬路測時間和成本的方法呢？

最新自動駕駛仿真測試方法，可以將模型迭代效率提升2000倍！

這項(xiàng)研究背后的團(tuán)隊(duì)，來自密歇根大學(xué)的劉向宏教授的實(shí)驗(yàn)室，主要作者清一色華人團(tuán)隊(duì)，出自清華大學(xué)自控系。

自動駕駛仿真提效2000倍

如今很多無人車公司都青睞仿真測試提升系統(tǒng)可靠性。甚至有的創(chuàng)業(yè)公司直接打出“仿真為主，路試為輔”的旗號。

他們的理由是：仿真測試效率更高。但沒說的潛臺詞其實(shí)是：仿真測試不依賴車隊(duì)，成本低。

因?yàn)槟M測試150億英里的Waymo，至今搞不定可商用落地的無人駕駛。仿真的效率問題是尚未實(shí)現(xiàn)飛躍的巨大挑戰(zhàn)，用仿真是因?yàn)槭″X，至于什么時候能拿出結(jié)果，誰也說不好。

基于此，這項(xiàng)最新研究提出的觀點(diǎn)是：

而他們基于密集強(qiáng)化學(xué)習(xí)的深度學(xué)習(xí)網(wǎng)絡(luò)D2RL，可以將目前基于NDE（自然駕駛環(huán)境）的仿真模擬效率提升2000倍。

具體來說，在雙車道400m場景中，D2RL生成的場景直接跳過（刪除）傳統(tǒng)仿真過程中95.7%的事件和99.78%步驟，最大可能給出系統(tǒng)高價值訓(xùn)練場景。

這樣一來，算法碰撞率達(dá)成同樣的收斂標(biāo)準(zhǔn)下，NDE環(huán)境需要訓(xùn)練1.9X10⁸次，D2RL需要9.1X10⁴次，效率提升2100倍。

而在3車道、更長距離的實(shí)驗(yàn)中，得出的效率提升效果基本都在2000倍左右。

另外，研究人員將一套開源自動駕駛算法Autoware23搭載在林肯MKZ上進(jìn)行了4 公里左右的實(shí)際路測，并將實(shí)際道路場景建模，并使用D2RL進(jìn)行模擬。兩條路線分別在156和117次測試后達(dá)到收斂，而與之相比的是在NDE條件下，達(dá)成相同的標(biāo)準(zhǔn)分別需要2.5×10⁷次和2.1×10⁷次。

同樣效率提升2000倍左右。

也就是說，使用D2RL網(wǎng)絡(luò)進(jìn)行自動駕駛算法的模擬仿真訓(xùn)練，能大大縮短自動駕駛的開發(fā)周期。

在自動駕駛之外，D2RL還可以用在其他AI可靠性驗(yàn)證中，如醫(yī)療機(jī)器人和航空航天系統(tǒng)。

怎么做到的？

從上面的實(shí)驗(yàn)結(jié)果表格中可以看出，D2RL之所以提升效率的主要手段，就是對系統(tǒng)生成仿真場景的過程進(jìn)行“提純”，盡量少生成價值不大的常規(guī)場景，保留高價值數(shù)據(jù)。

研究團(tuán)隊(duì)認(rèn)為，無人車仿真系統(tǒng)的效率問題，本質(zhì)上是高維空間（多維向量空間）中的一個罕見事件估計(jì)問題。

如何識別并剔除高維向量空間中非安全關(guān)鍵的點(diǎn)，是D2RL的核心任務(wù)。

D2RL是一種密集強(qiáng)化學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)，其基本思想是識別和去除多向量空間的非安全關(guān)鍵數(shù)據(jù)，并保留安全關(guān)鍵數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。

由于聲稱場景中只有非常小的一部分?jǐn)?shù)據(jù)是安全關(guān)鍵的，剩余數(shù)據(jù)的信息將被大大地密集化。

D2RL方法的本質(zhì)是刪除非關(guān)鍵狀態(tài)，并連接關(guān)鍵狀態(tài)來重新編輯馬爾科夫決策過程，然后只對編輯過的馬爾科夫過程進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。

因此，對于任何訓(xùn)練場景，最終的獎勵都是沿著編輯過的馬爾可夫鏈反向傳播的。

直觀地說，D2RL訓(xùn)練的對象，是仿真測試場景中的BV（非自動駕駛背景車輛），要求他們在特定的時空下執(zhí)行特定的動作，與自動駕駛車輛（AV）形成對抗性訓(xùn)練。

獎勵函數(shù)為：

其中x表示每個測試情節(jié)的變量，IA(x) 是AV碰撞事件的指標(biāo)函數(shù)，后兩項(xiàng)則是AV目標(biāo)策略和目標(biāo)行為的重要性函數(shù)。

獎勵越高表示測試環(huán)境越有效。這樣的獎勵設(shè)計(jì)是通用的，也適用于其他具有高維變量的罕見事件估計(jì)問題。

為了確定學(xué)習(xí)機(jī)制，團(tuán)隊(duì)進(jìn)一步研究了行為策略和目標(biāo)策略之間的關(guān)系。

他們發(fā)現(xiàn)AV的最佳行為政策在訓(xùn)練過程中收集的數(shù)據(jù)幾乎是與目標(biāo)策略相反。這表明，如果使用傳統(tǒng)強(qiáng)化學(xué)習(xí)中的on-policy策略，AV的目標(biāo)行為策略將偏離最佳。這可能會誤導(dǎo)訓(xùn)練過程。

為了解決這個問題，團(tuán)隊(duì)設(shè)計(jì)了一個off-policy學(xué)習(xí)機(jī)制，即設(shè)計(jì)一個通用的行為策略，并在訓(xùn)練過程中保持不變，用來平衡AV的策略和行為。

最終，D2RL可以在訓(xùn)練過程中使獎勵最大化，有效地提高AV的碰撞率。

作者團(tuán)隊(duì)介紹

本研究的第一作者封碩，目前在美國密歇根大學(xué)安娜堡分校做博士后。

封碩本科和博士學(xué)位都在清華大學(xué)自動化系獲得，研究方向是優(yōu)化控制、互聯(lián)和自動駕駛評估以及交通數(shù)據(jù)分析。

封碩所在的Traffic Lab實(shí)驗(yàn)室，由劉向宏教授領(lǐng)導(dǎo)。

Sun Haowei，密歇根大學(xué)土木與環(huán)境工程專業(yè)在讀博士生，同樣在Traffic Lab實(shí)驗(yàn)室。研究興趣是車聯(lián)網(wǎng)和自動駕駛汽車的測試和評估。Sun Haowei本科畢業(yè)于清華大學(xué)自動化系。

本文通訊作者劉向宏博士現(xiàn)任美國密歇根大學(xué)土木與環(huán)境工程系終身職正教授、密歇根大學(xué)交通研究所(UMTRI)研究教授，北京航空航天大學(xué)客座教授、兼職博士生導(dǎo)師。

他在國內(nèi)最被外界熟悉的身份是滴滴前首席科學(xué)家。

劉向宏1993年本科畢業(yè)于清華大學(xué)汽車工程系，2000年在威斯康星大學(xué)麥迪遜分校取得博士學(xué)位。

劉教授是交通工程領(lǐng)域論文引用率最高的學(xué)者之一，他發(fā)明的用于精確測量交叉路口的排隊(duì)長度和旅行時間的SMART-Signal系統(tǒng)于2012年取得美國國家專利，并已在美國明尼蘇達(dá)州和加州得到廣泛應(yīng)用。

原文鏈接：https://www.nature.com/articles/s41586-023-05732-2

如果你有好的研究成果或觀點(diǎn)，歡迎來稿交流：auto@qbitai.com

—聯(lián)系作者—

—完—

【智能車參考】原創(chuàng)內(nèi)容，未經(jīng)賬號授權(quán)，禁止隨意轉(zhuǎn)載。

點(diǎn)這里關(guān)注我，記得標(biāo)星，么么噠～

關(guān)鍵詞：

責(zé)任編輯：孫知兵

免責(zé)聲明：本文僅代表作者個人觀點(diǎn)，與太平洋財(cái)富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實(shí)相關(guān)內(nèi)容。
如有問題，請聯(lián)系我們！

Nature封面罕見給了自動駕駛！仿真效率20002023-03-23
網(wǎng)貸辦停息掛賬要注意什么？網(wǎng)貸怎么做停息2023-03-23
HDEDU聯(lián)合創(chuàng)始人徐梓鐸榮獲2022胡潤U30中國2023-03-23
網(wǎng)絡(luò)平臺停息掛賬最長可以停多久？停息掛賬2023-03-23
一場或?qū)⒏淖內(nèi)蛉怂叩募夹g(shù)革新，正在2023-03-23
網(wǎng)貸平臺拒絕停息掛賬怎么辦？網(wǎng)上幫忙協(xié)商2023-03-23
網(wǎng)貸停息掛賬如何提高成功率？網(wǎng)貸逾期了暫2023-03-23
網(wǎng)貸停息掛賬申請條件是什么？如何協(xié)商申請2023-03-23
恒慧融：投資理財(cái)?shù)淖⒁馐马?xiàng)都有哪些2023-03-23
網(wǎng)貸停息掛賬影響多久？網(wǎng)貸逾期了暫時還不2023-03-23
提前還款的條件是什么？先息后本提前還款虧2023-03-23
如何辦理提前還款？房貸逾期可以協(xié)商還款嗎2023-03-23
提前還款房貸哪種還款方式最劃算？房貸可以2023-03-23
網(wǎng)貸逾期要怎么處理？網(wǎng)貸逾期如何正確解決2023-03-23
搶抓RCEP發(fā)展機(jī)遇，江蘇外貿(mào)活力持續(xù)釋放2023-03-23
網(wǎng)貸停息掛賬的協(xié)商技巧有哪些？網(wǎng)貸如何申2023-03-23
甘肅省關(guān)于做好新生兒參加城鄉(xiāng)居民醫(yī)療保險(xiǎn)2023-03-23
烏魯木齊市2020年城鄉(xiāng)居民基本養(yǎng)老保險(xiǎn)參保2023-03-23
全球新消息丨焦點(diǎn)消息！擬收購寶靈化工加碼2023-03-23
當(dāng)前短訊！保利發(fā)展擬發(fā)行15億元公司債券，2023-03-23
臨沂市關(guān)于實(shí)行住房公積金貸款自主核算相關(guān)2023-03-23
【環(huán)球財(cái)經(jīng)】東京股市兩大股指小幅回落2023-03-23
世界要聞：美國證監(jiān)會將對孫宇晨提起訴訟 2023-03-23
硅業(yè)分會：本周硅片價格持穩(wěn)運(yùn)行石英砂保2023-03-23
網(wǎng)貸也可以做停息掛賬嗎？網(wǎng)貸突然停止催收2023-03-23
女生小說網(wǎng)(現(xiàn)今有哪些女生小說網(wǎng)？)2023-03-23
環(huán)球速訊：網(wǎng)頁打開速度慢(電腦打開網(wǎng)頁慢2023-03-23
全球熱訊:中農(nóng)聯(lián)合新設(shè)檢測科技子公司含2023-03-23
貴常春，經(jīng)得起時間的考驗(yàn)，方可成就醇正口2023-03-23
投資不規(guī)范，錢包兩行淚?萬洲金業(yè)踐行理財(cái)2023-03-23

精彩推薦

Nature封面罕見給了自動駕駛！仿真效率2000倍提升，清華自動化校友出品視焦點(diǎn)訊

閱讀排行

關(guān)于我們　-　聯(lián)系方式　-　版權(quán)聲明　-　招聘信息　-　友鏈交換　-　網(wǎng)站統(tǒng)計(jì)

太平洋財(cái)富主辦版權(quán)所有：太平洋財(cái)富網(wǎng)

未經(jīng)過本站允許請勿將本站內(nèi)容傳播或復(fù)制業(yè)務(wù)QQ：3 31 986 683

www.第四色,熟女少妇色综合图区,日本sm/羞辱/调教/捆绑视频,网站国产,亚洲国产成人久久综合一区77

Nature封面罕見給了自動駕駛！仿真效率2000倍提升，清華自動化校友出品 視焦點(diǎn)訊

賈浩楠 發(fā)自 副駕寺智能車參考 | 公眾號 AI4Auto

自動駕駛仿真提效2000倍

怎么做到的？

作者團(tuán)隊(duì)介紹

精彩推薦

Nature封面罕見給了自動駕駛！仿真效率2000倍提升，清華自動化校友出品 視焦點(diǎn)訊

閱讀排行

推薦閱讀

Nature封面罕見給了自動駕駛！仿真效率2000倍提升，清華自動化校友出品視焦點(diǎn)訊

賈浩楠發(fā)自副駕寺智能車參考 | 公眾號 AI4Auto

怎么做到的？

Nature封面罕見給了自動駕駛！仿真效率2000倍提升，清華自動化校友出品視焦點(diǎn)訊