做到第一梯隊 長城汽車智能駕駛媒體專訪
長城汽車近期發(fā)力智能駕駛領域,從長城創(chuàng)始人魏建軍在山城重慶直播測試藍山智駕版的無圖NOA開始,釋放出品牌對智能駕駛的重視程度,此次專訪進行了媒體問答,以下為專訪實錄。參會人員為長城汽車智能化副總裁吳會肖;長城汽車智能平臺開發(fā)中心的高級總監(jiān)姜海鵬;長城汽車智能平臺開發(fā)中心的專家吳國蘇州;長城汽車魏派產(chǎn)品總監(jiān)劉鵬凱。
吳國蘇州:我簡單跟大家溝通一下關于長城智能駕駛這兩個月內(nèi)的一些動態(tài)更新和進展。
今天分享的內(nèi)容首先是包括我們對行業(yè)趨勢的一些認知和看法。另外我們今年在4月份向各位媒體老師介紹了我們SEE一體化大模型,這個模型在這兩個月的時間內(nèi)又有了一定更新和升級,包括功能和場景更新也會在這里跟大家分享。最后是各位關心的城市NOA產(chǎn)品開城的計劃,也是大家更為關心的一個內(nèi)容。
首先我們來回顧一下今年4月份我們發(fā)布的模型表現(xiàn),(視頻)這是4月份我們SEE模型在盤山公路連續(xù)開車情況,可以看到大轉(zhuǎn)彎的角度和連續(xù)彎道的場景,智駕模型在當時已經(jīng)表現(xiàn)了非常擬人化的駕駛表現(xiàn)。
實際上當時這個產(chǎn)品已經(jīng)不是傳統(tǒng)的基于規(guī)則決策和規(guī)劃,它是帶著人工智能決策的一體化大模型,所以它對于避障能力都展現(xiàn)了一定老司機的水平。像這樣的垂直曲率變化的坡度,對現(xiàn)在的智駕系統(tǒng)也是一個非常大的考驗,其實在當時整個算法狀態(tài)能夠很好的應對這樣一些場景。包括路面上一些異形障礙物和通用障礙物的感知和避讓,當時也都全部支持。
接下來主要和大家講一下我們對行業(yè)趨勢的一些看法。
實際上這兩年智駕技術的進步非???,各種新的名詞也層出不窮,我記得在去年底的時候大家都還在談論BEV+Transformer成為一個智駕的新范式,大家希望把這個東西搬上車,而在今年在幾個月前各個主流的智駕廠商都紛紛開始宣傳自己端到端技術。當然從現(xiàn)在本身已經(jīng)量產(chǎn)的智駕產(chǎn)品來看,BEV+Transformer感知加上人工規(guī)則的決策規(guī)劃,是目前的市場主流。當然這樣的技術對于一些高速和高架NOA產(chǎn)品是沒有問題的,但如果用2021年就推出的技術去挑戰(zhàn)城市的場景會遇到非常非常多的問題,這也是我們看到為什么現(xiàn)在主流的廠商在開城的過程中快的大半年的時間,慢的可能幾年時間,目前行業(yè)城市NOA的開發(fā)普遍需要上千名甚至幾千名的工程師一個場景一個場景去寫代碼優(yōu)化,從而導致開城的緩慢。這也是為什么人們在意識到智駕進入城區(qū)之后,傳統(tǒng)感知決策規(guī)劃的方法——這種分段式的方法,越來越不能適應城市場景的需要,并且上限很難提高。我們今天看用AI模型實現(xiàn)統(tǒng)一的感知,預測決策規(guī)劃是一個必要的方法,也是為什么我們大家都在大力的發(fā)展端到端技術的一個根本原因。
我認為今年肯定是一個端到端到技術上車的元年,當然端到端技術本身是加快產(chǎn)品迭代,并且讓處理每一個case解決的效率更高,但它并不是智駕終局。我們認為全場景自動駕駛,僅依靠端到端是不夠的,對于通用場景理解是必要的技術手段。當前輔助技術向自動駕駛邁進,端到端和場景理解是一個必然的趨勢。
第二,我們再來回顧一下SEE模型的背景,其實SEE是我們在今年4月份發(fā)布的一體化智駕模式。當時背景我們就是為了應對L2+的輔助駕駛由高速走向城市,需要處理無窮多的case,有各種人車混流的路段,且交通場景非常復雜。為了解決幾乎無窮多的場景問題,而提出的一種技術理念和架構。它強調(diào)的是安全、高效和體驗,在這樣一個架構下我們主要干了三件事。
第一,算法架構相比傳統(tǒng)算法分段式算法模塊發(fā)生一定轉(zhuǎn)變,我們用一體化大模型來解決大部分問題,我們相信隨著數(shù)據(jù)量的增長,人工智能技術的進步,模型不斷進化,能夠更好的解決場景問題,而不需要靠幾千人的團隊來針對每一個場景去打補丁,這是我們的第一個措施。實際上現(xiàn)在火熱的端到端技術理念,我們當時一體化模型就已經(jīng)得到使用,只是在當時的情況下,畢竟這個模型不是完全端到端的,還有大量人工規(guī)則在里面,所以本著實事求是和相對于客觀的態(tài)度我們還是稱之為一體化大模型。
第二,我們覺得在當時的情況完全靠AI無論是技術還是,數(shù)據(jù)量在一定程度上都是有限的。如果僅靠AI做自動駕駛,對消費者其實是不負責任的,我們做了多層兜底。另外在一體化感知方面這塊我們走在前面,用一個感知模型替代了多個模型加后處理的感知,我們智駕模型符合端到端理念,完全通過數(shù)據(jù)驅(qū)動使得智駕系統(tǒng)不斷進步。
大家比較關心的一個點是SEE這個模型在端到端技術的應用。端到端的理念不是說一步到位的。行業(yè)里的智駕方案都是從分段式的架構開始的。最早模型化的是一個感知模型,而后面會有復雜的后處理和一個多傳感器融合。和,最后才是大量人工編碼的決策規(guī)劃,我們稱之為經(jīng)典分段式的智駕結構。而在端到端的第一步是感知系統(tǒng),它把前端感知和融合采用一個模型來實現(xiàn)一個BEV一體化感知,現(xiàn)在市面上大部分車型基本都實現(xiàn)了BEV感知的端到端,而在決策和規(guī)劃采用人工編碼的方式。
第二步是整體智駕算法的端到端,我們平時講的端到端基本下面兩種方式:第一種是現(xiàn)在普遍的做法,它是BEV一體化的感知加上大的決策規(guī)劃和模型,把兩段結果拼起來,主要依靠模型推理,通過傳感器輸入就能夠?qū)崿F(xiàn)駕駛軌跡的輸出,我們稱之為模塊化的端到端。而完全端到端,不需要再經(jīng)過中間的過程可以直接通過感知來輸出駕駛軌跡。我們的看法是在現(xiàn)階段完全的端到端實際上是一個很難訓練的模型,并且實際上因為從頭到尾都是黑盒,有很多不可預知的問題,通過人工規(guī)則對一些場景的修補也是個比較難的事情。而模塊化的端到端,雖然技術上容易實現(xiàn),但因為中間有接口,特別是人工定義的接口,會有信息傳遞的局限,也會導致性能損失。所以我們認為把兩種技術全部都結合起來,那是現(xiàn)階段一個比較好的方案。所以我們說的SEE2.0在這兩個月內(nèi)發(fā)生的升級,實際上結合了模塊化的端到端和完全端到端的優(yōu)點,既有直接輸出駕駛的軌跡,又有感知加上模塊化智能決策規(guī)劃的結果,最后還有安全策略來給大家做兜底,保證智能駕駛擬人化和安全。在后面分享的片段里面我們可以看到這種能力的優(yōu)越性。
大家都知道除了算法的升級,人工智能最重要的一個事情就是數(shù)據(jù),我們通常認為從算法到BEV算法到?jīng)Q策規(guī)劃模型到最后的端到端,數(shù)據(jù)量是指數(shù)級的增長,長城汽車在過往項目里面也積累了海量的數(shù)據(jù),我們在兩個多月的時間內(nèi)把用于訓練的數(shù)據(jù)量進行了翻倍,有一百多臺的研產(chǎn)車和大量的測試車在全國各個地方在跑,有大量的數(shù)據(jù)回傳,并且做了數(shù)據(jù)處理來實現(xiàn)了模型能力的增長。
具體技術迭代升級我們做了四方面的考量:
第一,模型優(yōu)化,在原有基礎上把模型進行了一些優(yōu)化和壓縮,執(zhí)行效率提升了20%,同時讓模型做更多的事情。第二,增加了近300萬Clips的實車數(shù)據(jù),進行了大量場景泛化工作,我們完成了全國高速高駕道路超過30萬公里的數(shù)據(jù)泛化。完成了四個首先開通城市NOA城市場景的泛化測試,采集數(shù)據(jù)量超過了1PB,而測試總里程超過了100萬公里,泊車方面泛化測試了200多種泊車場景。第三,我們把模型升級以后省出來的算力做了一部分長周期的場景理解。當然從現(xiàn)階段角度上,如果不計血本的去做進行場景理解,肯定是做不到的,所以我們把模型對環(huán)境記憶和分析的周期從幾十秒擴展到分鐘級,優(yōu)化了包括對靜態(tài)障礙物的繞障,一些不合理的限速以及黃燈閃爍誤減速,都通進行了一部分優(yōu)化。
最后一塊是安全能力,一如既往的,主動安全方面,AEB在4-150km/h可激活,同時完成了30萬公里的AEB誤觸發(fā)測試,AEB誤觸發(fā)指標也是行業(yè)第一梯隊的。另外,重點提升人車混流和博弈交通場景下,在保證效率的情況下提升了安全性能。相對于415版本,630整體升級其實是挺大的,無論道路拓撲能力構建上、博弈安全性、對場景的理解這其實都是比較大的提升。
我們看一下具體的效果,接下來是我們拍的路口實車視頻,對自動駕駛還是比較難的,只有采用AI模型做決策規(guī)劃,才有可能在復雜場景能不能像老司機一樣流暢。另外在很窄的道路上避讓非機動車穿行能力、可通行的能力都大幅度增加,而不是一味的機械等待。我們強化了模型AI 拓撲能力,包括像銳角路口進行拓撲構建,也大大提升。
下一個是變道通行的場景,屬于行業(yè)內(nèi)典型的城市工況,包括主道輔道切換,路邊靜態(tài)車輛的繞障,,對決策和規(guī)劃模型能力也是比較大的挑戰(zhàn)。這是一個比較窄路的城中村,道路僅比車輛寬一些,也沒有出現(xiàn)大量卡頓的情況。
接下來是一個動態(tài)目標博弈的場景,我們可以看到實際上通過路口有很多情況是各種車輛博弈,包括人車博弈和車車博弈,如果一味追求安全,智駕系統(tǒng)雖然很安全但沒有人會去使用。在一些場景下,車輛企圖超越前方的車輛,但是一看超不過,立馬自動放棄,這是跟諸位老師基本是一個水平。
最后一塊行車場景,這對人類駕駛是特別特別簡單的一個場景,反而是傳統(tǒng)智駕基本都很難搞定,特別是超寬沒有車道線的道路,對一些不正常的靠邊是非常普遍的,而這個模型采用的端到端技術,學習駕駛?cè)说男袨橐矔容^輕松的應對這個場景。
另外跟大家分享一下泊車的改進,在這兩個月之內(nèi)我們做了大量的泛化測試,完成了主銷城市里面超過200種泊車場景泛化,同時特別優(yōu)化掉頭泊車、斜列泊車、車頭泊入。記憶泊車方面,對地圖學習和巡航車速都提升到一個令人滿意的水平。超窄車位,對體積比較大的車輛這樣的能力也是必須的,泊入時候兩邊僅有20厘米左右的空間。最后一塊是斷頭車位,雖然那很多泊車產(chǎn)品都能支持,但對空間的感知能力和借用空間的規(guī)劃能力決定泊車效率。我們能夠及時發(fā)現(xiàn)對面的空車位,三把實現(xiàn)掉頭。
最后一塊是主動安全,現(xiàn)在法規(guī)項目滿分是大家的必選項,我們我們除了法規(guī)項目,更加在意其在真實場景中的表現(xiàn),例如這里有個躺在地上的假人,夜間場景側(cè)翻車輛,都實現(xiàn)了很高速度的AEB制動。
最后關心的是我們城市NOA開城計劃,隨著新車的上市,首批開放四個城市,第一是保定,第二是深圳,第三是成都,第四是重慶,這四個城市非常非常有代表性。
保定是歷史悠久的古城,特點是施工道路非常多,包括新舊道路交替,無規(guī)則的車道線和車道線缺失是非常普遍的現(xiàn)象,特別是老車區(qū)路窄,車流密集,是非常有難點的一個城市。第二塊是深圳,高樓林立,城市高架和地面交替非常多。第三是典型的成都這樣的二線城市,路窄,也有大量左右的公交車道,還有待行待轉(zhuǎn)區(qū)也比較多。最后我們也介紹了山城重慶,對智能駕駛來說是一個高地,垂直坡度變化非常多,道路曲率和寬窄變化范圍都非常大,立交密度非常大。
如果搞定這四個城市,那全國80%城市的場景都能覆蓋,為我們接下來每個月的開城計劃有了一個很有力的保證。從能力上講,現(xiàn)階段我們有能力去應對全國范圍的城市NOA。但本著對用戶負責的態(tài)度,智駕這個東西畢竟不是一個光靠理論計算就可以證明的,它需要大量的實際測試,我們有信心在一個不錯的技術基礎上,通過我們大量測試,在今年12月底的時候?qū)崿F(xiàn)全國所有城市開放。
媒體:咱們這次做的NOA升級,現(xiàn)在自動駕駛這一塊我們也知道華為系還有一些其它品牌他們做的技術都非常的快,長城這一次升級和智能駕駛迭代我感覺從整體不管是態(tài)度還是實際變化非常大,想問一下咱們跟其它品牌自動駕駛進展而言是一個什么樣的。我看了地圖亦莊是自動駕駛的示范區(qū)。這是第一個問題,咱們怎么認識和其它競品自動駕駛的梯隊。現(xiàn)在是第一梯隊,和別的品牌比有什么優(yōu)勢?
還有個小問題,我自己自身自動駕駛的問題。剛才看的是30萬連續(xù)高速,那別的品牌宣傳比較少,其實30萬距離很長,會不會出現(xiàn)這種情況,我原來開過一些自動駕駛的車,比如舉一個例子,從北京開到天津,高速域是開放NOA的,中間經(jīng)過廊坊就斷了,會有這么一個問題??梢孕麄?0萬,30萬很長,但固定有幾個路線走下來這個10萬那個10萬,需要有連續(xù)性,高速域開放的邏輯水平。
姜海鵬:首先說自身的優(yōu)勢,從去年下半年開始,從城市NOA開始運轉(zhuǎn),華為、小鵬也好,非常感謝這兩家頭部企業(yè)。原來我們預判城市NOA在2025年落地,恰恰由于咱們國內(nèi)頭部在非常深入的推廣這套系統(tǒng),起初是有圖的,后來逐步演化成大模型的無圖架構。正因為它們相對激進的推動力度,其實教育了我們用戶,也把城市NOA推向智駕最熱門的場景。
今年過年以后我們在CES之間深度試駕了特斯拉,回國以后所有開通智駕功能的車型,華為也好、小鵬也好、理想等等我們都深度做了一些評測和試駕。我覺得我們目前的狀態(tài)不輸于任何一家,如果非要排個名的話我認為我們在前三的水準,大家可以自己評價試駕一下。有沒有任何吹牛的成分。
試駕有幾個前提,第一是大家一定要有城市NOA試駕的基礎,不要盲測或者一張白紙去測,你不知道系統(tǒng)的邊界在哪兒,我們到底采用什么樣的場景來去評測,這方面要具備一定的駕駛經(jīng)驗,具備城市NOA駕駛經(jīng)驗,這是第一點。
第二,要選擇一些城市,現(xiàn)在幾乎每一個算法公司或者主機廠都在講端到端大模型,我可以負責任的告訴大家,現(xiàn)在真正全球搞端到端的,已經(jīng)按照端到端架構去做的不超過三家,而且即使在端到端架構之下,其實內(nèi)部也嵌入了很多規(guī)則的安全問題。因為端到端本身不是說去年或者今年特斯拉才提出這個概念,一開始做自動駕駛的時候大家就知道一定有模型化,只不過那會能力不夠,模型不夠、芯片不行、數(shù)據(jù)量不夠。所以先把感知模型化,模型進一步模型化,慢慢推到?jīng)Q策這一端。原來沒有模型的時候我們靠規(guī)則去做,后來發(fā)現(xiàn)一進城,如果我們還按照規(guī)則去做那代碼是上億行代碼,你也沒有辦法滿足城市這種場景需求。如果無限制的往上堆代碼,可能一個自動駕駛沒有3000人沒有5000人寫不好城市規(guī)則,即使寫了以后有一個變動你也很難解決。所以走到今天大家已經(jīng)很清楚的知道我們必須用數(shù)據(jù)驅(qū)動跑起來,才能降低人員代碼的數(shù)量,降低成本,否則是不能成立的。
基于這個,我建立我們做評測做比對的時候可以找一些陌生城市,大家誰都沒去過,我一直在公司內(nèi)部想推一個智駕紅色旅游區(qū),我們?nèi)パ影?,延安大家在開車的時候誰也不會注意到這個城市是一個三線城市嗎,那邊沒有高精地圖。我們目前這套架構優(yōu)勢確實是不同的架構,我去了很多城市測試,特意到小縣城去一些地區(qū)市激活這個功能去體驗。
確確實實我們把感知模型化都已經(jīng)做出來了,從模型里面能輸出橫中向所需要的數(shù)據(jù),據(jù)我理解行業(yè)里有很多都沒有做到,是很難的一件事。一旦模型化以后迭代速度和用戶體驗直線往上升。還有端到端,包括一些宣傳端到端需要海量的數(shù)據(jù),這樣的理解我認為是有偏差的,我們做下來以后發(fā)現(xiàn)大模型是需要數(shù)據(jù),不是一個海量的推理,需要的是分布,數(shù)據(jù)分布成什么樣很關鍵。比如我有十個場景數(shù)據(jù),我有幾PB幾十PB沒有意義,如果場景數(shù)據(jù)分布得很完備,我什么樣的場景都見過,這樣對大模型的訓練是最好的。所以大模型本身對于數(shù)據(jù)量的要求是一個維度,再就是對數(shù)據(jù)的分布是更重要的一個要求。所以這塊我們也在通過大量的數(shù)據(jù)采集采用各種各樣的數(shù)據(jù)來提高訓練精度。這是第一個問題。
第二個問題,剛才說的30萬公里路測,一上市全國各地都會開通,不會按城市和按區(qū)域開通,它是一個必備的要素。當然高速都認為很簡單,其實我覺得之前因為有高精地圖加持,做得并不細化,高速迭代完這些場景,都說高速場景很單一,你看你怎么算。
我給大家舉幾個例子,高速有雙車道有三車道有四車道,有隧道、有橋梁、有下坡、有下坡、有施工場景、有雨天、有夜天,如果我們做一個數(shù)學方面乘積是累加出來的,我們算法里面有1萬個場景,這1萬多場景到底有幾個廠家真正把這些場景驗證,非常非常少。我們在一步一步往前走,因為有很多場景可遇不可求,比方下雨天趕上一個隧道正在施工,這樣的場景到底能不能滿足,其實是一個很小的概率,但如果你不能滿足,如果遇到這個難題怎么辦,會不會出問題,其實我們正在做這些極限的驗證。我對高速非常放心,我覺得問題不大,但真正把高精地圖去掉以后發(fā)現(xiàn)那么多問題。我算了算在高速場景量產(chǎn)無圖的高速NOA就兩家,大家回憶一下能數(shù)上來的高速NOA廠家基本都有高精地圖,因為它本身就有這個資源,城市里面不做高精地圖是因為沒有地圖資源,不讓采數(shù)據(jù),高速都比較謹慎,高速速度很快,危險系數(shù)比較高的,寧可多花點錢把高精地圖保留下來,我們做得比較干脆,直接砍掉了,做的過程中發(fā)現(xiàn)有圖和無圖帶來的差異那么大。我們現(xiàn)在很自信,我前段時間從保定開車去了一趟成都,又從成都去了重慶,開了20個小時,接管極少,而且你在這個車上開十小時車感覺不到累,尤其是過了秦嶺路段,很多公司在高速都沒跑過雙車道極窄,全是隧道,有的隧道一上就是十幾公里,對于信號考驗非常大,這方面測試要做好。
第三個問題,村沒有車道線,沒有車道線場景目前來說對于現(xiàn)在的BEV架構來講是必須要解決的問題,不解決這個我們是沒有辦法做的因為我們在路口跟路口之間紅綠燈肯定有一段沒有車道線,其實在2021年我們測試的時候沒有一臺車在城市里面通過這樣無線的十字路口,只要車道線一調(diào)感覺不到立馬功能就會退,這兩年通過BEV架構可以把道路還原出來?,F(xiàn)在有幾種方式,有的通過虛擬車線的方式,這是相對初級的一些做法。我們的算法完全通過模型自己出引導線,我看了沒有線我依據(jù)場景還原度把規(guī)劃輸出出來,我知道這個車能走,就是通過模型去做,目前按照這個技術去做,整體來說擬人化程度更高一些。
媒體:車企對端到端感覺比較樂觀,還是有一些不確定性,長城那邊怎么去看待規(guī)避風險?
姜海鵬:端到端一定是未來,但不是終點,現(xiàn)在還有更超前的東西,真正智能駕駛終點一定像人一樣有思考,對場景有理解,基于對場景有理解基礎之上做智駕的動作。
舉一個簡單例子,我們在開車的時候前面有一個黑色塑料袋,如果兩邊有車沒有辦法繞它,我們?nèi)艘欢〞哼^去,因為我知道這是一個軟體,我可以碾壓它,第一是不會出事故,第二不會對我車輛造成傷害?,F(xiàn)在不一樣,沒有辦法知道前面是個軟體,只知道是障礙物,要么剎車要么避讓。未來自動駕駛一定是對場景理解之下的自動駕駛,我們也在做這方面的預案和開發(fā)。我們現(xiàn)在有一些基礎,首先從芯片角度,像英偉達的sor(音),包括我們據(jù)了解國內(nèi)一些大廠芯片公司也朝著這方面定義自己的芯片,你們要支持類似于大語言模型運行芯片。
從模型角度,有我們所謂的語言模型,類似open AI,支持我們做一些理解,然后做一個感知做一個綜合判斷,這方面才是將來的終局。端到端剛才也提到一點,其實端到端就是當前基于自動駕駛本身一套技術邏輯,就是從感知這個模型化到融合模型化最后到規(guī)模模型化,是分段的,剛才蘇州老師也講了一下這個階段。因為人越來越懶,做開發(fā)尤其做軟件代碼做算法,極其燒腦袋的工作,他們要想自己的工作變得更簡單怎么辦,搞AI的同學特別煩碰代碼,因為他們覺得寫代碼太浪費我的時間了,所以他們極其有自驅(qū)力,我要把代碼轉(zhuǎn)化成模型,一旦成了模型以后云端自己適應,我就不管它了,我研究我的模型,怎么優(yōu)化就好了,然后把所有的東西都往前放。首先研發(fā)人員有這個自驅(qū)力,而且這種優(yōu)化其實帶來的體驗是比較好的,所以端到端我們認為就是一個技術發(fā)展階段,但不是智能駕駛的終點。
媒體:咱們長城這邊城市NOA節(jié)奏比預期要晚一點,中間我們做了哪些調(diào)整,包括產(chǎn)品也換了,時間往后調(diào)了。第二,我們剛開始只有纜車這個車,有沒有足夠的用戶反饋機制,同時OTA結構怎樣?
吳會肖:剛才海鵬說大規(guī)模普及在2025年,我們?nèi)ツ昱袛喙?jié)點是2024年上半年。后來跟整車協(xié)同,包括在開放過程中對這個模型架構上做了一些調(diào)整。然后在落地過程中我們也發(fā)現(xiàn)整個行業(yè)里面都會面臨和用戶接受人機共駕的階段,還是因素比較多。藍山智駕款上市就會有這個功能,但最近開多少城開完城之后多少路段開放也做了解釋。關于上車之后OTA檢測剛才吳國蘇州也放了一張圖,我們馬上會開直播,也會請大家去親自試我們車,主交互會有一些優(yōu)化和調(diào)整,開城不會再OTA了,很快就開了。我們保定周圍面積很大,有農(nóng)村有山,我們都會到這些路段去測,不用擔心,把能導航的切得很碎,一些環(huán)島、掉頭人開都很復雜的需要接管。剛才還討論,下車進到程序里面還需要退一下,把ETC和高速NOA和城市NOA再連接一下,車上標配的ETC,現(xiàn)在正在做打磨。
姜海鵬:你說的是我們車定的是6月30日,往后挪了兩個月的時間,這個延期不是我智駕方面延期,是他們車型方面延期。非常感謝給我們智駕多了兩個月的時間,因為他們在做一些組織架構一些優(yōu)化。
媒體:剛才蘇州老師講的時候說了一個場景,在做輔助駕駛規(guī)劃的時候還是有個安全兜底,因為我也是做汽車的,咱們原來十年前長城博士,現(xiàn)在是友商。我比較理解這個東西,我理解我們做一個冗余,其實現(xiàn)在有個場景,經(jīng)常性的有各種垂媒來測AEB測速也好,讓用戶來看感覺誰的車速越高,或者誰的性能越好,那他的車牛。但我從作為一個電動車主體驗來看,余量留得特別多也不好,在應試工況里面這種成績會好,我的那個車經(jīng)常AEB誤觸發(fā),我很不喜歡過于保守的冗余。
第一,長城會卷這方面的東西嗎?第二是對端到端大模型,我們不是在做單純的一些算法,而是通過學習無數(shù)用戶已經(jīng)產(chǎn)生過的case,是不是能解決類似于這樣的用戶體驗?
姜海鵬:首先我們肯定會卷這個東西,不卷不行,這兩年自動駕駛突飛猛進,加快了行業(yè)的速度,加快了大家對這個領域的認知,但AEB這個事老實說本來是一個緊急救命的功能,現(xiàn)在變成了一個體驗的功能,違背了ABE的原則。我們看120公里剎停,包括行業(yè)里面有很多測試這些場景,其實帶來積極作用很大,也帶來一些負面影響,我們在瘋狂追求這些數(shù)據(jù),唯一一個考核最大的指標項沒人能做,就是你怎么能在觸發(fā)和不觸發(fā)之間找到一個平衡,全球做AEB最好的是膜拜,它的誤觸發(fā)率大概是幾百萬公里,但目標很簡單,就是行人、車輛、自行車,并不是沒有識別的能力,是因為發(fā)現(xiàn)他發(fā)現(xiàn)如果把錐桶拉進去以后誤觸發(fā)直線上升,每一次誤觸發(fā)比漏觸發(fā)甚至正確觸發(fā)帶來的危害還要大,因為不預期的剎車有可能會造成大面積的追尾,這都是經(jīng)過嚴格數(shù)據(jù)評測、實驗得出來的結論,現(xiàn)在只看數(shù)字漂亮不漂亮,這個誤觸發(fā)沒有辦法公開測試。因為測試的復雜度導致我們測這些特別表面化的數(shù)據(jù),其實把我們AEB路自帶得有點偏頗了。
今天也跟各位媒體老師做個交底,評測AEB最大的指標是不觸發(fā),絕不是120公里剎停。放在現(xiàn)在這些頭部自動駕駛公司里面都能做到,為什么大家不去做,一旦放開以后誤觸發(fā)率直線上升,希望大家報道的時候能夠有一些正確的引導,這才是對這個專業(yè)負責任的一種態(tài)度。首先這是AEB這一塊。
吳國蘇州:現(xiàn)在端到端狀態(tài)大家想象的是說大量的車產(chǎn)生數(shù)據(jù)了,把車身境況攝像頭把數(shù)據(jù)采回來模型去學,不是那么簡單,按可以想象雖然人學駕駛越來越好,但人實際說對駕駛這件事情很難想象一個字都不識的人他能把駕照考出來,要積累對基礎背景知識,對運動目標判斷,對于AI神經(jīng)網(wǎng)絡也是這樣,你得通過一些機器學習和訓練手段,通過網(wǎng)絡機器設計,讓網(wǎng)絡本身能具備發(fā)現(xiàn)道路上和你有影響的結構化的一些特征,這些東西其實都需要工程師通過工程技術設計的,只有把這些東西都設計好了,你才能有可能學最后一步,學人類的駕駛,并不是那么容易。
很可惜,現(xiàn)在完全端到端讓模型設計好了一次性學出來,現(xiàn)在的表現(xiàn)實際上在大部分場景下挺差的,所以才會有業(yè)界說的兩段式的端到端、模塊化的端到端也好,先去感知模型,這是比較理想,甚至實景模型串在一起來去做所謂的端到端,實際上這都是工程技術上的妥協(xié)。第一是理念上,第二是工程上,你想辦法一點點做法,慢慢隨著8經(jīng)驗積累和技術提升才有可能把模塊化的端到端向完全端到端遷移,最后才能形成我學習就可以了,這個事情絕對不是說一天兩天或者一步,我前面的路不走我直接走后面的路達成,這個不太可能。