爆火的ChatGPT,能讓自動駕駛更快實現嗎?| 鈦媒體深度

最近,科技圈最火的話題莫過於“ChatGPT”。不過,ChatGPT只是一種外在表現形式,更值得關注的是背後AI技術進展以及未來的應用落地。

甚至有人樂觀地描述ChatGPT所帶來的變化:如果說ChatGPT之前,AI最多只是現有場景產品的一個模塊。那麼,ChatGPT之後,AI會重新定義現有場景的產品框架。

是否真如樂觀者所言仍有待觀察,但自動駕駛作為AI落地的重要場景之一,是否會在這波浪潮中有更進一步的發展,仍引起了不少人的探討。

有人認為,自動駕駛需要更多的是圖形、圖像、數據的處理能力,對圖像算法的要求更高,與自然語言處理的能力相關性不大,想要ChatGPT的能力來實現自動駕駛,目前還不太可能。

當然也有人認為,ChatGPT的出現給大家看到了一種可能,那就是經過訓練后的AI,將會使得高級別的自動駕駛有望在幾年後出現。

自動駕駛是AI落地的重要場景之一

為什麼AI技術的進展會讓人關注自動駕駛是否受到影響呢?

觀察自動駕駛的發展歷史不難發現,自動駕駛的每一次重大突破都跟AI技術發展同步。

我們知道,AI其實就是在模仿大腦神經元網絡,通過分析大量的數據來學習一些非常人性化的技能。上世紀80年代,神經網絡的第一次實際應用就是發生在自動駕駛領域。

1987年,卡內基-梅隆人工智能實驗室的研究人員試圖製造一種可以自動駕駛的卡車。他們通過為所有的駕駛行為人工編寫代碼,為卡車在道路上遇到的各種情況編寫盡可能詳細的指令,以此讓車輛自動行駛。但遺憾的是,這種方式最終只能讓汽車實現每秒幾英寸的速度。

人工寫代碼的方式不成,另外一個叫迪安·波默洛的博士生選擇了另一種方式:神經網絡。

他給自己的系統命名為ALVINN,採用這個系統后,卡車利用車頂攝像頭拍攝的圖像來跟蹤司機們在做什麼,以此觀察如何在道路上行進來學習駕駛。1991年,ALVINN以接近60英里的時速從匹茲堡開到了賓夕法尼亞的伊利市。

不過,更直接、更廣泛的影響發生在2012年。

多倫多大學教授傑夫·辛頓和他的兩名學生——亞力克斯·克里哲夫斯基和伊利亞·薩特斯基弗在ImageNet圖像識別比賽上拿了冠軍,並且發表論文介紹了算法AlexNet。這篇論文不僅是人工智能的轉折點也是全球科技行業的轉折點。

目標檢測及圖像識別作為自動駕駛的關鍵技術,高度受益於計算機視覺算法的突破,因此隨着2015年斯坦福人工智能實驗室主任李飛飛團隊在ImageNet開放數據集上的識別準確率首次超過人類,自動駕駛作為AI最重要的落地場景之一,也進入了發展快車道。 

對輔助駕駛的影響更直接,但上“車”成本要解決

那麼,這次ChatGPT的出現會再次成為自動駕駛的Milestone嗎?

一般來說,AI可以概括分為語音、視覺、自然語言理解三部分。上一波AI浪潮主要是基於視覺上圖像識別技術的突破,而這次ChatGPT則是基於GPT-3模型的自然語言處理技術,它可以有效地模擬人類語言理解能力,從而幫助人們更好地理解和分析自然語言文本數據。

當我們要探討ChatGPT會對自動駕駛產生哪些影響的時候,我們認為,首先要弄明白這裏的自動駕駛指的是可量產的低級別的自動駕駛(輔助駕駛)還是高級別L4級別的自動駕駛?其次ChatGPT指的是一個語言模型還是更廣義的生成模型?

如果從自然語言理解的角度出發,ChatGPT對於輔助駕駛部分的人機交互的影響更為直接,而對L4級別自動駕駛的影響或許並不大。

乘聯會秘書長崔東樹也在其微信公眾號發文稱,目前的人機交互和智能座艙體系的創新很強,尤其是國內車企的人機交互能力很強。漢語只有中國企業理解的更深刻。隨着未來的底層賦能,國內汽車業界在應用層面將會有更多良好的人機交互效果。

比如通過使用ChatGPT,車輛可以通過語音或文本的方式與駕駛員進行交互,並向駕駛員提供有關車輛狀態、行駛信息等的實時反饋。

總是為了廚餘煩惱嗎?雅高環保提供最適用的廚餘機,滿足多樣需求。把原有貨櫃屋改裝成任何尺寸大小及多咖貨櫃合併。空壓機這裡買最划算!優質快速服務、空壓機合理價格。精緻包裝茶葉罐,也能撐場面!示波器探測執行效能最佳化的8大秘訣;臭氧機的滅菌效果如何?(全省)堆高機租賃保養一覽表,由簡易堆高機修改而成,無需現場施工,交機即可使用!哪裡買的到省力省空間,方便攜帶的購物推車。客製專屬滑鼠墊、可愛造型L夾L型資料夾、透明證件套、手提袋,專業印刷設計廠商!二手貨櫃屋已普遍被應用於展場活動、居家住宅、工業商辦上。掌握產品行銷策略,帶你認識商品包裝設計基本要素。各種精緻鐵盒包裝茶葉罐、禮品罐,增加商品收藏及實用性。 Peel Force Tester,協助客戶導入半導體設備、工業型機械手臂以提高產能及加工技術,工業型無線充電裝置、精密加工元件;噴霧式乾燥機

在此之前,雖然已經出現了大量的車載交互系統,但是行業的痛點主要聚焦於“理解”部分,大部分的車載語音交互系統在“理解”上並不智能,導致整個系統功能單一、命令詞單一。ChatGPT的爆火讓市場看到了解決的希望。

不過,乘聯會秘書長崔東樹也同時表示,電動化是新能源車的核心,智能化只是錦上添花,未來車企的核心競爭力仍然是造好電動車,同時充分利用ChatGPT等智能化賦能汽車行業發展。

當然,不管是不是核心,想要ChatGPT上車,光有技術突破還不行,一位AI行業人士對鈦媒體表示,“還需要面臨成本的問題,包括使用成本、雲服務成本、針對性的訓練成本等。”

大模型或成趨勢

但是,如果從更廣義的生成模型來看,大數據、大參數的生成式模型會有助於實現更高等級的自動駕駛。

毫末智行數據智能科學家賀翔在接受鈦媒體App採訪時表示,車端能力主要包括兩類:感知和認知,感知能力確實主要依靠圖像技術,而認知能力則更依賴ChatGPT類似的生成技術。

也就是說,ChatGPT的重要革命性意義在於:讓AI模型進入了知識和推理的時代。當前,自動駕駛最大的短板恰恰在於決策規劃缺乏足夠的智能。

ChatGPT 使用了一種叫“人類反饋強化學習(RLHF)”的訓練方法,毫末智行數據智能科學家賀翔對鈦媒體APP解釋稱,GPT是一個大規模通用預訓練語言模型,GPT1、2、3主要是參數規模的提升,ChatGPT主要是引入了人類反饋數據做強化學習。

這種方法的引入可以在訓練中根據人類反饋,保證對無益、失真或偏見信息的最小化輸出。

恰好自動駕駛決策算法中也有一類叫做模仿學習,就是讓機器去學習不同場景下人類駕駛員是怎樣做的。

一般來說,人類司機的每一次接管,都是對自動駕駛策略的一次人為反饋;這個接管數據可以被簡單當成一個負樣本來使用,就是自動駕駛決策被糾正的一次記錄。同時也可以被當作改進認知決策的正樣本來學習。

 “大數據、大參數的大模型能學到更多的潛在知識,包括不同的環境、不同的場景等,相當於學習到了大量的自動駕駛常識,這種常識對自動駕駛決策至關重要。”毫末智行數據智能科學家賀翔對鈦媒體App表示。

也就是說,在自動駕駛研發的過程中採用人類反饋強化學習的思想,可以訓練出模型來驗證、評價機器模型的輸出,使其不斷進步,最終達到人類的駕駛水平。

所以,可以說基礎能力的提升,帶來了想象力及可應用場景的擴張。但目前階段,我們仍然無法準確判斷以ChatGPT為代表的大模型會給自動駕駛帶來多大的變革,一位行業人士對鈦媒體App表示,通過大模型訓練而來的優秀泛化能力,可能讓世間再無corner case。

corner case是指在自動駕駛中是指行駛過程中可能出現,但發生頻率極低的小概率事件。儘管平時很少會遇到,但對於自動駕駛系統來說,遇到無法做出決策的corner case時,很可能會導致致命的交通事故。

ChatGPT的橫空出世則讓行業認識到,不斷去累積公里數,一直這麼跑下去是可以獲得更高級別的自動駕駛技術的跨越。

事實上在此之前,不管是國外的,還是國內的小鵬、、毫末智行都已經在探索“大模型”的路線了。

在2020年宣布將基於深度神經網絡的大模型引入其自動駕駛之中,到現在已實現了純視覺FSD Beta的大規模公測;小鵬在2022年1024科技日中表達了使用大模型打通XNGP全場景能力的觀點;Apollo認為文心大模型將是提升器自動駕駛能力的核心驅動力。

毫末智行則早在2021年宣布要藉助大模型提升數據處理能力,今年2月17日,毫末智行將人駕自監督認知大模型正式升級為“DriveGPT”,將持續引入大規模真實接管數據,通過人駕數據反饋的強化學習,來不斷提升測評效果,同時也將DriveGPT作為雲端測評模型,用來評估車端小模型的駕駛效果。

不過,高級別的自動駕駛汽車的開發是一個複雜的多學科領域,涉及廣泛的技術和監管挑戰,人工智能技術進展可以帶來一定的推動作用,但是這並非一個短期可以實現的問題。

有報道稱,GPT3.0涉及了1700億參數,內存達300多GB,訓練過程耗費1200多萬美金。上述行業人士表示,自動駕駛算法是要跑在車上,這麼大的模型能不能部署到車端?又需要耗費多少算力支持?另外,自動駕駛不能依靠重複性、簡單的路況數據堆疊就能完成,因此如何保證數據量大且有效也是一個關鍵的問題。(本文首發鈦媒體App, 作者|韓敬嫻,編輯|張敏)

https://www.tmtpost.com/6422611.html