爆火的ChatGPT，能讓自動駕駛更快實現嗎？| 鈦媒體深度

最近，科技圈最火的話題莫過於“ChatGPT”。不過，ChatGPT只是一種外在表現形式，更值得關注的是背後AI技術進展以及未來的應用落地。

甚至有人樂觀地描述ChatGPT所帶來的變化：如果說ChatGPT之前，AI最多只是現有場景產品的一個模塊。那麼，ChatGPT之後，AI會重新定義現有場景的產品框架。

是否真如樂觀者所言仍有待觀察，但自動駕駛作為AI落地的重要場景之一，是否會在這波浪潮中有更進一步的發展，仍引起了不少人的探討。

有人認為，自動駕駛需要更多的是圖形、圖像、數據的處理能力，對圖像算法的要求更高，與自然語言處理的能力相關性不大，想要ChatGPT的能力來實現自動駕駛，目前還不太可能。

當然也有人認為，ChatGPT的出現給大家看到了一種可能，那就是經過訓練后的AI，將會使得高級別的自動駕駛有望在幾年後出現。

自動駕駛是AI落地的重要場景之一

為什麼AI技術的進展會讓人關注自動駕駛是否受到影響呢？

觀察自動駕駛的發展歷史不難發現，自動駕駛的每一次重大突破都跟AI技術發展同步。

我們知道，AI其實就是在模仿大腦神經元網絡，通過分析大量的數據來學習一些非常人性化的技能。上世紀80年代，神經網絡的第一次實際應用就是發生在自動駕駛領域。

1987年，卡內基-梅隆人工智能實驗室的研究人員試圖製造一種可以自動駕駛的卡車。他們通過為所有的駕駛行為人工編寫代碼，為卡車在道路上遇到的各種情況編寫盡可能詳細的指令，以此讓車輛自動行駛。但遺憾的是，這種方式最終只能讓汽車實現每秒幾英寸的速度。

人工寫代碼的方式不成，另外一個叫迪安·波默洛的博士生選擇了另一種方式：神經網絡。

他給自己的系統命名為ALVINN，採用這個系統后，卡車利用車頂攝像頭拍攝的圖像來跟蹤司機們在做什麼，以此觀察如何在道路上行進來學習駕駛。1991年，ALVINN以接近60英里的時速從匹茲堡開到了賓夕法尼亞的伊利市。

不過，更直接、更廣泛的影響發生在2012年。

多倫多大學教授傑夫·辛頓和他的兩名學生——亞力克斯·克里哲夫斯基和伊利亞·薩特斯基弗在ImageNet圖像識別比賽上拿了冠軍，並且發表論文介紹了算法AlexNet。這篇論文不僅是人工智能的轉折點也是全球科技行業的轉折點。

目標檢測及圖像識別作為自動駕駛的關鍵技術，高度受益於計算機視覺算法的突破，因此隨着2015年斯坦福人工智能實驗室主任李飛飛團隊在ImageNet開放數據集上的識別準確率首次超過人類，自動駕駛作為AI最重要的落地場景之一，也進入了發展快車道。

對輔助駕駛的影響更直接，但上“車”成本要解決

那麼，這次ChatGPT的出現會再次成為自動駕駛的Milestone嗎？

一般來說，AI可以概括分為語音、視覺、自然語言理解三部分。上一波AI浪潮主要是基於視覺上圖像識別技術的突破，而這次ChatGPT則是基於GPT-3模型的自然語言處理技術，它可以有效地模擬人類語言理解能力，從而幫助人們更好地理解和分析自然語言文本數據。

當我們要探討ChatGPT會對自動駕駛產生哪些影響的時候，我們認為，首先要弄明白這裏的自動駕駛指的是可量產的低級別的自動駕駛（輔助駕駛）還是高級別L4級別的自動駕駛？其次ChatGPT指的是一個語言模型還是更廣義的生成模型？

如果從自然語言理解的角度出發，ChatGPT對於輔助駕駛部分的人機交互的影響更為直接，而對L4級別自動駕駛的影響或許並不大。

乘聯會秘書長崔東樹也在其微信公眾號發文稱，目前的人機交互和智能座艙體系的創新很強，尤其是國內車企的人機交互能力很強。漢語只有中國企業理解的更深刻。隨着未來的底層賦能，國內汽車業界在應用層面將會有更多良好的人機交互效果。

比如通過使用ChatGPT，車輛可以通過語音或文本的方式與駕駛員進行交互，並向駕駛員提供有關車輛狀態、行駛信息等的實時反饋。

總是為了廚餘煩惱嗎？雅高環保提供最適用的廚餘機，滿足多樣需求。把原有貨櫃屋改裝成任何尺寸大小及多咖貨櫃合併。空壓機這裡買最划算!優質快速服務、空壓機合理價格。精緻包裝茶葉罐，也能撐場面!示波器探測執行效能最佳化的8大秘訣；臭氧機的滅菌效果如何?(全省)堆高機租賃保養一覽表，由簡易堆高機修改而成，無需現場施工，交機即可使用！哪裡買的到省力省空間，方便攜帶的購物推車。客製專屬滑鼠墊、可愛造型L夾、L型資料夾、透明證件套、手提袋，專業印刷設計廠商!二手貨櫃屋已普遍被應用於展場活動、居家住宅、工業商辦上。掌握產品行銷策略,帶你認識商品包裝設計基本要素。各種精緻鐵盒包裝茶葉罐、禮品罐，增加商品收藏及實用性。 Peel Force Tester，協助客戶導入半導體設備、工業型機械手臂以提高產能及加工技術，工業型無線充電裝置、精密加工元件；噴霧式乾燥機

在此之前，雖然已經出現了大量的車載交互系統，但是行業的痛點主要聚焦於“理解”部分，大部分的車載語音交互系統在“理解”上並不智能，導致整個系統功能單一、命令詞單一。ChatGPT的爆火讓市場看到了解決的希望。

不過，乘聯會秘書長崔東樹也同時表示，電動化是新能源車的核心，智能化只是錦上添花，未來車企的核心競爭力仍然是造好電動車，同時充分利用ChatGPT等智能化賦能汽車行業發展。

當然，不管是不是核心，想要ChatGPT上車，光有技術突破還不行，一位AI行業人士對鈦媒體表示，“還需要面臨成本的問題，包括使用成本、雲服務成本、針對性的訓練成本等。”

大模型或成趨勢

但是，如果從更廣義的生成模型來看，大數據、大參數的生成式模型會有助於實現更高等級的自動駕駛。

毫末智行數據智能科學家賀翔在接受鈦媒體App採訪時表示，車端能力主要包括兩類：感知和認知，感知能力確實主要依靠圖像技術，而認知能力則更依賴ChatGPT類似的生成技術。

也就是說，ChatGPT的重要革命性意義在於：讓AI模型進入了知識和推理的時代。當前，自動駕駛最大的短板恰恰在於決策規劃缺乏足夠的智能。

ChatGPT 使用了一種叫“人類反饋強化學習（RLHF）”的訓練方法，毫末智行數據智能科學家賀翔對鈦媒體APP解釋稱，GPT是一個大規模通用預訓練語言模型，GPT1、2、3主要是參數規模的提升，ChatGPT主要是引入了人類反饋數據做強化學習。

這種方法的引入可以在訓練中根據人類反饋，保證對無益、失真或偏見信息的最小化輸出。

恰好自動駕駛決策算法中也有一類叫做模仿學習，就是讓機器去學習不同場景下人類駕駛員是怎樣做的。

一般來說，人類司機的每一次接管，都是對自動駕駛策略的一次人為反饋；這個接管數據可以被簡單當成一個負樣本來使用，就是自動駕駛決策被糾正的一次記錄。同時也可以被當作改進認知決策的正樣本來學習。

“大數據、大參數的大模型能學到更多的潛在知識，包括不同的環境、不同的場景等，相當於學習到了大量的自動駕駛常識，這種常識對自動駕駛決策至關重要。”毫末智行數據智能科學家賀翔對鈦媒體App表示。

也就是說，在自動駕駛研發的過程中採用人類反饋強化學習的思想，可以訓練出模型來驗證、評價機器模型的輸出，使其不斷進步，最終達到人類的駕駛水平。

所以，可以說基礎能力的提升，帶來了想象力及可應用場景的擴張。但目前階段，我們仍然無法準確判斷以ChatGPT為代表的大模型會給自動駕駛帶來多大的變革，一位行業人士對鈦媒體App表示，通過大模型訓練而來的優秀泛化能力，可能讓世間再無corner case。

corner case是指在自動駕駛中是指行駛過程中可能出現，但發生頻率極低的小概率事件。儘管平時很少會遇到，但對於自動駕駛系統來說，遇到無法做出決策的corner case時，很可能會導致致命的交通事故。

ChatGPT的橫空出世則讓行業認識到，不斷去累積公里數，一直這麼跑下去是可以獲得更高級別的自動駕駛技術的跨越。

事實上在此之前，不管是國外的，還是國內的小鵬、、毫末智行都已經在探索“大模型”的路線了。

在2020年宣布將基於深度神經網絡的大模型引入其自動駕駛之中，到現在已實現了純視覺FSD Beta的大規模公測；小鵬在2022年1024科技日中表達了使用大模型打通XNGP全場景能力的觀點；Apollo認為文心大模型將是提升器自動駕駛能力的核心驅動力。

毫末智行則早在2021年宣布要藉助大模型提升數據處理能力，今年2月17日，毫末智行將人駕自監督認知大模型正式升級為“DriveGPT”，將持續引入大規模真實接管數據，通過人駕數據反饋的強化學習，來不斷提升測評效果，同時也將DriveGPT作為雲端測評模型，用來評估車端小模型的駕駛效果。

不過，高級別的自動駕駛汽車的開發是一個複雜的多學科領域，涉及廣泛的技術和監管挑戰，人工智能技術進展可以帶來一定的推動作用，但是這並非一個短期可以實現的問題。

有報道稱，GPT3.0涉及了1700億參數，內存達300多GB，訓練過程耗費1200多萬美金。上述行業人士表示，自動駕駛算法是要跑在車上，這麼大的模型能不能部署到車端？又需要耗費多少算力支持？另外，自動駕駛不能依靠重複性、簡單的路況數據堆疊就能完成，因此如何保證數據量大且有效也是一個關鍵的問題。（本文首發鈦媒體App，作者｜韓敬嫻，編輯｜張敏）

https://www.tmtpost.com/6422611.html