熱鬧與隱憂：ChatGPT大火背後，AI留給人類的倫理與可持續難題

跟隨科技圈“潮流”，微軟宣布將於2023年3月底之前在全球裁員1萬人，約佔員工總數的5%。這次裁員規模之大，被微軟視為應對宏觀經濟狀況和客戶優先事項變化的措施。但這種做法似乎不影響這家企業有足夠的資金對OpenAI進行新一輪投資。

據外媒Semafor報道，微軟將以100億美元投資OpenAI，並且將獲得OpenAI 75%的利潤份額，直到收回投資資金，之後微軟將持有OpenAI 49%的股份。

投資OpenAI，其源動力是ChatGPT帶來的一系列業內反響，ChatGPT一方面正為微軟補強其在搜索領域的壁壘，另一方面也為自身在通用型AI和NLP領域塑造商業化能力，而這原本是一個由谷歌AI主導的大市場。

ChatGPT於2022年11月30日面向客戶端進行發布，兩個月後，該模型驅動的工具平台月活用戶估計已達1億。近日，ChatGPT還宣布了Plus增值版，每月收費20美元，面向更多有需要的企業和學生提供會員服務。摩根士丹利的一份報告正研究ChatGPT是否對谷歌構成威脅，“該語言模型可能會佔據一定市場份額，並且破壞谷歌作為互聯網用戶入口的地位。”

深受深度學習的影響，NLP領域近年來的科研成果是可見的，也解鎖了很多新的應用場景，但仍然沒有迎來關鍵的商業化破局。而OpenAI與微軟土財主的這次合力“氪金”，顯然激起了新一輪NLP技術企業的集體焦慮。

ChatGPT的過去與現在

從技術原理解釋，ChatGPT是由微調后的GPT3.5模型提供。與早期的ELMO，谷歌的BERT、ALBERT，百度的ERNIE，達摩院的M6一樣，它們均為NLP預訓練大模型的典型代表。這意味着像知識檢索、人機交互、語言翻譯、文學創作這些活兒，預訓練模型好像都能幹。

但不同的是，ChatGPT這次還提供了客戶端界面，用戶可直接通過客戶端基於模型訓練出的“機器人”進行交互，並且實現WebUI免費版。這種做法也讓許多C端用戶可以迅速調用ChatGPT，如構思小說框架、寫論文、輔助課程設計、為程序debug等操作花樣百出。

在GPT3.5之前，OpenAI已經連續發布三個版本的GPT模型，尤其以GPT-3最為著名。在此期間，GPT模型就開始瘋狂通過增加可訓練參數、增加訓練樣本等方式進行改進。但暴力拆解方式下，GPT-3依然會經常產生錯誤，曾有專家指出，“如果沒有大量複雜的工程調試，GPT-3還無法真正投入使用。”

另一方面，GPT-3，其參數量就已經達到1750億，並使用了45TB的訓練樣本。這意味着當AI任務訓練效果提升的同時，也對模型訓練成本和時間帶來了巨大挑戰。業內有人曾估計僅訓練GPT-3模型就需要1200萬美元，如果用一塊非常先進的英偉達GPU訓練GPT-3，大概需要100年。

在Transformer思潮的推動下，語言模型進入“巨量”時代，大模型已經在產業界帶來了一系列連鎖變化。而NLP領域又並非是一個獨立的技術範疇，依然需要有底層算力、大數據、知識圖譜、遷移學習等核心技術的支撐。

如果GPT按照以往的發展邏輯，將會逐漸通過開源方式讓科研與工程界共享技術紅利。但在商業世界，絕非如此簡單。

微軟的神來一筆

2019年，在聯合創始人馬斯克轉身離開后，OpenAI宣布重組，成為有利潤上限的盈利機構，股東的投資回報被限製為不超過原始投資金額的100倍。同年7月，微軟以10億美元注資，並獲得了OpenAI GPT-3的獨家授權，而OpenAI則可藉助微軟的Azure雲服務平台解決商業化問題，緩解高昂的成本壓力。

過去幾年，OpenAI與微軟的合作節奏逐漸加快。2021年，OpenAI與代碼託管平台Github（被微軟收購）合作推出Copilot AI智能代碼生成平台，可將文字語言提示詞轉化為代碼，目前是為了提升開發者編碼效率。

2022年，OpenAI先後推出圖像生成器DALL-E 2和文本生成器ChatGPT，微軟也迅速將其整合到自身產品套件，如搜索引擎Bing、Office辦公全家桶、會議視頻產品Teams Premium均已經計劃應用ChatGPT。

總是為了廚餘煩惱嗎？雅高環保提供最適用的廚餘機，滿足多樣需求。把原有貨櫃屋改裝成任何尺寸大小及多咖貨櫃合併。空壓機這裡買最划算!優質快速服務、空壓機合理價格。精緻包裝茶葉罐，也能撐場面!示波器探測執行效能最佳化的8大秘訣；臭氧機的滅菌效果如何?(全省)堆高機租賃保養一覽表，由簡易堆高機修改而成，無需現場施工，交機即可使用！哪裡買的到省力省空間，方便攜帶的購物推車。客製專屬滑鼠墊、可愛造型L夾、L型資料夾、透明證件套、手提袋，專業印刷設計廠商!二手貨櫃屋已普遍被應用於展場活動、居家住宅、工業商辦上。掌握產品行銷策略,帶你認識商品包裝設計基本要素。各種精緻鐵盒包裝茶葉罐、禮品罐，增加商品收藏及實用性。 Peel Force Tester，協助客戶導入半導體設備、工業型機械手臂以提高產能及加工技術，工業型無線充電裝置、精密加工元件；噴霧式乾燥機

而如今，微軟不僅希望進行新一輪百億美金投資，還表示將在Azure雲平台中整合ChatGPT，實現Azure OpenAI服務全面上市，通過該服務可訪問OpenAI開發的AI模型，屆時微軟的每個產品都將具備相同的AI能力。

與OpenAI的合作，成為微軟到迄今為止在AI領域一筆成功的買賣，對微軟在搜索引擎、辦公、會議視頻，以及雲市場引發了強烈衝擊，而這也讓外界“期待”有望在2023年發布的GPT-4。

熱鬧的背後

據外媒CNBC爆料，谷歌最近正在加快研發一個名為“學徒巴德”（Apprentice Bard）的聊天機器人，其基於LaMDA語言模型。顯然，谷歌於去年12月針對ChatGPT的“紅色警報”已經拉響。而除了LaMDA之外，谷歌也已經計劃將圖像生成模型Imagen對抗OpenAI的DALL·E 2。

而據百度披露，今年1月初，百度搜索將升級“生成式搜索”能力，基於百度自研的生成式模型能力，為用戶開放式的搜索提問或定製化的信息需求“創作答案”。此外據路透社報道，百度曾計劃於3月將該服務作為獨立應用推出，再逐步將其集成到搜索引擎中。

無論在當下關注度較為集中的搜索領域，還是其他潛在領域，受ChatGPT的強烈刺激，包括谷歌、百度在內的AI主力梯隊已經快速跟進起來。不過，源自GPT本身涉及的倫理問題與技術難點依然存在。

如Stack Overflow已經宣布禁止將ChatGPT所產生的問題用於回答社區問題，並給出違規者最多可被封禁30天的懲戒措施。當不少大學生開始用ChatGPT寫作業，紐約大學等高校的教授及學者們也發出警告，將AI視為作弊行為。

在技術層面，GPT-3曾經會犯的錯誤，在ChatGPT上也並未解決掉，如只能計算精通十以內的加減法，甚至還會“一本正經地胡說八道”。這與ChatGPT的訓練語料庫有一定關係，其餵養的數據還是來自2021年前來自互聯網的數十億個文本示例。例如在專業知識領域或者信息更新快的IT領域，模型訓練任務和訓練效果往往會受其制約。

而在訓練成本上，小冰公司CEO李笛此前表達，“ChatGPT主要是研究性質上的突破。它有非常好的創新，即證明了在原有的大模型基礎之上，進行一些新的訓練方法，可以更好地提高對話質量。但如果小冰用ChatGPT的方式來運行系統，現在小冰每天承載的交互量就需要花近3億人民幣的對話成本，即使ChatGPT可以把成本優化到現在的10%，也賺不回來。”

據外媒披露，微軟此前的融資就以現金+Azure雲算力的方式作為兌付，模型訓練最消耗的也恰恰是算力成本。這也難怪分析機構預測，ChatGPT使用量的快速增長可能使英偉達在12個月內銷售額達到30億至110億美元。長期來看，這也將是微軟應對算力高投入與ChatGPT高增長可預見收益下的一種對沖策略。

其實，ChatGPT出現之前，基本國內大的AI玩家就已經在涉足構建出類似於GPT、但主要基於中文語料庫的預訓練大模型。大模型在落地過程中呈現出了與以往模型不同的技術特徵，也帶來了更好的智能化水平。

“但是大模型想要在某個方向上訓練得更好，智能化水平更高，需要在具體落地場景引入額外的領域知識，才能解決實際問題。AI大模型有其自身特點，訓練時使用的數據集主要來自互聯網，在通用知識和領域知識的分佈上存在不均，會影響其在具體行業的應用。”浪潮信息AI軟件研發總監吳韶華對鈦媒體App表示。

對於更多的創業公司而言，大模型做微調或二次開發的方式，且不說仍需要大量算力的支持，在實際場景中，能不能等到成熟落地也需要時間成本。

在ChatGPT之後，勢必會有更多的AI團隊試圖給出算法更加精準、訓練成本更低、對於用戶而言調取更方便的模型，它可能依然會結合Transformer，也可能運用新的機器學習方法，提出對語言翻譯、文本生成、甚至情感分析等NLP通用場景下的解決思路。

尤其對於中國的AI團隊，也會在ChatGPT的這場狂歡中繼續回答一個老問題：當技術的風口再次來了，如何避免走過去商業目標不清晰的老路？（本文首發鈦媒體APP 作者 | 楊麗）

https://www.tmtpost.com/6397865.html