如果要選出最早憑借座艙功能占領用戶心智的一家造車新勢力,答案或許是同學體理想。
“冰箱彩電大沙發”是化史理想最被人所知的賣點。但拋開這些精準的助智能自研之路硬件定義,作為未來用戶智駕空間與娛樂的理想第三空間,座艙里只有這些是同學體遠遠不夠的。智能化尤其是化史座艙空間的智能化,已經成為車企的助智能自研之路核心賣點。
2023年5月,理想理想汽車智能空間副總裁勾曉菲曾在美國硅谷的同學體一次半公開宣講會上說,“觸控不是化史座艙最主要的交互方式,把觸控做得再好,助智能自研之路生態做得再好,理想它不適合在這個終端里。同學體基于觸控生態的化史車機系統,就是在用正確的方式回答了一個錯誤的問題?!?/p>
勾曉菲這句話說完后的一個月,理想汽車推出了自研認知大模型“Mind GPT”,并將其以“理想同學”App的形式嵌入車機系統中,成為座艙里眾多用戶與數字內容交互的“新按鈕”。
大模型加速上車后,智能座艙的競爭更顯白熱化。作為全公司最大的產品經理,李想對于AI的投入非常堅決,每個月都會參加數場AI的主題會。
他經常說的一句話是:“我們是一個AI公司,我們必須把大模型做出來,沒有大模型就不配稱為AI公司?!?/p>
李想不是技術科班出身,但在2024年6月,他做了一件非常具有“預言性”的事情:大模型的研究重心,要從預訓練向后訓練遷移。三個月后,OpenAI o1驚艷世人,后訓練(Post-Training) 在大模型端到端訓練中的話題度不斷提升。而在李想此前的授意下,理想已經提前進行了內部共識和組織的切換。
效率,是理想智能化超車的重要保障。
回顧歷史,在2021年2月全面自研之前,理想的語音助手還需要依賴思必馳、地平線、大象聲科等供應商來支撐,甚至“用戶數據”都還握在別人手中。從傳統的AI助手到大模型時代下的智能體,理想通過“理想同學”,實現了一次座艙“自我革命”的重建。
2020年,在交付一萬輛車一個月后,理想汽車在美股上市。理想希望通過建立和完善自研能力,盡快追趕上競爭對手小鵬。然而,理想汽車內部算法團隊和供應商的博弈中處于劣勢。這讓李想敏感地意識到,如果沒有自研能力,就會一直被牽制。
全面啟動自研之前,理想的座艙技術“一窮二白”,更多依賴供應商,例如思必馳的語音識別、大象聲科的聽覺算法、虹軟的視覺能力等等。座艙方面還沒有明確的路線圖,團隊如何建設、產品如何定義、技術路線怎么走,沒有一個清晰的結論。
語音助手自研的任務,落在了座艙部門的空間AI團隊身上。
2021年底,李想在智能空間大部門的戰略會上,明確智能空間與AI相關的全部算法都要自研,之前底層算法依賴于供應商的局面必須被打破。與此同時,理想內部正在力推兩件事情:一個是IPD流程,將所有人的工作綁定在流程上;二是推動研發平臺的建設。
理想的座艙平臺化策略是通過SS1、SS2、SS3、SS4等不同平臺來實現,每個平臺基本上對應一款車型。由于理想的車型設計相似,結構上也相對可控。對于研發團隊而言,最具挑戰性的是麥克風和攝像頭傳感器的布局,這些布局直接影響算法的開發。因此,標準化的配置單,只會有“一份菜單”,避免了定制化的資源消耗。
原本,勾曉菲規劃用兩年時間完成自研,但這將會落后于理想新車的發布節奏。
(勾曉菲)
2022年,理想汽車計劃只發布一款L9,到2023年L9、L8、L7系列車型同時上市。如果兩年后才切回自研,理想可能會錯失市場機會。在無法預知蔚來、小鵬、華為等對手迭代速度的情況下,切換供應商的進程被縮短到了一年。
2022年的前半年內,從搜狗加入的陳偉負責組建空間AI團隊,成員既有來自搜狗的老同事,也有百度、快手、字節、阿里達摩院等互聯網大廠成員。
與搜狗等互聯網公司相比,理想仍沒脫離車企的“草莽”氣質——沒有架設云端服務器,甚至連基本的工作站也沒有,用戶的數據全在語音技術供應商思必馳手中。
團隊要做的第一件事,就是將數據所有權拿回,并在公司內部架設服務器,開始自己存儲數據。
與此同時,由于成員背景多元,團隊需要明確未來的發展方向,迅速提升這支團隊的戰斗力,只能專注于主線任務。有座艙AI同事張江回憶:“我們得到的目標是全力專注于自研,效果要比供應商好30%?!?/p>
其次,在團隊沒有成型時,空間AI團隊全部實行扁平化管理,確保信息溝通足夠迅速。要打破從大廠可能帶來的部門墻思維,通過流程和制度的變化來解決協作問題,讓更多人快速融入團隊。
理想所有的高層,都對座艙的推進保持了高度關注。座艙自研之初,空間AI團隊設想的一種發展路徑是,未來一到兩年內,讓理想同學的AI能力可以覆蓋車、門店、客服等等場景。
但據另一位理想座艙員工孫浩回憶,有一次李想參加了座艙團隊的LSA戰略分析會。會后,李想給了一個結論:不要把目前已經成熟的方案重做一遍。
“智能客服這種事,值不值得做,如果你能花錢買過來,你就去買,你不要再讓團隊再去支撐這樣業務。我們這個團隊是把理想同學的產品力度做好,解決車內交互的問題。”
空間AI團隊的任務變得更加聚焦——做好“理想同學”。
完成資源切換后,成果很快顯現。與供應商方案相比,自研技術的車內表現有了實質性的突破,用戶能感受到語音控制的便捷性得到了顯著提升,交互體驗變得更流暢自然。
2022年11月,空間AI團隊首次在理想ONE車型上完成了自研語音的落地。
等到理想L7首發的時候,搭載其上的語音和視覺功能已經全部是自研技術。2023年上半年,理想基本完成了座艙自研技術的切換,徹底擺脫對外部供應商的依賴。
2022年底,科技圈最大的一件事是,ChatGPT來了。
理想座艙團隊此前進行了一些預訓練工作,對大模型的到來有預判,但沒想到模型能發展到如此大的規模。當時,座艙的自研技術切換還沒有完成,OpenAI還是實行閉源,沒有人知道大模型應該怎么做。
在大模型出現前,語音交互主要是命令式或任務型的,行業競爭更多集中在語音識別的速度、執行的準確性和響應效率上。但那時候的AI助手認知能力仍然不足,尤其在復雜任務理解、知識問答、開放式對話上存在局限,這也制約了理想同學的產品力。
李想把座艙團隊的高管叫上開會,他給了一個自己的結論:ChatGPT對產業影響是摧枯拉朽的,所有人都在關注AI助手的語音識別速度、靈敏度和準確率,但這種東西永遠卷不出來。從用戶體驗的角度來看,沒有大模型的加持,這些指標只是低維度的競爭。
李想說,“AI助手的核心問題就是‘笨’,不做大模型怎么解決笨的問題?”
從這個時候開始,AI成為李想提及最高頻的詞之一。兩個月后,理想對內宣布,理想的愿景是“2030年,成為全球領先的人工智能企業”。雖然這一愿景后續有所變化,但理想汽車已經不再局限于“車企”的定位。
此時,大模型與座艙空間如何結合、解決什么問題,沒有任何可參考的樣本,需要座艙團隊自己從頭摸索。
可這不影響李想對大模型堅決的態度,他甚至要求下屬們參與“對賭”,還要講明白可以如何利用大模型滿足用戶,以及明確的交付時間點。
最終,理想座艙團隊提出了一個大模型上車的路線圖。
當時,所有人都沒有完全清楚這應該被稱為“智能體”,但團隊已經認為大模型是一種形態——作為大腦,可以連接各種工具和記憶、行動的組件。
2023年4月,座艙團隊向李想進行了一次匯報,并為它起好了名字--Mind GPT。兩個月之后,理想的空間AI團隊就交出了第一個版本——6月7日,家庭科技日活動上,李想對外證實了大模型MindGPT的存在。
代表理想進行分享的是空間AI負責人陳偉。
(陳偉)
他表示,Mind GPT使用了1.3萬億token,進行基座模型訓練,這相當于它具備了人類高質量知識的總和。當時,理想已經基本確定了場景,主要集中在出行娛樂、用車以及兒童教育,仍然是圍繞家庭用戶的需求做文章。
這些需求在內部被稱為“三助一師”,涵蓋了用戶用車助手、出行助手、娛樂助手及百科老師四個角色,理想甚至為這個新名詞注冊了多個商標。
后來,空間AI團隊又定下了2023年底大模型上車的新目標。整個團隊不僅要完成從0到1的大模型全鏈路技術突破,更要從0到1完成將大模型賦能給理想同學。
留給空間AI團隊的時間只有6個月,這個目標的難度非常大。
過去,空間AI團隊成員主要擅長開發功能單一、目標明確的小模型,現在卻要轉向研發功能復雜、需求不斷升級的大模型,并最終部署到汽車上,這本身就極具挑戰。更何況,當時的開源資源并不充足。
大模型時代不僅技術門檻高,其協作方式也發生了根本變化。整個研發流程涉及預訓練、后訓練、評估等多個環節,需要訓練、數據、底層工程等多方面能力的緊密協作,如何合理切割階段成為關鍵,切得太細協作低效,太粗人力不足傳統的“擊鼓傳花”式研發邏輯,每增加環節就導致效率下降和不可控性的上升。
這意味著,座艙AI團隊需要圍繞大模型重新定義關鍵崗位和角色,摒棄過去習慣的傳統互聯網大廠研發路徑,在同時推進大模型基座、訓練算法研發的同時,確保產品在各類車載場景下的體驗。
這不僅要解決算法的準確性問題,還需兼顧工程的執行效率等現實因素。
幾乎每周,理想都會對Mind GPT進行一次版本迭代,并同步集成到“理想同學”中進行升級,涉及與已有模塊的聯動和新策略的聯調。為了確保每次升級都能帶來體驗穩定提升,上線之前團隊都需要進行人工標注和測試驗證。
據理想座艙團隊的張棟回憶,“李想是一個非常愿意給資源的人。2023年,李想經常要求座艙AI團隊大膽提出資源或者算力的需求。預算上直接批了三四千張卡(芯片)的資源,團隊累計擁有近八千張卡?!?/p>
事實上,自研意味著要工作始終比行業快半步,甚至是一步。
2023年9月,座艙AI團隊還推出“方言自由說”功能。更令團隊感到興奮的是,多模態互動的落地,讓手勢控制進入座艙成為可能。在車內,用戶只需隨手一指,就能輕松控制車窗、空調、燈光甚至影音娛樂。
2023年底,Mind GPT隨著OTA 5.0版本更新成功“上車”,并通過國家大模型備案,是較早實際應用于車端的大語言模型之一。在Mind GPT加持之下,理想同學能夠理解更為復雜的功能組合,用戶交互更自然。
2024年1月,理想成立了AI委員會,由謝炎負責。
這個委員會里,包括產品部和各個研發部門的負責人及主要人員,目的是對未來的技術路線進行評審和判斷,以及對技術投資進行決策。
比如,決定是否在某個項目上立項。理想有一個面向研究的RD預算池,這個池子的資金分配,很大程度上就由技術委員會進行技術評審。
2024春季發布會上,理想推出首款純電車型MEGA;一個月后,公司啟動組織升級,CEO辦公室改名“產品與戰略群組”,設立產品線和質量運營兩個新部門。
這些變化都只為了AGI(通用人工智能)進入李想認為的“iPhone 4時刻”。
李想曾將OpenAI定義的聊天機器人認為是第一階段,第二階段是推理者,而進入上述時刻的第三階段是出現Agent,理想要做的就是將汽車作為載體實現AGI的Agent階段。
這也意味著,理想需要突破更底層的技術。
2024年10月,理想秋季戰略會上,車機端的理想同學的業務優先級由最高降低兩級,陳偉在2025年初被調任基座模型部門負責人,主導基座模型自研。
基座模型是蔚小理等新勢力爭奪AI時代的一張門票。今年4月,小鵬智駕負責人李力耘曾表示,小鵬目前已經著手推進72B超大規模參數世界基座模型的研發。
理想也不甘人后。今年3月,理想在英偉達2025春季GTC大會上宣布,在車端部署了參數為 22 億的 MindVLA大模型(Vision-Language-Action Model,視覺-語言-動作模型)。
據基座團隊向雷峰網反饋,內部不會追求一個超大規模的基座,要結合投入產出比以及場景結合度。(后續,雷峰網(公眾號:雷峰網)還將推出理想端到端、基座模型、芯片等自研話題,感興趣的讀者可添加編輯微信 Gru1993 互通有無)
過去的三年時間里,承擔理想基礎性技術研發工作的人是理想CTO謝炎。
加入理想前,謝炎曾在華為工作三年,期間升任消費者BG軟件部副總裁、終端OS部部長,他還曾作為AliOS首席架構師在阿里巴巴工作五年。與更側重產品的勾曉菲不同,謝炎將精力主要放在基礎設施和底層技術的研發上。
謝炎曾對他人表示,自己70%的時間都在操作系統和自研芯片。
2025年4月16日,理想汽車正式宣布開源理想星環OS,成為全球首家開源整車操作系統的車企。李想在微博上表示,開源的理想星環OS可以幫助任何一個品牌每年節省千萬甚至上億的成本。
目前來看,理想要重點打造兩款人工智能產品,理想同學用以實現Agent和自動駕駛用以實現L4級別的自動駕駛,并且基座模型發展到最后階段會融合成VLA模型。因此,基座模型被理想高層寄予了更高的期待。
在李想看來,車將從工業時代的交通工具,進化成為AI時代的空間機器人。
從2021年決定自研起,從智能駕駛到理想同學,所有的一切工作都是指向了未來的AI世界。(注:文中的張江、孫浩、張棟等皆為化名。)
Copyright 2019 爭強斗狠網. All Rights Reserved 網站地圖