· 44 min read

揭秘特斯拉FSD隱秘護城河:地球上最安全的AI。為什麼別家訓練出來的模型都是假的?

video
play

開場:特斯拉真正的護城河在哪?

特斯拉 FSD 亮眼的路測表現,主流媒體通常歸因於「數據優勢」或「算力優勢」。但其實,特斯拉還有一條鮮為人知、卻極難複製的護城河。你知道是什麼嗎?

大家好,我是小梗。今天為大家解讀 X 上的一篇文章,標題是《特斯拉隱藏的護城河:地球上最安全的 AI——而其他所有人都在訓練假模型》。作者網名 Genma,是一位資深自動駕駛工程師,我以前解讀過他的其他文章。他的核心論點是:目前市面上幾乎所有自動駕駛公司,除了特斯拉,都在用一種從根本上就有缺陷的方法訓練 AI。

一聽到「自動駕駛」「模型」,很多人會覺得這是程序員才關心的技術話題。但作為投資者,我們必須面對一個現實:特斯拉如今的萬億市值,傳統汽車估值模型早就解釋不通。市場願意給它如此高的溢價,賭的就是 FSD 全面鋪開後,幾百萬輛車原地變身 Robotaxi、自動印鈔的未來。

而這個商業邏輯能不能落地,不取決於馬斯克畫的餅有多大,只取決於一個最硬核的指標:安全性——而且是高到足以應對各種極限突發狀況的安全性。

今天的內容不需要任何技術背景。我會用最樸實的邏輯,讓你理解特斯拉在做什麼、為什麼這件事很難被複制,以及這對你作為投資者意味著什麼。

AI 本質上是什麼?把神秘感先打掉

我們從最基礎的開始。

很多人一聽到 AI、神經網絡、深度學習這些詞,就覺得很神秘,很高深。其實不是。我們今天把它徹底祛魅。

一個 AI,特別是特斯拉用來做 FSD 的那種 AI,本質上是什麼?

作者的原話說得非常直白:它不是魔法,它就是一大堆簡單的算術運算,僅此而已。

打個比方:你家廚房裡有一個菜譜。菜譜上寫著:放多少鹽、放多少油、炒多少分鐘。按照菜譜來,你就能做出一道菜。

AI 的工作方式類似。只不過這個「菜譜」裡有幾億個數字,而做的「菜」不是紅燒肉,而是「看到這個路況,方向盤應該轉幾度,油門應該踩多少」。

更具體一點:特斯拉的車上有 8 到 9 個攝像頭。每個攝像頭拍到的畫面,其實就是一大堆數字——每個像素點記錄了多少紅光、多少綠光、多少藍光。這些數字進入神經網絡,經過層層運算,最後輸出幾個數字:方向盤轉多少度、加速多少、剎車多少。

那中間這些「層層運算」是什麼呢?就是乘法和加法。

比如說,第一層神經元的輸出是 4,然後乘以一個叫做「權重」的數字,假設權重是 1,再加上一個叫做「偏置」的數字,假設偏置是 1,結果就是 4×1+1=5。

另一個神經元的輸出是 2,權重是 2,偏置是 3,結果是 2×2+3=7。

然後把 5 和 7 加在一起,得到 12。

這個 12 就成為下一層神經元的輸入,然後繼續做同樣的乘法加法……一層一層,重複幾百萬次。

這就是所謂的「深度學習」:深,就是層數多;學習,就是那些權重和偏置是通過訓練調整出來的。

這個過程在技術上有個名字叫 MAC 運算,也就是乘累加運算。

作者的結論是:神經網絡就是一條巨大的乘法加法鏈條,沒有別的了。它能不能聰明地開車,完全取決於那幾億個權重和偏置有沒有被調到正確的值。

而調整這些權重和偏置的過程,叫做訓練。真正的硬仗,在訓練。

訓練到底在幹嘛?幾億個數字怎麼「調對」

我們繼續深入。

特斯拉的 FSD 神經網絡,目前有幾億個參數,也就是那些權重和偏置。最新版本的模型甚至有高達 10 倍於此的參數量。

幾億個數字,每一個都需要調到最合適的值,這怎麼做到?

第一步,你得告訴 AI 什麼叫「開得好」。你需要給它一個目標,或者說一個評分標準。

作者的類比很好:想象一個駕校教練坐在副駕駛席上給 AI 打分。如果 AI 做了危險的動作,或者闖紅燈,或者追尾了,教練給高分(但這裡的「高分」是壞事,叫做「損失」或者「代價」)。如果 AI 開得平穩、守規則、跟車合理,代價就低。訓練的目標,就是讓這個代價儘量小。

特斯拉用的方法,是用真實的人類駕駛數據來定義這個代價。他們有幾百萬小時的人類駕駛視頻。訓練的邏輯是:人類怎麼開的,就是最好的開法。AI 開得越像人類,代價越小;越不像人類,代價越大。

這就是為什麼 FSD 開起來非常有「人味」——因為它就是從人類的駕駛習慣裡學出來的。

那怎麼找到那幾億個權重,讓代價最小?方法叫做「梯度下降」。

再打一個比方:想象你站在一座山上,蒙著眼睛,想要走到山谷裡(山谷就是代價最低的地方)。你的辦法是:每一步,先用腳感受一下地面,判斷哪個方向是向下的坡,然後往那個方向邁一步。不斷重複,你最終會走到山谷。

梯度下降就是這個邏輯。每次給 AI 看一批駕駛視頻,讓 AI 運算一遍,算出代價,然後用數學方法計算:如果把每個權重稍微調大一點點或者調小一點點,代價會怎麼變?這個方向就叫梯度。然後,所有權重都往減小代價的方向,調那麼一小步。

這個過程叫做一個「epoch(輪次)」。特斯拉要做幾千輪。

每一輪,需要對幾億個權重都計算梯度,工作量是天文數字。這就是為什麼英偉達那麼值錢——他們的 GPU 芯片,是目前世界上最適合做這種計算的硬件。

訓練完成之後,AI 在你拿來訓練的那些視頻上,肯定表現很好。但誰也不知道它面對新情況會怎麼反應——萬一它「死記硬背」了,在沒見過的情況下亂來怎麼辦?這個問題叫做「過擬合」。

所以特斯拉和其他所有公司的做法,是把數據分成兩份:90% 用來訓練,10% 藏起來,訓練完了再拿出來測試——這 10% 的數據,AI 從來沒有見過,你拿它來測,就知道 AI 的真實水平。這 10% 叫做「驗證集」。

到這裡,訓練的大框架你已經明白了。

接下來,就是今天最關鍵的部分。

房間裡的大象:訓練完了,為什麼不能直接上車?

訓練完成了,你是不是以為可以把這個 AI 直接裝進車裡了?

不行。

這裡有一個巨大的、令人頭疼的問題,幾乎沒有人公開談論過。作者把它叫做「房間裡的大象」——每個人都能感受到它的存在,但沒有人正視它。

問題出在哪裡?

訓練在哪裡進行的?英偉達的 GPU 服務器上。

這些服務器用的是什麼類型的數字?浮點數。也就是帶小數點的數字,比如 3.14159,或者 150.7。浮點數的好處是精度高,可以表達非常微小的差別。訓練需要這種精度。

但是車裡的 AI 芯片呢?它運行的時候,不能用浮點數。為什麼?因為浮點運算耗電太多。車裡的芯片必須在極低功耗下運行,而且要極快。所以車裡的芯片只能用整數——3、12、255 這樣的完整數字,沒有小數。

於是就出現了一個問題:你在英偉達的服務器上,用浮點數訓練出來了一個看起來完美的 AI 模型。但是你要把它裝進車裡,車裡只能用整數。怎麼辦?

大多數公司的做法是:把浮點數強行轉換成整數。

舉個例子:一個權重的值是 150.5。你把它轉成整數,就變成 150 或者 151。誤差很小,看起來沒什麼大不了的。

但還有更極端的情況:一個權重的值是 1520.52。但整數芯片每個格子最大隻能放 255,也就是 8 位整數,根本放不下。

這時候就要用「縮放」技巧:找到這一層權重裡最大的數,選一個縮放比例,讓最大值能壓縮進 0 到 255 的範圍裡。比如最大值是 1520,那就選一個係數大約是 6,讓所有數字都除以 6,使最大值變成 253 左右,勉強塞進去。

但這個縮放會帶來兩個問題:

  1. 縮放係數本身是個近似值,會引入誤差。
  2. 更嚴重的是:同樣的縮放比例,對大數字影響小,對小數字影響大。比如另一個權重是 0.3,除以 6 變成 0.05,四捨五入直接變成 0——這個權重的信息完全丟失了。

這樣轉換之後,進入車裡的模型,和你訓練時的模型,已經不是同一個東西了。

這就像把一張精確到毫米的地圖縮印成小圖標:主要的道路輪廓還在,但那些細小的街巷全部消失了。而模型裡那些「細小的街巷」,往往是它在極端場景下做出正確判斷的關鍵。

「聰明」一點的公司,知道這個問題,所以他們用一種叫做 QAT 的技術——「量化感知訓練」。意思是,從訓練一開始,就讓 AI 學著適應整數的限制,而不是等訓練完了再去轉換。

但即使是 QAT,也解決不了根本問題。

量化尾:看不見、摸不著,卻可能致命的縫隙

為什麼 QAT 也不行?

因為你在英偉達 GPU 上模擬的運算,和車裡真實芯片的運算,是兩套邏輯。

作者打了個比方:計算「5 加 5 再除以 2」。

車裡用的是特斯拉自己的 AI4 芯片,它可能是這樣算的:先算 5+5=10,再除以 2,結果是 5。

但英偉達的 GPU 可能是這樣算的:先算 5 除以 2,取整後等於 2,再加上 2,結果是 4。

同樣的運算,兩臺機器算出不一樣的結果。

為什麼會這樣?因為除以 2 其實就是那個縮放技巧,為了讓大數字能塞進小格子裡。不同的芯片,對這個縮放的處理方式不同。

更復雜的是,英偉達 GPU 的寄存器通常是 32 位的,可以存非常大的數字,40 億以上都沒問題。而車載芯片的格子,也就是寄存器,可能是 16 位的,最大隻能存 65535。當數字超過上限時,就會「飽和」——不再增加,直接卡在上限。這個「飽和點」不同,最終結果也會不同。

還有很多其他微小的差別,加在一起,讓兩臺機器的運算結果存在系統性的差異。

要讓英偉達 GPU 完全模擬車載芯片的行為,幾乎是不可能的。你需要繞開英偉達自己的優化軟件 CUDA,自己寫一套編譯器,強制英偉達按照車載芯片的運算順序來。這不僅非常慢,而且即使你做到了,你還需要驗證你的模擬器本身是對的——驗證過程本身又是一個循環悖論。

所以無論你用什麼方法,在英偉達 GPU 上訓練出來的模型,和真正跑在車載芯片上的模型,之間永遠存在一個縫隙。

在大多數普通路況下,這個縫隙沒有問題。

但在極端、罕見的情況下——那些 AI 從來沒見過的奇怪場景,也就是工程師們說的「長尾」情況——這個縫隙可能導致災難性的錯誤。

這個縫隙,就叫做「量化尾」。

唯一正確的解法:特斯拉 Cortex 的閉環訓練

現在你已經明白了量化尾是什麼問題。那其他公司怎麼處理這個問題?

大多數公司的做法是:用 QAT 訓練,也就是讓模型學著適應整數,然後拿出那 10% 的驗證集,在真實的車載芯片上跑一遍,看看有沒有出現明顯錯誤。

這個方法有兩個根本缺陷:

  1. 你只在 10% 的數據上測試了真實芯片的行為。那另外 90% 的數據,真實芯片從來沒有跑過。你根本不知道那 90% 的情況下,真實芯片會怎麼表現。
  2. 你訓練時優化的是一個「假」模型——英偉達上的模型。你從來沒有針對真實車載芯片的行為做過優化。訓練出來的最優解,是英偉達版本的最優解,不是車載芯片版本的最優解。

打個比方:就像你要從 100 個人裡選出馬拉松選手。你只在真實跑道上測試了其中 10 個人,另外 90 個人你只在跑步機上看了看他們的表現。跑步機上的表現和真實跑道完全不同——步頻、步幅、甚至誰會摔倒,都可能是兩回事。你把那 90 個「跑步機冠軍」選進隊伍,根本不知道他們在真實路面上會不會摔跟頭。

那為什麼不把 100% 的數據都在真實芯片上跑?

答案是:太貴了。

這個在真實芯片上跑數據、檢查結果的過程,有個名字叫 Hardware-in-the-Loop,也就是「硬件在迴路中」。真實的車載芯片是按照即時駕駛速度設計的,它沒有辦法比實際駕駛快。

如果你有 1000 小時的駕駛視頻,你需要一塊真實芯片跑 1000 小時來檢查。

特斯拉需要驗證的,是幾十億英里的駕駛數據。按照這個速度,你需要幾萬塊真實芯片並行運行,才能在合理的時間內完成。

你需要建一個巨型超級計算機,裡面塞滿跟車裡一樣的芯片。

這就是特斯拉做的事情。

特斯拉建造了一個叫做 Cortex 的超級計算中心。裡面有大約 4 萬塊 AI4 芯片,混合著大約 9 萬塊英偉達 H100 GPU。

AI4 芯片,就是特斯拉車裡裝的那塊推理芯片。H100,是英偉達目前最強的訓練芯片。

但特斯拉不僅僅用 Cortex 來驗證模型。它還做了一件任何其他公司都沒有做過的事:

把真實的 AI4 芯片,直接塞進訓練循環裡。

訓練被拆成兩半:推理在車載芯片上,優化交給 H100

回到前面講的梯度下降。每一輪訓練,你要做兩件事:

  1. 把駕駛視頻餵給 AI,讓 AI 運算一遍,得出結果(這叫做推理,inference)。
  2. 根據結果計算代價,計算梯度,調整權重(這是梯度下降的核心,需要大量計算)。

特斯拉的做法是:第二件事,繼續在英偉達 H100 上做,因為英偉達在這方面是無敵的。

但第一件事——推理——特斯拉改成在真實的 AI4 芯片上做。

這意味著什麼?

這意味著訓練的每一步,AI 的行為都是在真實的車載芯片上產生的。你不是在優化一個英偉達版本的假模型,你是在直接優化真實芯片的行為。訓練出來的結果,就是車裡芯片實際運行的結果,沒有任何轉換,沒有任何縫隙。

回到馬拉松的例子,這種做法的巧妙之處在於,它把訓練拆成兩半:

  • 「產生行為」——這部分必須在真實芯片上完成,就像選手必須在真實跑道上跑。
  • 「分析優化」——這部分交給英偉達 H100,就像教練團隊用超級計算機分析每一步數據、制定下一階段的訓練方案。

選手跑的是真實路面,但背後的「大腦」是最強的計算工具。兩者配合,既真實又高效。

於是,量化尾消失了。

100% 的數據,都在真實芯片上跑過了。訓練時的代價函數,反映的是真實芯片的真實行為。訓練出來的模型,就是最終部署的模型,完全一致。

作者的結論是:這是目前全世界唯一真正正確的方法。其他所有公司,包括 Wayve、小鵬,以及英偉達自己的車載芯片生態,都還在用「訓練假模型,然後希望它足夠好」的方法。

作者原文說得很直接:「當涉及安全時,寄希望於運氣,絕不是可行之道。」

馬斯克的側面證實:一個「小眾但非常重要」的細節

這不只是這位作者的個人判斷。馬斯克自己說過這件事。

在 2025 年特斯拉股東大會上,馬斯克說了這樣一段話(意譯):

「而且我們,我認為這是我們獨有的,有一套基於整數的系統。整數運算從根本上比浮點運算更高效。所以我們可以做浮點,但我們的推理絕大部分是用整數完成的……但你實際上必須針對整數推理來訓練,而其他所有人都是針對浮點來訓練的。這是一個比較小眾的技術細節,但實際上非常重要。」

這是馬斯克第一次公開說出這件事。「這是一個小眾的技術細節,但實際上非常重要。」——這句話本身就很能說明問題。他知道大多數人聽不懂,但他還是說了,因為他認為這是特斯拉真正的差異化。

更早一些,在 2024 年,馬斯克發過這樣一條推文,大意是:

「重要的是,我們在訓練循環中同時使用特斯拉 HW4 AI 計算機和英偉達 GPU,目前比例大約是 1:2。另外,我們把 Hardware 4(HW4)改名為 Artificial Intelligence 4(AI4)。」

作者說,他看到這條推文的時候,立刻意識到馬斯克在做什麼。然後他做了一個決定,全倉買入特斯拉。

他後來還發布了一篇關於量化尾的分析,說 QAT 可以讓你在基準測試上表現接近,但無法給你在長尾情況下的確定性零縫隙行為。特斯拉的完整訓練流程——H100 加上 AI4 推理芯片加上整數原生訓練軟件——是一個閉合的迴路,沒有任何其他公司複製過。

結果,馬斯克本人給那篇推文點了贊。

作者說:這證實了一切。量化尾是真實存在的,馬斯克知道它,而且他已經解決了它。

為什麼其他公司不這麼幹?不是不會,是不想、也不敢

你可能會問:這個方法這麼好,為什麼其他公司不做?

有幾個原因。

第一,認知問題。
很多公司,包括學術界,用 QAT 訓練已經能拿到很好的基準測試成績。看起來夠好,就不覺得有必要再往前走。他們沒有意識到,或者不願意承認,在真實的極端場景下,他們的模型和真實芯片之間的縫隙,會是一個致命的問題。

第二,資源問題。
要把真實的 AI 推理芯片塞進訓練循環,你需要幾萬塊這種芯片並行運行。這不光是錢的事,這需要的是大規模建設基礎設施的意願和能力。

特斯拉在這件事上做出了一個非常大膽的賭注:投入鉅額資金建造 Cortex,裡面放 4 萬塊 AI4 芯片。這種投入,不是任何一個車企、甚至很多科技公司能夠做到的。

第三,商業邏輯問題。
對於很多公司來說,「差不多夠好」是一個合理的商業決策。他們的目標不是做出最安全的 AI,而是做出一個能夠上市的產品,佔領市場,然後慢慢迭代。這個邏輯,在對安全要求不高的場景裡可能可以。

但自動駕駛不一樣。一個「差不多」的自動駕駛系統,在大部分情況下表現良好,但在極端情況下會出事——這不是可以接受的產品。一次嚴重的事故,不僅會造成人員傷亡,還會讓整個自動駕駛行業倒退好幾年。

這也是為什麼作者說:「安全在特斯拉不是一句口號,它從一開始就被內置進了架構裡。」

投資者視角:這條護城河到底有多深?

技術部分講完了,現在來講對你最重要的部分——這對你作為一個投資者意味著什麼。

我們來系統性地看幾件事。

1. 這個護城河是否真實存在?

根據我們今天講的內容,答案是肯定的。這不是營銷話術,不是空泛的「數據優勢」,而是一個可以精確描述的技術實現:把真實的 AI 推理芯片放進訓練循環,實現零縫隙的訓練-部署一致性。

馬斯克已經公開確認了這個策略,而且 Cortex 的建設也是公開的。

2. 這個護城河有多難被複制?

複製這個護城河,需要以下幾件事同時成立:

  • 你需要有自己的 AI 推理芯片,而且這個芯片要真正大規模量產、在實際產品中使用,不是實驗室的原型;
  • 你需要建造一個包含幾萬塊這種芯片的超級計算中心;
  • 你需要重寫你的整個訓練軟件棧,把整數原生運算融入訓練循環的每一步。

這每一步都需要鉅額投入和很長的時間。更關鍵的是,你需要先認識到這個問題的重要性,才會去做這件事。而作者的觀點是:大多數公司目前還沒有認識到這個問題有多嚴重。

他說:「其他公司最終會意識到——在幾年之後經歷了無數邊緣案例的失敗之後——經典的『在英偉達上訓練,量化,部署』方法從根本上有多麼錯誤。」

3. 對特斯拉商業價值的影響有多大?

從兩個維度看。

短期維度:
FSD 的安全性,是 Robotaxi 商業化的前提條件。如果 FSD 有量化尾導致的隱患,Robotaxi 就無法真正實現無人監督運營。反過來,如果特斯拉的 FSD 確實是目前唯一真正閉合了訓練-部署縫隙的系統,那它的安全性確實要高於競爭對手——而這是監管批准、商業化落地的關鍵因素。

長期維度:
自動駕駛技術的壁壘,一旦建立,是非常難以撼動的。就像當年的搜索引擎——谷歌用更好的算法建立了優勢,之後幾十年沒有人追上來。自動駕駛的訓練數據飛輪加上技術架構的優勢,可能形成類似的護城河:更安全的系統吸引更多用戶,更多用戶產生更多數據,更多數據讓系統更安全。

4. 風險在哪裡?

任何投資分析都必須提風險。

  • 技術風險: 我們今天講的,主要來自一位工程師的分析,以及馬斯克的公開表態。特斯拉沒有發表過經過同行評審的學術論文來證明這些主張。這個技術路線是否真的如作者所說那麼有效,仍然需要時間驗證。
  • 競爭風險: 英偉達等公司有可能開發出更好的模擬工具,讓其他公司能夠在軟件層面更好地彌合量化尾問題,而不需要把真實芯片放進訓練循環。技術壁壘有時候會被新的技術路線繞過。
  • 執行風險: 即使技術優勢是真實的,Robotaxi 的大規模商業化還需要克服監管、用戶接受度、定價、運營效率等大量非技術挑戰。技術領先不等於商業成功。
  • 估值風險: 特斯拉現在的估值,已經包含了對 Robotaxi 和 AI 未來的大量期望。即使這些預期都實現了,如果實現速度比市場預期慢,股價也可能承壓。

5. 一個簡單的判斷框架

對於普通散戶投資者,我建議用這樣的框架來思考這件事:

  1. 先問自己:你是否相信自動駕駛會在未來 10 年內大規模商業化?如果不相信,那特斯拉的這個技術優勢對你來說意義不大。如果相信,那接下來的問題是:誰會贏?
  2. 其次問:技術壁壘是否是贏家決定因素?在自動駕駛這個領域,安全性是最終的競爭維度。做不到足夠安全,你就無法獲得監管批准,無法商業化,無法建立用戶信任。
  3. 然後問:特斯拉的技術優勢是否可持續?今天我們講的內容,提供了一個可以自我強化的優勢:更好的訓練方法產生更安全的模型,更安全的模型讓更多用戶信任 FSD,更多用戶產生更多數據,更多數據支持更好的訓練。這個飛輪,是很難打破的。
  4. 最後問:估值有沒有充分反映這些預期,甚至過度反映了?這個問題,你需要結合自己的持倉比例和風險承受能力來回答。

競爭格局:Waymo、Wayve、小鵬和英偉達都在哪個段位?

我們再對原文內容做一點擴展,具體看看競爭對手的情況,這樣你對特斯拉的相對位置會更清晰。

Waymo
這是目前被很多人認為技術最成熟的 Robotaxi 公司。Waymo 的策略是用激光雷達加攝像頭的多傳感器融合、高精度地圖,以及嚴格限定的運營區域。他們在舊金山、鳳凰城等城市已經有商業化運營。

但 Waymo 面臨的問題是:他們的方案嚴重依賴預先建立的高精度地圖,這限制了他們的規模化速度。而且 Waymo 並沒有自己的大規模量產車輛,數據收集不如特斯拉。

從今天講的技術維度來看,Waymo 的 AI 訓練方式,也是傳統的「在英偉達訓練,量化,部署」的方式。量化尾的問題,Waymo 同樣存在。

Wayve
這是一家英國的自動駕駛 AI 公司,最近獲得了大量資金,也採用了端到端學習的路線。作者在原文中明確提到了 Wayve,說他們也是在「希望假模型足夠好」的那一類公司。

小鵬
這是中國最激進的在追趕特斯拉 FSD 路線的公司之一。他們放棄了激光雷達,轉向純視覺,這和特斯拉的路線非常接近。他們的數據收集規模,也在快速增長。

小鵬已於 2025 年推出自研的圖靈 AI 芯片,單顆算力相當於三顆英偉達 Orin X,並搭載在量產車型 G7 上。這是小鵬在芯片自主化上的重要突破。但需要注意的是,自研推理芯片並不等於解決了訓練-部署一致性的問題——小鵬的模型訓練仍然在雲端英偉達 H100 上進行,訓練芯片和車載推理芯片依然不同。因此在這個關鍵維度上,他們和 Waymo、Wayve 一樣,同樣面臨「量化尾」的問題。

英偉達 Drive 生態
英偉達最近推出了自己用於車載的 Drive 芯片系列,比如 Alpamayo。但作者指出,即使英偉達用自己的車載芯片,「雲端訓練模型」和「車載模型」之間的縫隙仍然存在,因為雲端訓練用的是 H100 這樣的數據中心 GPU,不是 Drive 車載芯片。

綜合來看,競爭對手在這個特定的技術維度上,都還沒有追上特斯拉。而且複製這個優勢需要的時間和投入,給了特斯拉相當大的時間窗口。

Cortex 和 Cybercab:技術怎麼落到商業上

再聊兩個具體的事情,幫助你把今天學到的內容和特斯拉的商業計劃連接起來。

Cortex:特斯拉的「AI 發電廠」

Cortex 是特斯拉在得克薩斯州建造的超級計算中心。原始 Cortex 已於 2024 年底完成部署,內含約 4 萬塊 AI4 芯片和 9 萬塊英偉達 H100 GPU。到 2026 年,特斯拉又建造了 Cortex 2.0,GPU 規模擴大到約 10 萬塊 H100/H200,總容量達 500MW。

作者說,當他看到馬斯克宣佈 AI4 芯片放進訓練循環的時候,他意識到 Cortex 不只是一個訓練計算中心,而是整個訓練範式的體現:用真實硬件來訓練,確保訓練和部署之間零縫隙。

在芯片路線圖方面,特斯拉正在研發 AI5 芯片,算力是 AI4 的約 10 倍。AI5 已於 2026 年 4 月完成流片,但量產時間推遲到了 2027 年中期。這意味著 Cybercab 將以 AI4 硬件上市,AI5 會在後續版本中引入。

建造 Cortex 需要多少錢?特斯拉財報沒有單獨披露 Cortex 的建造成本,只公佈了整體資本支出:2025 年全年約 85 億美元,2026 年計劃大幅提升至 250 億美元,AI 基礎設施是其中的主要方向。單看 GPU 部分,按市價就是幾十億美元。加上 AI4 芯片、基礎設施、能源,Cortex 的總投入可能達到百億美元量級。

這種規模的投入,不是靠「講故事+融資」就能輕易模仿的。

Cybercab:沒有方向盤的 Robotaxi

Cybercab 是特斯拉專門為 Robotaxi 設計的車型,沒有方向盤,沒有踏板,完全依賴 FSD。

作者原文寫這篇文章時,Cybercab 還在測試階段。而從目前進展來看,作者的判斷已經得到了一定程度的驗證:特斯拉於 2025 年 6 月在奧斯汀正式推出 Robotaxi 服務(初期用 Model 3 和 Model Y),同年 12 月升級為無人監督運營,到 2026 年 1 月已累計完成超過 70 萬英里的付費里程。Cybercab 專用車型的量產也於 2026 年 4 月啟動,服務正在擴展到達拉斯、邁阿密、拉斯維加斯等更多城市。

這背後的邏輯是:用真實 AI4 芯片訓練的 FSD,在 Cortex 的驗證環境裡,特斯拉已經精確知道它的安全表現。所以德克薩斯州的 Robotaxi 測試,並不是在驗證基本安全性,而是在打磨乘客體驗、接送流程、運營效率這些商業層面的事情。事實上,從「有人監督」到「無人監督」只用了半年,這個節奏支持了作者的判斷。

當然,實際的商業化進程,還取決於大量其他因素:監管批准、地圖覆蓋、運營支持……這些都需要時間。

總結:你需要記住的 5 件事

最後我們把今天的內容壓縮成幾條你可以帶走的結論。

第一點:AI 的本質是乘法加法,訓練是調參數。
這不是魔法。理解了這一點,你就能明白為什麼「訓練」和「部署」之間會有差異。

第二點:量化尾是真實存在的問題。
所有在英偉達 GPU 上訓練、然後量化成整數部署到車載芯片上的 AI,都存在訓練模型和實際運行模型之間的縫隙。這個縫隙在大多數情況下無關緊要,但在長尾的極端場景下,可能是致命的。

第三點:特斯拉是目前唯一解決了這個問題的公司。
他們建造了 Cortex,把 4 萬塊真實的 AI4 車載芯片放進了訓練循環,確保訓練和部署完全一致,量化尾縫隙清零。馬斯克本人在股東大會上明確描述了這個策略,並把它稱為「小眾但非常重要的技術細節」。

第四點:這條護城河成本極高、時間極長。
要複製這個優勢,你需要有自己大規模量產的 AI 推理芯片,需要建造包含幾萬塊這種芯片的超級計算中心,需要重寫整個訓練軟件棧。這不是幾年能完成的事。

第五點:對投資者的意義取決於你的假設。
如果你相信自動駕駛會大規模商業化,而且相信安全性是決定性的競爭維度,那特斯拉在這個維度上的優勢,是真實的、可持續的,並且難以被複制的。但這個優勢要轉化成股價上漲,還需要 Robotaxi 真正商業化,而商業化的時間線和規模,仍然充滿不確定性。

最後引用作者的一句話,我認為說得非常好:

「對於自己的 AI 有多安全,特斯拉在部署之前就清楚地知道了。」

不要被競爭對手炫酷的演示視頻所迷惑。訓練一個神經網絡讓它能夠開車,現在已經相對容易了。真正的難點,是把長尾情況做到極致——那些佔比不到 1%、但一旦出錯就可能致命的極端場景。

特斯拉解決了這個問題。

而其他人,還做不到。

    Share:
    返回文章列表