揭秘特斯拉FSD隱秘護城河：地球上最安全的AI。為什麼別家訓練出來的模型都是假的？

開場：特斯拉真正的護城河在哪？

特斯拉 FSD 亮眼的路測表現，主流媒體通常歸因於「數據優勢」或「算力優勢」。但其實，特斯拉還有一條鮮為人知、卻極難複製的護城河。你知道是什麼嗎？

大家好，我是小梗。今天為大家解讀 X 上的一篇文章，標題是《特斯拉隱藏的護城河：地球上最安全的 AI——而其他所有人都在訓練假模型》。作者網名 Genma，是一位資深自動駕駛工程師，我以前解讀過他的其他文章。他的核心論點是：目前市面上幾乎所有自動駕駛公司，除了特斯拉，都在用一種從根本上就有缺陷的方法訓練 AI。

一聽到「自動駕駛」「模型」，很多人會覺得這是程序員才關心的技術話題。但作為投資者，我們必須面對一個現實：特斯拉如今的萬億市值，傳統汽車估值模型早就解釋不通。市場願意給它如此高的溢價，賭的就是 FSD 全面鋪開後，幾百萬輛車原地變身 Robotaxi、自動印鈔的未來。

而這個商業邏輯能不能落地，不取決於馬斯克畫的餅有多大，只取決於一個最硬核的指標：安全性——而且是高到足以應對各種極限突發狀況的安全性。

今天的內容不需要任何技術背景。我會用最樸實的邏輯，讓你理解特斯拉在做什麼、為什麼這件事很難被複制，以及這對你作為投資者意味著什麼。

AI 本質上是什麼？把神秘感先打掉

我們從最基礎的開始。

很多人一聽到 AI、神經網絡、深度學習這些詞，就覺得很神秘，很高深。其實不是。我們今天把它徹底祛魅。

一個 AI，特別是特斯拉用來做 FSD 的那種 AI，本質上是什麼？

作者的原話說得非常直白：它不是魔法，它就是一大堆簡單的算術運算，僅此而已。

打個比方：你家廚房裡有一個菜譜。菜譜上寫著：放多少鹽、放多少油、炒多少分鐘。按照菜譜來，你就能做出一道菜。

AI 的工作方式類似。只不過這個「菜譜」裡有幾億個數字，而做的「菜」不是紅燒肉，而是「看到這個路況，方向盤應該轉幾度，油門應該踩多少」。

更具體一點：特斯拉的車上有 8 到 9 個攝像頭。每個攝像頭拍到的畫面，其實就是一大堆數字——每個像素點記錄了多少紅光、多少綠光、多少藍光。這些數字進入神經網絡，經過層層運算，最後輸出幾個數字：方向盤轉多少度、加速多少、剎車多少。

那中間這些「層層運算」是什麼呢？就是乘法和加法。

比如說，第一層神經元的輸出是 4，然後乘以一個叫做「權重」的數字，假設權重是 1，再加上一個叫做「偏置」的數字，假設偏置是 1，結果就是 4×1+1=5。

另一個神經元的輸出是 2，權重是 2，偏置是 3，結果是 2×2+3=7。

然後把 5 和 7 加在一起，得到 12。

這個 12 就成為下一層神經元的輸入，然後繼續做同樣的乘法加法……一層一層，重複幾百萬次。

這就是所謂的「深度學習」：深，就是層數多；學習，就是那些權重和偏置是通過訓練調整出來的。

這個過程在技術上有個名字叫 MAC 運算，也就是乘累加運算。

作者的結論是：神經網絡就是一條巨大的乘法加法鏈條，沒有別的了。它能不能聰明地開車，完全取決於那幾億個權重和偏置有沒有被調到正確的值。

而調整這些權重和偏置的過程，叫做訓練。真正的硬仗，在訓練。

訓練到底在幹嘛？幾億個數字怎麼「調對」

我們繼續深入。

特斯拉的 FSD 神經網絡，目前有幾億個參數，也就是那些權重和偏置。最新版本的模型甚至有高達 10 倍於此的參數量。

幾億個數字，每一個都需要調到最合適的值，這怎麼做到？

第一步，你得告訴 AI 什麼叫「開得好」。你需要給它一個目標，或者說一個評分標準。

作者的類比很好：想象一個駕校教練坐在副駕駛席上給 AI 打分。如果 AI 做了危險的動作，或者闖紅燈，或者追尾了，教練給高分（但這裡的「高分」是壞事，叫做「損失」或者「代價」）。如果 AI 開得平穩、守規則、跟車合理，代價就低。訓練的目標，就是讓這個代價儘量小。

特斯拉用的方法，是用真實的人類駕駛數據來定義這個代價。他們有幾百萬小時的人類駕駛視頻。訓練的邏輯是：人類怎麼開的，就是最好的開法。AI 開得越像人類，代價越小；越不像人類，代價越大。

這就是為什麼 FSD 開起來非常有「人味」——因為它就是從人類的駕駛習慣裡學出來的。

那怎麼找到那幾億個權重，讓代價最小？方法叫做「梯度下降」。

再打一個比方：想象你站在一座山上，蒙著眼睛，想要走到山谷裡（山谷就是代價最低的地方）。你的辦法是：每一步，先用腳感受一下地面，判斷哪個方向是向下的坡，然後往那個方向邁一步。不斷重複，你最終會走到山谷。

梯度下降就是這個邏輯。每次給 AI 看一批駕駛視頻，讓 AI 運算一遍，算出代價，然後用數學方法計算：如果把每個權重稍微調大一點點或者調小一點點，代價會怎麼變？這個方向就叫梯度。然後，所有權重都往減小代價的方向，調那麼一小步。

這個過程叫做一個「epoch（輪次）」。特斯拉要做幾千輪。

每一輪，需要對幾億個權重都計算梯度，工作量是天文數字。這就是為什麼英偉達那麼值錢——他們的 GPU 芯片，是目前世界上最適合做這種計算的硬件。

訓練完成之後，AI 在你拿來訓練的那些視頻上，肯定表現很好。但誰也不知道它面對新情況會怎麼反應——萬一它「死記硬背」了，在沒見過的情況下亂來怎麼辦？這個問題叫做「過擬合」。

所以特斯拉和其他所有公司的做法，是把數據分成兩份：90% 用來訓練，10% 藏起來，訓練完了再拿出來測試——這 10% 的數據，AI 從來沒有見過，你拿它來測，就知道 AI 的真實水平。這 10% 叫做「驗證集」。

到這裡，訓練的大框架你已經明白了。

接下來，就是今天最關鍵的部分。

房間裡的大象：訓練完了，為什麼不能直接上車？

訓練完成了，你是不是以為可以把這個 AI 直接裝進車裡了？

不行。

這裡有一個巨大的、令人頭疼的問題，幾乎沒有人公開談論過。作者把它叫做「房間裡的大象」——每個人都能感受到它的存在，但沒有人正視它。

問題出在哪裡？

訓練在哪裡進行的？英偉達的 GPU 服務器上。

這些服務器用的是什麼類型的數字？浮點數。也就是帶小數點的數字，比如 3.14159，或者 150.7。浮點數的好處是精度高，可以表達非常微小的差別。訓練需要這種精度。

但是車裡的 AI 芯片呢？它運行的時候，不能用浮點數。為什麼？因為浮點運算耗電太多。車裡的芯片必須在極低功耗下運行，而且要極快。所以車裡的芯片只能用整數——3、12、255 這樣的完整數字，沒有小數。

於是就出現了一個問題：你在英偉達的服務器上，用浮點數訓練出來了一個看起來完美的 AI 模型。但是你要把它裝進車裡，車裡只能用整數。怎麼辦？

大多數公司的做法是：把浮點數強行轉換成整數。

舉個例子：一個權重的值是 150.5。你把它轉成整數，就變成 150 或者 151。誤差很小，看起來沒什麼大不了的。

但還有更極端的情況：一個權重的值是 1520.52。但整數芯片每個格子最大隻能放 255，也就是 8 位整數，根本放不下。

這時候就要用「縮放」技巧：找到這一層權重裡最大的數，選一個縮放比例，讓最大值能壓縮進 0 到 255 的範圍裡。比如最大值是 1520，那就選一個係數大約是 6，讓所有數字都除以 6，使最大值變成 253 左右，勉強塞進去。

但這個縮放會帶來兩個問題：

縮放係數本身是個近似值，會引入誤差。
更嚴重的是：同樣的縮放比例，對大數字影響小，對小數字影響大。比如另一個權重是 0.3，除以 6 變成 0.05，四捨五入直接變成 0——這個權重的信息完全丟失了。

這樣轉換之後，進入車裡的模型，和你訓練時的模型，已經不是同一個東西了。

這就像把一張精確到毫米的地圖縮印成小圖標：主要的道路輪廓還在，但那些細小的街巷全部消失了。而模型裡那些「細小的街巷」，往往是它在極端場景下做出正確判斷的關鍵。

「聰明」一點的公司，知道這個問題，所以他們用一種叫做 QAT 的技術——「量化感知訓練」。意思是，從訓練一開始，就讓 AI 學著適應整數的限制，而不是等訓練完了再去轉換。

但即使是 QAT，也解決不了根本問題。

量化尾：看不見、摸不著，卻可能致命的縫隙

為什麼 QAT 也不行？

因為你在英偉達 GPU 上模擬的運算，和車裡真實芯片的運算，是兩套邏輯。

作者打了個比方：計算「5 加 5 再除以 2」。

車裡用的是特斯拉自己的 AI4 芯片，它可能是這樣算的：先算 5+5=10，再除以 2，結果是 5。

但英偉達的 GPU 可能是這樣算的：先算 5 除以 2，取整後等於 2，再加上 2，結果是 4。

同樣的運算，兩臺機器算出不一樣的結果。

為什麼會這樣？因為除以 2 其實就是那個縮放技巧，為了讓大數字能塞進小格子裡。不同的芯片，對這個縮放的處理方式不同。

更復雜的是，英偉達 GPU 的寄存器通常是 32 位的，可以存非常大的數字，40 億以上都沒問題。而車載芯片的格子，也就是寄存器，可能是 16 位的，最大隻能存 65535。當數字超過上限時，就會「飽和」——不再增加，直接卡在上限。這個「飽和點」不同，最終結果也會不同。

還有很多其他微小的差別，加在一起，讓兩臺機器的運算結果存在系統性的差異。

要讓英偉達 GPU 完全模擬車載芯片的行為，幾乎是不可能的。你需要繞開英偉達自己的優化軟件 CUDA，自己寫一套編譯器，強制英偉達按照車載芯片的運算順序來。這不僅非常慢，而且即使你做到了，你還需要驗證你的模擬器本身是對的——驗證過程本身又是一個循環悖論。

所以無論你用什麼方法，在英偉達 GPU 上訓練出來的模型，和真正跑在車載芯片上的模型，之間永遠存在一個縫隙。

在大多數普通路況下，這個縫隙沒有問題。

但在極端、罕見的情況下——那些 AI 從來沒見過的奇怪場景，也就是工程師們說的「長尾」情況——這個縫隙可能導致災難性的錯誤。

這個縫隙，就叫做「量化尾」。

唯一正確的解法：特斯拉 Cortex 的閉環訓練

現在你已經明白了量化尾是什麼問題。那其他公司怎麼處理這個問題？

大多數公司的做法是：用 QAT 訓練，也就是讓模型學著適應整數，然後拿出那 10% 的驗證集，在真實的車載芯片上跑一遍，看看有沒有出現明顯錯誤。

這個方法有兩個根本缺陷：

你只在 10% 的數據上測試了真實芯片的行為。那另外 90% 的數據，真實芯片從來沒有跑過。你根本不知道那 90% 的情況下，真實芯片會怎麼表現。
你訓練時優化的是一個「假」模型——英偉達上的模型。你從來沒有針對真實車載芯片的行為做過優化。訓練出來的最優解，是英偉達版本的最優解，不是車載芯片版本的最優解。

打個比方：就像你要從 100 個人裡選出馬拉松選手。你只在真實跑道上測試了其中 10 個人，另外 90 個人你只在跑步機上看了看他們的表現。跑步機上的表現和真實跑道完全不同——步頻、步幅、甚至誰會摔倒，都可能是兩回事。你把那 90 個「跑步機冠軍」選進隊伍，根本不知道他們在真實路面上會不會摔跟頭。

那為什麼不把 100% 的數據都在真實芯片上跑？

答案是：太貴了。

這個在真實芯片上跑數據、檢查結果的過程，有個名字叫 Hardware-in-the-Loop，也就是「硬件在迴路中」。真實的車載芯片是按照即時駕駛速度設計的，它沒有辦法比實際駕駛快。

如果你有 1000 小時的駕駛視頻，你需要一塊真實芯片跑 1000 小時來檢查。

特斯拉需要驗證的，是幾十億英里的駕駛數據。按照這個速度，你需要幾萬塊真實芯片並行運行，才能在合理的時間內完成。

你需要建一個巨型超級計算機，裡面塞滿跟車裡一樣的芯片。

這就是特斯拉做的事情。

特斯拉建造了一個叫做 Cortex 的超級計算中心。裡面有大約 4 萬塊 AI4 芯片，混合著大約 9 萬塊英偉達 H100 GPU。

AI4 芯片，就是特斯拉車裡裝的那塊推理芯片。H100，是英偉達目前最強的訓練芯片。

但特斯拉不僅僅用 Cortex 來驗證模型。它還做了一件任何其他公司都沒有做過的事：

把真實的 AI4 芯片，直接塞進訓練循環裡。

訓練被拆成兩半：推理在車載芯片上，優化交給 H100

回到前面講的梯度下降。每一輪訓練，你要做兩件事：

把駕駛視頻餵給 AI，讓 AI 運算一遍，得出結果（這叫做推理，inference）。
根據結果計算代價，計算梯度，調整權重（這是梯度下降的核心，需要大量計算）。

特斯拉的做法是：第二件事，繼續在英偉達 H100 上做，因為英偉達在這方面是無敵的。

但第一件事——推理——特斯拉改成在真實的 AI4 芯片上做。

這意味著什麼？

這意味著訓練的每一步，AI 的行為都是在真實的車載芯片上產生的。你不是在優化一個英偉達版本的假模型，你是在直接優化真實芯片的行為。訓練出來的結果，就是車裡芯片實際運行的結果，沒有任何轉換，沒有任何縫隙。

回到馬拉松的例子，這種做法的巧妙之處在於，它把訓練拆成兩半：

「產生行為」——這部分必須在真實芯片上完成，就像選手必須在真實跑道上跑。
「分析優化」——這部分交給英偉達 H100，就像教練團隊用超級計算機分析每一步數據、制定下一階段的訓練方案。

選手跑的是真實路面，但背後的「大腦」是最強的計算工具。兩者配合，既真實又高效。

於是，量化尾消失了。

100% 的數據，都在真實芯片上跑過了。訓練時的代價函數，反映的是真實芯片的真實行為。訓練出來的模型，就是最終部署的模型，完全一致。

作者的結論是：這是目前全世界唯一真正正確的方法。其他所有公司，包括 Wayve、小鵬，以及英偉達自己的車載芯片生態，都還在用「訓練假模型，然後希望它足夠好」的方法。

作者原文說得很直接：「當涉及安全時，寄希望於運氣，絕不是可行之道。」

馬斯克的側面證實：一個「小眾但非常重要」的細節

這不只是這位作者的個人判斷。馬斯克自己說過這件事。

在 2025 年特斯拉股東大會上，馬斯克說了這樣一段話（意譯）：

「而且我們，我認為這是我們獨有的，有一套基於整數的系統。整數運算從根本上比浮點運算更高效。所以我們可以做浮點，但我們的推理絕大部分是用整數完成的……但你實際上必須針對整數推理來訓練，而其他所有人都是針對浮點來訓練的。這是一個比較小眾的技術細節，但實際上非常重要。」

這是馬斯克第一次公開說出這件事。「這是一個小眾的技術細節，但實際上非常重要。」——這句話本身就很能說明問題。他知道大多數人聽不懂，但他還是說了，因為他認為這是特斯拉真正的差異化。

更早一些，在 2024 年，馬斯克發過這樣一條推文，大意是：

「重要的是，我們在訓練循環中同時使用特斯拉 HW4 AI 計算機和英偉達 GPU，目前比例大約是 1:2。另外，我們把 Hardware 4（HW4）改名為 Artificial Intelligence 4（AI4）。」

作者說，他看到這條推文的時候，立刻意識到馬斯克在做什麼。然後他做了一個決定，全倉買入特斯拉。

他後來還發布了一篇關於量化尾的分析，說 QAT 可以讓你在基準測試上表現接近，但無法給你在長尾情況下的確定性零縫隙行為。特斯拉的完整訓練流程——H100 加上 AI4 推理芯片加上整數原生訓練軟件——是一個閉合的迴路，沒有任何其他公司複製過。

結果，馬斯克本人給那篇推文點了贊。

作者說：這證實了一切。量化尾是真實存在的，馬斯克知道它，而且他已經解決了它。

為什麼其他公司不這麼幹？不是不會，是不想、也不敢

你可能會問：這個方法這麼好，為什麼其他公司不做？

有幾個原因。

第一，認知問題。
很多公司，包括學術界，用 QAT 訓練已經能拿到很好的基準測試成績。看起來夠好，就不覺得有必要再往前走。他們沒有意識到，或者不願意承認，在真實的極端場景下，他們的模型和真實芯片之間的縫隙，會是一個致命的問題。

第二，資源問題。
要把真實的 AI 推理芯片塞進訓練循環，你需要幾萬塊這種芯片並行運行。這不光是錢的事，這需要的是大規模建設基礎設施的意願和能力。

特斯拉在這件事上做出了一個非常大膽的賭注：投入鉅額資金建造 Cortex，裡面放 4 萬塊 AI4 芯片。這種投入，不是任何一個車企、甚至很多科技公司能夠做到的。

第三，商業邏輯問題。
對於很多公司來說，「差不多夠好」是一個合理的商業決策。他們的目標不是做出最安全的 AI，而是做出一個能夠上市的產品，佔領市場，然後慢慢迭代。這個邏輯，在對安全要求不高的場景裡可能可以。

但自動駕駛不一樣。一個「差不多」的自動駕駛系統，在大部分情況下表現良好，但在極端情況下會出事——這不是可以接受的產品。一次嚴重的事故，不僅會造成人員傷亡，還會讓整個自動駕駛行業倒退好幾年。

這也是為什麼作者說：「安全在特斯拉不是一句口號，它從一開始就被內置進了架構裡。」

投資者視角：這條護城河到底有多深？

技術部分講完了，現在來講對你最重要的部分——這對你作為一個投資者意味著什麼。

我們來系統性地看幾件事。

1. 這個護城河是否真實存在？

根據我們今天講的內容，答案是肯定的。這不是營銷話術，不是空泛的「數據優勢」，而是一個可以精確描述的技術實現：把真實的 AI 推理芯片放進訓練循環，實現零縫隙的訓練-部署一致性。

馬斯克已經公開確認了這個策略，而且 Cortex 的建設也是公開的。

2. 這個護城河有多難被複制？

複製這個護城河，需要以下幾件事同時成立：

你需要有自己的 AI 推理芯片，而且這個芯片要真正大規模量產、在實際產品中使用，不是實驗室的原型；
你需要建造一個包含幾萬塊這種芯片的超級計算中心；
你需要重寫你的整個訓練軟件棧，把整數原生運算融入訓練循環的每一步。

這每一步都需要鉅額投入和很長的時間。更關鍵的是，你需要先認識到這個問題的重要性，才會去做這件事。而作者的觀點是：大多數公司目前還沒有認識到這個問題有多嚴重。

他說：「其他公司最終會意識到——在幾年之後經歷了無數邊緣案例的失敗之後——經典的『在英偉達上訓練，量化，部署』方法從根本上有多麼錯誤。」

3. 對特斯拉商業價值的影響有多大？

從兩個維度看。

短期維度：
FSD 的安全性，是 Robotaxi 商業化的前提條件。如果 FSD 有量化尾導致的隱患，Robotaxi 就無法真正實現無人監督運營。反過來，如果特斯拉的 FSD 確實是目前唯一真正閉合了訓練-部署縫隙的系統，那它的安全性確實要高於競爭對手——而這是監管批准、商業化落地的關鍵因素。

長期維度：
自動駕駛技術的壁壘，一旦建立，是非常難以撼動的。就像當年的搜索引擎——谷歌用更好的算法建立了優勢，之後幾十年沒有人追上來。自動駕駛的訓練數據飛輪加上技術架構的優勢，可能形成類似的護城河：更安全的系統吸引更多用戶，更多用戶產生更多數據，更多數據讓系統更安全。

4. 風險在哪裡？

任何投資分析都必須提風險。

技術風險： 我們今天講的，主要來自一位工程師的分析，以及馬斯克的公開表態。特斯拉沒有發表過經過同行評審的學術論文來證明這些主張。這個技術路線是否真的如作者所說那麼有效，仍然需要時間驗證。
競爭風險： 英偉達等公司有可能開發出更好的模擬工具，讓其他公司能夠在軟件層面更好地彌合量化尾問題，而不需要把真實芯片放進訓練循環。技術壁壘有時候會被新的技術路線繞過。
執行風險： 即使技術優勢是真實的，Robotaxi 的大規模商業化還需要克服監管、用戶接受度、定價、運營效率等大量非技術挑戰。技術領先不等於商業成功。
估值風險： 特斯拉現在的估值，已經包含了對 Robotaxi 和 AI 未來的大量期望。即使這些預期都實現了，如果實現速度比市場預期慢，股價也可能承壓。

5. 一個簡單的判斷框架

對於普通散戶投資者，我建議用這樣的框架來思考這件事：

先問自己：你是否相信自動駕駛會在未來 10 年內大規模商業化？如果不相信，那特斯拉的這個技術優勢對你來說意義不大。如果相信，那接下來的問題是：誰會贏？
其次問：技術壁壘是否是贏家決定因素？在自動駕駛這個領域，安全性是最終的競爭維度。做不到足夠安全，你就無法獲得監管批准，無法商業化，無法建立用戶信任。
然後問：特斯拉的技術優勢是否可持續？今天我們講的內容，提供了一個可以自我強化的優勢：更好的訓練方法產生更安全的模型，更安全的模型讓更多用戶信任 FSD，更多用戶產生更多數據，更多數據支持更好的訓練。這個飛輪，是很難打破的。
最後問：估值有沒有充分反映這些預期，甚至過度反映了？這個問題，你需要結合自己的持倉比例和風險承受能力來回答。

競爭格局：Waymo、Wayve、小鵬和英偉達都在哪個段位？

我們再對原文內容做一點擴展，具體看看競爭對手的情況，這樣你對特斯拉的相對位置會更清晰。

Waymo
這是目前被很多人認為技術最成熟的 Robotaxi 公司。Waymo 的策略是用激光雷達加攝像頭的多傳感器融合、高精度地圖，以及嚴格限定的運營區域。他們在舊金山、鳳凰城等城市已經有商業化運營。

但 Waymo 面臨的問題是：他們的方案嚴重依賴預先建立的高精度地圖，這限制了他們的規模化速度。而且 Waymo 並沒有自己的大規模量產車輛，數據收集不如特斯拉。

從今天講的技術維度來看，Waymo 的 AI 訓練方式，也是傳統的「在英偉達訓練，量化，部署」的方式。量化尾的問題，Waymo 同樣存在。

Wayve
這是一家英國的自動駕駛 AI 公司，最近獲得了大量資金，也採用了端到端學習的路線。作者在原文中明確提到了 Wayve，說他們也是在「希望假模型足夠好」的那一類公司。

小鵬
這是中國最激進的在追趕特斯拉 FSD 路線的公司之一。他們放棄了激光雷達，轉向純視覺，這和特斯拉的路線非常接近。他們的數據收集規模，也在快速增長。

小鵬已於 2025 年推出自研的圖靈 AI 芯片，單顆算力相當於三顆英偉達 Orin X，並搭載在量產車型 G7 上。這是小鵬在芯片自主化上的重要突破。但需要注意的是，自研推理芯片並不等於解決了訓練-部署一致性的問題——小鵬的模型訓練仍然在雲端英偉達 H100 上進行，訓練芯片和車載推理芯片依然不同。因此在這個關鍵維度上，他們和 Waymo、Wayve 一樣，同樣面臨「量化尾」的問題。

英偉達 Drive 生態
英偉達最近推出了自己用於車載的 Drive 芯片系列，比如 Alpamayo。但作者指出，即使英偉達用自己的車載芯片，「雲端訓練模型」和「車載模型」之間的縫隙仍然存在，因為雲端訓練用的是 H100 這樣的數據中心 GPU，不是 Drive 車載芯片。

綜合來看，競爭對手在這個特定的技術維度上，都還沒有追上特斯拉。而且複製這個優勢需要的時間和投入，給了特斯拉相當大的時間窗口。

Cortex 和 Cybercab：技術怎麼落到商業上

再聊兩個具體的事情，幫助你把今天學到的內容和特斯拉的商業計劃連接起來。

Cortex：特斯拉的「AI 發電廠」

Cortex 是特斯拉在得克薩斯州建造的超級計算中心。原始 Cortex 已於 2024 年底完成部署，內含約 4 萬塊 AI4 芯片和 9 萬塊英偉達 H100 GPU。到 2026 年，特斯拉又建造了 Cortex 2.0，GPU 規模擴大到約 10 萬塊 H100/H200，總容量達 500MW。

作者說，當他看到馬斯克宣佈 AI4 芯片放進訓練循環的時候，他意識到 Cortex 不只是一個訓練計算中心，而是整個訓練範式的體現：用真實硬件來訓練，確保訓練和部署之間零縫隙。

在芯片路線圖方面，特斯拉正在研發 AI5 芯片，算力是 AI4 的約 10 倍。AI5 已於 2026 年 4 月完成流片，但量產時間推遲到了 2027 年中期。這意味著 Cybercab 將以 AI4 硬件上市，AI5 會在後續版本中引入。

建造 Cortex 需要多少錢？特斯拉財報沒有單獨披露 Cortex 的建造成本，只公佈了整體資本支出：2025 年全年約 85 億美元，2026 年計劃大幅提升至 250 億美元，AI 基礎設施是其中的主要方向。單看 GPU 部分，按市價就是幾十億美元。加上 AI4 芯片、基礎設施、能源，Cortex 的總投入可能達到百億美元量級。

這種規模的投入，不是靠「講故事+融資」就能輕易模仿的。

Cybercab：沒有方向盤的 Robotaxi

Cybercab 是特斯拉專門為 Robotaxi 設計的車型，沒有方向盤，沒有踏板，完全依賴 FSD。

作者原文寫這篇文章時，Cybercab 還在測試階段。而從目前進展來看，作者的判斷已經得到了一定程度的驗證：特斯拉於 2025 年 6 月在奧斯汀正式推出 Robotaxi 服務（初期用 Model 3 和 Model Y），同年 12 月升級為無人監督運營，到 2026 年 1 月已累計完成超過 70 萬英里的付費里程。Cybercab 專用車型的量產也於 2026 年 4 月啟動，服務正在擴展到達拉斯、邁阿密、拉斯維加斯等更多城市。

這背後的邏輯是：用真實 AI4 芯片訓練的 FSD，在 Cortex 的驗證環境裡，特斯拉已經精確知道它的安全表現。所以德克薩斯州的 Robotaxi 測試，並不是在驗證基本安全性，而是在打磨乘客體驗、接送流程、運營效率這些商業層面的事情。事實上，從「有人監督」到「無人監督」只用了半年，這個節奏支持了作者的判斷。

當然，實際的商業化進程，還取決於大量其他因素：監管批准、地圖覆蓋、運營支持……這些都需要時間。

總結：你需要記住的 5 件事

最後我們把今天的內容壓縮成幾條你可以帶走的結論。

第一點：AI 的本質是乘法加法，訓練是調參數。
這不是魔法。理解了這一點，你就能明白為什麼「訓練」和「部署」之間會有差異。

第二點：量化尾是真實存在的問題。
所有在英偉達 GPU 上訓練、然後量化成整數部署到車載芯片上的 AI，都存在訓練模型和實際運行模型之間的縫隙。這個縫隙在大多數情況下無關緊要，但在長尾的極端場景下，可能是致命的。

第三點：特斯拉是目前唯一解決了這個問題的公司。
他們建造了 Cortex，把 4 萬塊真實的 AI4 車載芯片放進了訓練循環，確保訓練和部署完全一致，量化尾縫隙清零。馬斯克本人在股東大會上明確描述了這個策略，並把它稱為「小眾但非常重要的技術細節」。

第四點：這條護城河成本極高、時間極長。
要複製這個優勢，你需要有自己大規模量產的 AI 推理芯片，需要建造包含幾萬塊這種芯片的超級計算中心，需要重寫整個訓練軟件棧。這不是幾年能完成的事。

第五點：對投資者的意義取決於你的假設。
如果你相信自動駕駛會大規模商業化，而且相信安全性是決定性的競爭維度，那特斯拉在這個維度上的優勢，是真實的、可持續的，並且難以被複制的。但這個優勢要轉化成股價上漲，還需要 Robotaxi 真正商業化，而商業化的時間線和規模，仍然充滿不確定性。

最後引用作者的一句話，我認為說得非常好：

「對於自己的 AI 有多安全，特斯拉在部署之前就清楚地知道了。」

不要被競爭對手炫酷的演示視頻所迷惑。訓練一個神經網絡讓它能夠開車，現在已經相對容易了。真正的難點，是把長尾情況做到極致——那些佔比不到 1%、但一旦出錯就可能致命的極端場景。

特斯拉解決了這個問題。

而其他人，還做不到。