· 7 min read
為何敢刪雷達?Karpathy 解構特斯拉「純視覺」FSD 真相
特斯拉的純視覺路線:技術邏輯與成本考量
大家好,我是小梗。最近,馬斯克在 X 上發佈了一些關於激光雷達和毫米波雷達的帖子,引發了廣泛討論。特斯拉為何始終堅持純視覺路線,堅決反對使用激光雷達?這背後不僅僅是為了降低成本,還有更深層次的技術邏輯。
馬斯克的觀點與反駁
馬斯克認為,傳感器過多反而會降低系統的整體安全性,因為不同傳感器之間可能會出現信號衝突。一旦信息不一致,系統就難以判斷信號的真實性。此外,他指出,在雨雪等複雜天氣條件下,激光雷達容易因為反射和散射問題導致誤判。這一觀點引發了不少反駁,有人認為馬斯克明知激光雷達在精度和可靠性上更出色,卻為了降低成本堅持使用純視覺路線。
Lex Fridman與Andrej Karpathy的訪談
為了深入瞭解這一爭議,我查閱了兩年前 Lex Fridman 對 Andrej Karpathy 的訪談。Karpathy是特斯拉前人工智能負責人,他的觀點更聚焦於一線的工程現實與技術可行性。訪談中,兩人討論了多個話題,包括“僅憑視覺能否完成自動駕駛”、“數據引擎如何閉環迭代”等,這些內容為理解特斯拉的技術哲學提供了重要視角。
視覺的優勢與侷限
在訪談中,Lex 提出問題:把駕駛定義為視覺任務時,攝像頭的優勢與侷限是什麼?Karpathy指出,像素是“美麗的傳感”,因為它便宜且信息量極大。通過攝像頭,特斯拉能夠以低成本持續採集大量信息,從而反推道路、車輛、行人等隱含結構。他強調,視覺不僅是必要的,極可能是充分的,因為世界本身為視覺優化。
數據引擎的閉環迭代
Karpathy進一步解釋了“數據引擎”的概念,形容其為一種“幾乎生物學式”的演化過程。通過不斷觀察失敗案例並將其納入訓練集,特斯拉能夠持續優化模型。這一過程強調了人類在其中的作用,團隊需要定義策略、拆解任務、制定優先級,以確保數據引擎的高效運轉。
刪繁就簡的傳感決策
當特斯拉移除雷達與超聲時,外界普遍認為這會使系統變得更復雜。然而,Karpathy反問道,問題不只是精度,而是系統的全成本。多一個傳感器不僅增加了信息量,還帶來了無數的鏈路和管理負擔。因此,刪掉不必要的傳感器,集中團隊的注意力於視覺傳感器上,反而能提高系統的效率。
激光雷達與高精地圖的爭論
在激光雷達與高精地圖的討論中,Karpathy強調,真正的分野在於“你有沒有車隊”。龐大的車隊意味著持續的數據供給和閉環能力,這才是讓系統在現實世界中持續爬坡的可靠引擎。他預判,其他公司會逐步放棄昂貴的傳感器,因為從全鏈路總成本來看,得不償失。
反熵化的組織機制
Karpathy提到,在馬斯克身上學到的一個重要教訓是如何與組織“熵”作鬥爭。他強調,複雜系統越是需要刪除不必要的部分,以提高速度與聚焦。維持“初創文化”需要強有力的推動者,確保簡化成為共識與紀律。
未來的展望與挑戰
談到未來的時間表,Karpathy表示,通用的自動駕駛從未有人真正完成過,因此難以給出精確的預測。然而,隨著數據規模、算力規模和評估體系的全面升級,特斯拉的自動駕駛系統正逐步從輔助駕駛向真正的“無人駕駛”過渡。
總結
綜上所述,特斯拉的純視覺路線不僅是出於成本考量,更是基於深厚的技術邏輯。像素流是最高帶寬且與世界界面匹配的傳感入口,真正的難點在於規模化執行與數據引擎的閉環。刪繁就簡、反熵化與“最佳部件是沒有部件”的工程哲學,都是特斯拉在自動駕駛與人形機器人領域取得成功的關鍵。
如果您對這個話題有任何看法,歡迎在評論區留言。如果覺得有用,別忘了點贊、訂閱和轉發。我是小梗,我們下期再見!