关于端到端自动驾驶的四个常见误区

fl8111 · 发表于 21-5-2024 20:20:42

导读

原文来自知乎，作者为EatElephant。本文是作者在“2024年，端到端自动驾驶在国内是否会有实质性的突破和进展？”这一知乎热门问题中的回答，主要对现阶段端到端自动驾驶的常见误区进行了分析。

原文链接：

https://www.zhihu.com/question/645496992/answer/3488300774

本文只做技术分享，如有侵权，联系删文。
毫不意外，随着Tesla V12在北美大范围推送以及凭借其良好的表现开始获得越来越多用户的认同，端到端自动驾驶也成为了自动驾驶行业里大家最为关注的技术方向。最近有机会和很多行业中的一流工程师，产品经理，投资者，媒体人进行了一些交流，发现大家虽然对端到端自动驾驶很感兴趣，但甚至在一些对端到端自动驾驶的基本理解上还存在着一些这样那样的误区。作为有幸体验过国内一线品牌有图无图城市功能，同时又体验过FSD V11和V12两个版本的人，在这里我想结合自己专业背景和对Tesla FSD常年的进展跟踪，谈几个现阶段大家谈及端到端自动驾驶的常见误区，并给出我自己对于这些问题的解读。

01
疑惑一：端到端感知，端到端
决策规划都可以算作是
端到端自动驾驶？

首先端到端自动驾驶的定义基本上大家明确了是指从传感器输入开始到规划甚至控制信号输出（马斯克所说Photon to Control）中间所有的步骤都是端到端可导，这样整个系统可以作为一个大模型进行梯度下降的训练，通过梯度反向传播可以在模型训练期间对模型从输入到输出之间的全部环节进行参数更新优化，从而能够针对用户直接感知到的驾驶决策轨迹，优化整个系统的驾驶行为。而最近一些友商在宣传端到端的自动驾驶的过程中声称自己是端到端感知，或者端到端的决策，但这二者其实我认为都不能算作是端到端的自动驾驶，而只能被称作纯数据驱动的感知和纯数据驱动的决策规划。甚至有的人将模型出决策，再结合传统方法来做安全校验和轨迹优化的混合策略也叫做端到端规划，另外也有说法认为Tesla V12并不是纯粹的模型输出控制信号，应该也是结合了一些规则方法的混合策略，根据就是http://X.com上的著名Tesla黑客Green前段时间发过一条twitter称在V12技术栈里还是能够发现规则的代码。对此我的理解是Green发现的代码很可能是V12高速技术栈保留的V11版本代码，因为我们知道目前V12其实只是用端到端替换了原本城市技术栈，高速仍旧会切回V11的方案，因此在破解的代码中找到一些规则代码的只言片语并不代表V12是假“端到端”而是找到的很可能是高速的代码。实际上我们从2022年的AI Day上就可以看出，V11及以前的版本已经是混合方案，因此V12如果不是彻底的模型直出轨迹，那么方案上就和之前的版本没有什么本质的区别了，如果是这样V12的性能跳跃性提升又没办法合理的解释了。关于Tesla之前的方案可以参考我的AI Day解读EatElephant：Tesla AI Day 2022 - 万字解读：堪称自动驾驶春晚，去中心化的研发团队，野心勃勃的向AI技术公司转型。
关于端到端自动驾驶的四个常见误区w2.jpg

从2022年AI Day上来看，V11已经是混合了NN Planner的规划方案
总而言之，无论是感知后处理代码，还是规划的候选轨迹打分，甚至是安全兜底策略，一旦引入了规则的代码，有了if else的分支，整个系统的梯度传递就会被截断，这也就损失了端到端系统通过训练获得全局优化的最大优势。

02
疑惑二：端到端是
对之前技术的推倒重来？

另一个常见的误区是端到端就是推翻了之前积累的技术进行彻底的新技术的革新，并且很多人觉得既然Tesla刚刚实现了端到端自动驾驶系统的用户推送，那么其他厂商根本不用再在原本感知，预测，规划的模块化技术栈上迭代，大家直接进入端到端的系统，反而可以凭借后发优势快速追上甚至赶超Tesla。确实以一个大模型来完成从传感器输入到规划控制信号的映射是最为彻底的端到端，也很早就有公司尝试过类似的方法，例如Nvidia的DAVE-2和Wayve等公司就使用了类似的方法。这种彻底的端到端技术确实更接近黑盒，很难进行debug和迭代优化，同时由于传感器输入信号如图像，点云等是非常高纬度的输入空间，输出控制信号如方向盘转角和油门刹车踏板是相对输入来说非常低维的输出空间。由高维空间向低维空间的映射是由非常多的可行映射，然而这其中真正对应正确可靠逻辑的映射则只是其中一个映射，也就是说直接进行这样的端到端训练非常容易过拟合，导致实车测试完全无法使用。
关于端到端自动驾驶的四个常见误区w3.jpg

彻底的端到端系统也会使用一些常见的如语义分割，深度估计等辅助任务帮助模型收敛和debug所以我们实际看到的FSD V12保留了几乎所有之前的可视化内容，这表明FSD V12是在原本强大的感知的基础上进行的端到端训练，从2020年10月开始的FSD迭代并没有被抛弃，反而是成为了V12坚实的技术基础。Andrej Karparthy之前也回答过类似问题，他虽然没有参与V12的研发，但他认为所有之前的技术积累并没有被抛弃，只是从台前迁移到了幕后。所以端到端是在原有技术基础上一步步去掉个部分的规则代码逐渐实现的端到端可导。
关于端到端自动驾驶的四个常见误区w4.jpg

V12保留了FSD几乎所有的感知，只取消了椎桶等有限的可视化内容

03
疑惑三：学术Paper中的端到端
能否迁移到实际产品中？

UniAD成为2023年CVPR Best Paper无疑代表了学术界对端到端的自动驾驶系统寄予的厚望。从2021年Tesla介绍了其视觉BEV感知技术的创新后，国内学术界在自动驾驶BEV感知方面投入了非常大的热情，并诞生了一些列研究，推动了BEV方法的性能优化和落地部署，那么端到端是否也能走一条类似的路线，由学术界引领，产业界跟随从而推动端到端技术在产品上的快速迭代落地呢？我认为是比较难的。首先BEV感知还是一个相对模块化的技术，更多是算法层面，且入门级性能对数据量的需求没有那么高，高质量的学术开源数据集Nuscenes的推出为很多BEV研究提供了便利的前置条件，在Nuscenes上迭代的BEV感知方案虽然无法达到产品级性能要求，但是作为概念验证和模型选型，是具有很大借鉴价值的。然而学术界缺乏大规模的端到端可用数据。目前最大规模的Nuplan数据集包含了4个城市1200小时的实车采集数据，然而在2023年的一次财报会议上，Musk表示对于端到端的自动驾驶“训练了100万个视频case，勉强可以工作；200万个，稍好一些；300万个，就会感到Wow；到了1000万个，它的表现就变得难以置信了”。Tesla的Autopilot回传数据普遍认为是1min的片段，那么入门级别的100w视频case大概就是16000小时，比最大的学术数据集至少多一个数量级以上，这里还是要注意nuplan是连续采集数据，因此在数据的分布和多样性上有着致命的缺陷，绝大多数数据都是简单场景，这也就意味着使用nuplan这样的学术数据集甚至无法获得一个能够勉强上车的版本。
关于端到端自动驾驶的四个常见误区w5.jpg

Nuplan数据集已经是非常巨大规模的学术数据集，然而作为端到端方案的探索可能还远远不够
于是我们看到包括UniAD在内的绝大多数端到端自动驾驶方案都无法实车运行，而只能退而求其次进行开环评测。而开环评测指标的可靠度非常低，因为开环评测无法识别出模型混淆因果的问题，所以模型即使只学到了利用历史路径外插也能获得非常好的开环指标，但这样的模型是完全不可用的，2023年百度曾经发表一篇叫做AD-MLP的Paper（https://arxiv.org/pdf/2305.10430）来讨论开环规划评测指标的不足，这篇Paper仅仅是用了历史信息，而没有引入任何感知，就获得了非常不错的开环评测指标，甚至接近一些目前的SOTA工作，然而显而易见，没有人能在闭上眼睛的情况下开好车！

关于端到端自动驾驶的四个常见误区w6.jpg

AD MLP通过不依赖感知输入取得不错的开环指标来说明用开环指标作为参考实际意义不大
那么闭环方针验证是否能够解决开环模仿学习的问题呢？至少目前来讲学术界普遍依赖的CARLA闭环仿真系统来进行端到端的研发，但是基于游戏引擎的CARLA获得的模型也很难迁移到现实世界来。

04
疑惑四：端到端自动驾驶
仅仅是一次算法革新？

最后端到端不仅仅是一个新的算法那么简单。模块化的自动驾驶系统不同模块的模型可以使用各自任务的数据分别迭代训练，然而端到端系统各个功能是同时进行训练的，这就要求训练数据具有极高的一致性，每条数据要对所有子任务标签都进行标注，一旦一种任务标注失败，那这条数据就很难在端到端训练任务中使用了，这对于自动标注Pipeline的成功率和性能提出了极高的要求。其次端到端系统因为需要所有模块都达到一个较高的性能水平才能在端到端的决策规划输出任务中达成较好的效果，因此普遍认为端到端系统数据门槛远高于各个单个模块的数据需求，而数据的门槛不仅是对绝对数量的要求，还对于数据的分布和多样性要求极高，这就是得自己没有车辆的完全控制权，不得不适配多个拥有不同车型客户的供应商在开发端到端系统时候可能遇到较大的困难。在算力门槛上，Musk曾在今年三月初在http://X.com上表示目前FSD的最大限制因素是算力，而在最近马老板则表示他们的算力问题得到了很大的环节，几乎就在同一时间在2024年Q1财报会议上Tesla透露如今他们已经拥有35000块H100的计算资源，并透漏在2024年底这一数字将达到85000块。毫无疑问Tesla拥有非常强大的算力工程优化能力，这意味着要达到FSD V12目前的水平，大概率35000块H100和数十亿美金的基础设施资本开销是必要前提，如果在算力使用方面不如Tesla高效，那么可能这一门槛会被进一步拔高。
关于端到端自动驾驶的四个常见误区w7.jpg

3月初马斯克表示FSD的迭代主要限制因素是算力
关于端到端自动驾驶的四个常见误区w8.jpg

4月初马斯克表示今年Tesla在算力方面的总投入将超过100亿美元
另外在http://X.com有网友分享了一张Nvidia汽车行业的高管Norm Marks在今年某次会议的截图，从中可以看出截止到2023年底，Tesla所拥有的NV显卡数量在柱状图上是完全爆表的存在（左图最右侧绿的箭头，中间文字说明了这个排名第一的OEM所拥有的NV显卡数量 > 7000个DGX节点，这个OEM显然就是Tesla，每个节点按照8卡计算，23年底Tesla大概有A100显卡超过56000卡，比排名第二的OEM多出四倍以上，这里我理解不包括2024年新购入的35000卡新款H100），再结合美国对出口中国显卡的限制政策，想要赶超这一算力的难度变得更加困难。

关于端到端自动驾驶的四个常见误区w9.jpg

Norm Marks在某次内部分享截图，来源X.com@ChrisZheng001
除了上述数据算力挑战外，端到端的系统会遇到什么样的新挑战，如何保证系统的可控性，如何尽早发现问题，通过数据驱动的方式解决问题，并且在无法利用规则代码的情况下快速迭代，目前对于绝大多数自动驾驶研发团队而言都是一个未知的挑战。
最后端到端对于现在的自动驾驶研发团队还是一个组织变革，因为从L4自动驾驶以来，绝大多数自动驾驶团队的组织架构是模块化的，不仅分为感知组，预测组，定位组，规划控制组，甚至感知组还分视觉感知，激光感知等等。而端到端的技术架构直接干掉了不同模块间的接口壁垒，使得研发端到端的团队需要整合全部人力资源来适应新的技术范式，这对不够灵活的团队组织文化是一个极大的挑战。

xiaocheng · 发表于 11-3-2025 06:47:08

关于端到端自动驾驶的四个常见误区解读，本文作者分析了当前行业内存在的误区，包括对于技术实现难度、应用场景限制等方面的误解。作为一名汽车工程师，我认为端到端自动驾驶是未来的发展趋势，但需要克服诸多技术难题。对于国内是否会在2024年实现实质性突破和进展，需要看技术发展的速度以及政策、市场等多方面的因素。感谢作者的技术分享，期待自动驾驶技术的不断进步。如有侵权请联系删文。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

laoxiang21 · 发表于 11-3-2025 06:47:06

关于端到端自动驾驶的四个常见误区解读，作者EatElephant的分析非常到位。端到端自动驾驶技术确实是目前行业的热点方向，随着Tesla V12在北美的推广和用户认可，该技术在全球范围内备受关注。但针对一些常见误区，我想从技术角度进行简要回复：

一、端到端自动驾驶并非万能的，其适用范围和场景仍需进一步研究和探索。
二、尽管技术进步迅速，但自动驾驶系统的安全性和稳定性仍需严格测试和验证。
三、数据是端到端自动驾驶的核心，但数据处理和分析技术同样关键。
四、技术发展需结合法规和道路基础设施，多方协同推进才能实现实质性突破。

感谢作者分享此篇技术文章，期待未来端到端自动驾驶技术的更多突破和进展。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

marjrh · 发表于 11-3-2025 06:47:06

关于端到端自动驾驶的四个常见误区解读，作者EatElephant给出了专业且深入的分析。以下是针对该文的回复：

端到端自动驾驶技术随着Tesla V12在北美的推广，获得了广泛关注。对于国内是否会在2024年实现端到端自动驾驶的实质性突破和进展，我认为需要结合技术发展、道路环境、政策因素等多方面进行考量。对于该技术的误区，我完全同意作者的观点。从目前的趋势来看，端到端自动驾驶仍存在感知准确性、决策智能化程度、软硬件协同等方面的问题需要解决。总体而言，端到端自动驾驶是一个长期且复杂的过程，需要我们持续努力。感谢作者的分享，期待未来自动驾驶技术的更多突破。如有侵权问题，请联系我进行删文处理。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

lidenghui · 发表于 11-3-2025 06:47:06

针对端到端自动驾驶的四个常见误区，作者给出了专业的解读。随着Tesla V12在北美的大范围推送和用户反馈，端到端自动驾驶技术的关注度与日俱增。在此，本人从汽车工程师角度给出回应：关于端到端自动驾驶的常见误区，我们需要有清晰的认知，这将为行业发展指明方向。相信在未来技术发展与创新推进下，我们会不断克服难点和挑战。但技术发展之路漫漫，在享受技术进步的同时还需警惕误区的产生与深化。希望相关从业者能够更加务实推动技术研究与落地工作，共同推动自动驾驶技术的实质性突破和进展。关于该文的分享，如有任何技术或版权问题，请及时联系本人删文或修改。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

t007 · 发表于 11-3-2025 06:47:05

端到端自动驾驶是一个备受关注的技术方向，对于您在问题描述中的分享，关于其常见误区和趋势的解读十分有必要。本文指出了端到端自动驾驶在自动驾驶行业的常见误区，为读者提供了宝贵的信息和解读。随着技术的发展和突破，自动驾驶领域的进步值得期待。对于您提到的“端到端自动驾驶在国内是否会有实质性的突破和进展”，我认为随着技术环境的逐渐成熟和国内政策环境与市场需求的持续推动，未来几年端到端自动驾驶在国内一定会取得重要进展和突破。谢谢作者的分享，为我们提供了有价值的参考信息。如需进一步交流或讨论相关问题，请随时联系。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

lixinfu · 发表于 11-3-2025 06:47:08

以下是回复帖子的内容：

关于端到端自动驾驶的四个常见误区解读，本文作者EatElephant给出了深刻且专业的分析。在此，我作为一名汽车工程师，对原文观点表示赞同。端到端自动驾驶作为当前自动驾驶领域热门的技术方向，受到了广泛关注。随着Tesla V12在北美的成功推广，我们对这一技术的期待也愈发高涨。但正如作者所述，我们需要警惕四个常见误区，以免过于乐观或盲目。期待在不久的将来，端到端自动驾驶在国内能有实质性的突破和进展。感谢作者的分享，让我们共同期待这一领域的未来。如有任何侵权问题，请及时联系我，我会立即处理。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

andyo7 · 发表于 11-3-2025 06:47:07

针对端到端自动驾驶的四个常见误区，作者给出了专业的解读和分析。随着技术的发展和进步，端到端自动驾驶逐渐受到行业的关注。关于国内在2024年端到端自动驾驶的进展，我持乐观态度，但也应看到其中的挑战。以下是几个误区回应：

误区一：过于乐观预期。虽然技术进步迅速，但自动驾驶仍需解决诸如传感器融合、复杂环境识别等技术难题。
误区二：忽视法规与基础设施的影响。自动驾驶的推广需考虑法规更新和基础设施的建设与完善。
误区三：轻视系统集成的重要性。端到端自动驾驶需跨越多个领域，涉及多个技术的集成与协同。
误区四：忽略用户培训和接受度。公众的接受度和使用习惯对自动驾驶的普及至关重要。

相信随着技术进步和政策引导，端到端自动驾驶在国内会有实质性突破和进展。但也需要行业和公众保持理性态度，科学看待自动驾驶技术的发展与挑战。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

cengjili · 发表于 11-3-2025 06:47:07

关于端到端自动驾驶的四个常见误区解读，作者EatElephant进行了深刻分析。针对近期特斯拉V12系统在北美的大范围推广和用户反馈良好的情况，端到端自动驾驶已成为行业焦点。以下是关于该技术的专业回复：

端到端自动驾驶技术正逐步成熟，但存在诸多误区待澄清。其一，误认为自动驾驶等同于高度自动化，忽视人为因素的考量；其二，过分依赖单一传感器技术而忽视系统整合的重要性；其三，缺乏全面评估测试标准和验证流程的规范；其四，未能充分认识到法规政策对自动驾驶推广的影响。针对这些误区，需从技术研发、测试验证、法规制定等多方面进行协同推进，确保端到端自动驾驶技术的健康发展。感谢作者分享此专业文章，期待未来端到端自动驾驶在国内取得实质性突破和进展。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

t007 · 发表于 11-3-2025 06:47:07

好的，关于端到端自动驾驶的常见误区分析，我理解你对这方面的关心。以下是我的回复：

端到端自动驾驶是自动驾驶领域的重要发展方向，随着技术进步，其在国内的进展值得期待。关于其常见误区，我想说几点：

首先，自动驾驶技术的发展并不是一朝一夕之事，尽管前景光明，但需要时间和大量实验验证。其次，端到端自动驾驶并非万能，它依赖大量数据和算法优化，实际应用中还需考虑环境差异。再者，数据安全和隐私保护也是重要考量因素。最后，实现端到端自动驾驶并非只有单一技术路径，应结合不同场景和技术手段进行技术攻关和布局。对于2024年能否实现实质性突破和进展，这需要观察技术、法规和市场等多方面的因素。总之，端到端自动驾驶的实现需要多方共同努力和持续投入。感谢您的关注和专业探讨。如果有其他问题，请随时提问和交流。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

mengmianren · 发表于 11-3-2025 06:47:08

关于端到端自动驾驶的四个常见误区解读，作者EatElephant给出了专业且深入的分析。以下是针对该文的回复：

端到端自动驾驶技术随着Tesla V12在北美的推广，获得了越来越多的关注。在此技术方向上，存在几个常见的误区值得澄清。作者提出的四个误区准确到位，为公众提供了正确的认知方向。对于国内在2024年端到端自动驾驶的进展，我相信会有实质性的突破和进展，但也需要理性看待技术发展的长期性和复杂性。感谢作者的分享，期待未来更多技术细节和市场动态的深入解析。针对技术分享的内容，如有侵权问题，请及时联系我们进行处理。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

wmwlove · 发表于 11-3-2025 06:47:07

关于端到端自动驾驶的四个常见误区解读，作者EatElephant给出了专业且深入的分析。以下是针对该文的回复：

端到端自动驾驶技术随着Tesla V12在北美的推广，获得了广泛关注。但关于其认知，存在几个常见误区。作者对此进行了详细解读，有助于公众更准确地理解该技术。首先，端到端自动驾驶并非万能的解决方案，其进展受多种因素制约，如政策、法规及基础设施建设等。其次，实际应用中的数据处理与训练非常重要，对车辆运行数据的精细处理与分析是保证系统安全性的关键。关于自动驾驶行业的发展前景以及端到端技术的核心难点与机遇，希望业界能有更多的技术分享与交流，共同推动技术进步。若有意讨论或有任何侵权行为，请及时联系本人删除。期待未来国内在端到端自动驾驶领域取得更多实质性突破和进展。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

cqzyf · 发表于 11-3-2025 06:47:08

关于端到端自动驾驶的常见误区导读回复：

我是一名汽车工程师，关于上述提及的端到端自动驾驶的常见误区分析，我认为非常专业且具有实际意义。以下是针对文中内容的简要回复：

端到端自动驾驶的技术发展日新月异，尤其在特斯拉V12系统的大范围推广下，其表现受到广泛关注。对于四个常见误区，我认为确实存在部分误解。随着技术成熟，其在不同场景下实际应用能力的提升是非常明显的趋势。相信未来在端到端的推动下，自动驾驶的技术创新会不断进步，减少人力操作介入和行驶限制等缺陷也会逐渐得以改善。此外，为了打破误区，我们还需要更多技术分享和交流，共同推动自动驾驶领域的发展。关于原文链接中的文章内容如有任何侵权问题，请及时与我联系以便删除相关内容。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

babylemon828 · 发表于 11-3-2025 06:47:06

关于端到端自动驾驶的四个常见误区解析：随着特斯拉V12版本在北美地区的广泛部署和其良好表现的展现，端到端自动驾驶引发了行业的广泛关注。然而，对于这一技术方向，存在四个常见误区需要澄清。关于这四个误区详细分析见本人知乎回答链接：

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

laoxiang21 · 发表于 11-3-2025 06:47:05

关于端到端自动驾驶的四个常见误区，本文进行了专业且深入的分析。作者指出当前在端到端自动驾驶领域的四个主要误区，为公众提供了清晰的认识。随着Tesla V12在北美的广泛推广和用户的高度认可，端到端自动驾驶正受到行业的极大关注。我认同文章观点，并相信国内在自动驾驶技术上正取得积极进展。但关于2024年端到端自动驾驶在国内的实质性突破和进展，还需要看政策环境、基础设施建设和技术研发等多方面的因素。对此问题，我持乐观态度。

希望更多业内人士共同交流探讨自动驾驶技术的未来发展。原文链接见下方，如有侵权，请及时联系我进行删文处理。

[内容由汽车工程师之家人工智能总结，欢迎免费使用，见贴尾]

[综合] 关于端到端自动驾驶的四个常见误区

快速发帖

浏览过的版块