“2025年,自动驾驶将迎来ChatGPT时刻。”地平线总裁陈黎明今日在中国汽车论坛上表示,自动驾驶的ChatGPT时刻不光是整个性能的提升,最关键的是产品的体验、可用性与好用性。
陈黎明认为,目前城区NOA大部分还处于可用阶段,还没有达到好用的阶段,主要的问题在于,通行效率低,行为不拟人,急快速开城导致可用性下降,通过率低。真正“好用”的智驾2.0的系统,要提供拟人化的智驾体验,用户亟需好用的城区NOA 2.0系统,需要实现通行效率、驾驶拟人、场景通过率的全面突破。
“整个自动驾驶的应用还受限于一些相对小的范围,在大范围上体验不好。要解决这个问题核心的要素有四个:算法、算力、数据、工程能力。算法是决定了整个系统的性能的上限,算力和数据决定了技术迭代速度,工程能力决定了整个量产化的规模和用户体验。”陈黎明表示,通过端到端,深度学习人类驾驶行为,推动处理极限场景,这是一种更复杂的一种决策行为,需要交互博弈技术。同时,整个系统必须成本可控,让每个人都可以享受到。地平线推出BPU计算架构,提供的解法是通过软件、硬件的联合优化,让整个系统成本不断降低。
算法上,当前有基于规则的和数据驱动的两种开发范式,也是业内常说的软件1.0和软件2.0。软件1.0基于大量人工规则,系统上限低,下限可控;软件2.0,数据驱动的端到端系统,实现信息无损传递,系统上限高,而下限不可控。两者都是数据驱动的端到端系统,单一无法全面提升系统能力,不得不在系统上限的提升和系统下限的保障二者之间做取舍。陈黎明表示,“通过 ‘三网合一’端到端,能够把传感器信息、包括地图、导航信息都作为一个输入源输入到一个模型中进行训练推理,再加上交互博弈架构和算法,能够比较好地解决这一问题。此外,地平线通过采用模仿强化混合学习技术,使得整个自动驾驶更拟人、更安全。
特斯拉是AI大模型在自动驾驶技术上应用的引领者。2023年5月,特斯拉CEO马斯克宣布,特斯拉将发布采用端到端大模型的自动驾驶系统。今年特斯拉推出了基于端到端大模型的FSD v12.3,小鹏汽车董事长何小鹏在体验特斯拉全自动驾驶软件后也预言,2025年将是完全自动驾驶的”ChatGPT时刻”。在特斯拉引领下,目前多家车企开始推出“端到端”方案,包括小鹏汽车、蔚来、理想等。
奇瑞汽车股份有限公司副总经理谷俊丽近日公开表示,从基于计算机视觉到端到端,仅仅用时8年,而端到端技术将是中国智驾赶超特斯拉的一个机遇,也是新一代技术变革下的必赢之战。特斯拉的完全自动驾驶(FSD)基于数据驱动的基本演进逻辑,AI及纯视觉则是马斯克坚持了十年的基本技术路径,也是其将物理学家对第一性原理理解到极致,并将商业收益结合到一起的绝佳视角。特斯拉通过数据积累带来算法能力的提升、算法架构的引进,带来了产品可用性和产品体验的跃迁,并进一步提升了里程数据,形成良性循环。
谷俊丽认为,国内与特斯拉的研发进度差距大约在1.5年到2年,而要在商业模式上追赶特斯拉,必须形成产品的规模化。“当数据达到特斯拉级别的百万量级以上,通过对模型的强化训练,智驾可学习视频流,就能直接告诉司机驾驶的方向,像当下流行的ChatGPT一样。”谷俊丽表示。
(本文来自第一财经)