伴随着自动驾驶进入下半场,有关自动驾驶技术的竞争也进入了全新阶段。
在10年前的硬件驱动时代,通过对感知设备、算力芯片等硬件的不断投入,自动驾驶的感知能力得到大幅增强,逐步实现了感知万物的能力。
在过去几年的软件驱动时代,基于深度神经网络算法的深度学习开始被引入自动驾驶领域,并通过大规模运用,驱动着算法模型不断走向成熟。
通过对硬件与软件的不断迭代升级,自动驾驶的感知与认知能力得到先后提升,而如何收集并应对corner case场景、化解长尾难题,成为接下来的发展重点。
在当下开启的数据驱动时代下,用大数据训练深度神经网络、提升自动驾驶迭代速度,已经成为行业内的共识,而这一点则在智能电动车领军者的特斯拉与国内自动驾驶公司毫末智行身上得到了率先体现。
在今年9月的HAOMO AI DAY上,毫末智行提出了自动驾驶3.0时代的概念。毫末智行认为,由硬件与软件驱动的自动驾驶1.0与2.0时代已接近尾声,由数据驱动的自动驾驶3.0时代正在开启。
在自动驾驶3.0时代下,自动驾驶企业需要具备获取海量数据的能力,并借助积累的软硬件能力,建立以数据驱动算法模型快速迭代的数据闭环。通过对海量数据的使用,特斯拉率先进入了数据驱动的自动驾驶3.0时代,而毫末也在全力冲刺的过程中。借助规模化量产能力,二者都能够源源不断地积累足够的真实场景数据,这是迈向3.0时代的关键。
但海量数据只是基础,如何保证高效率、低成本的数据处理,才能将其转化为有价值的数据,在成功建立数据闭环的同时,真正加速自动驾驶迭代。
以下,我们不妨看看特斯拉与毫末智行是怎么做的。
特斯拉:强化自动标注&训练能力,建立数据闭环
数据是驱动特斯拉自动驾驶技术迭代的核心,而负责将数据流转化为迭代驱动力的则是特斯拉的数据引擎,这是特斯拉得以建成数据闭环的关键。
数据引擎是特斯拉数据驱动系统的一部分,另外两个部分分别为自动标注系统和仿真系统。其作用在于,对高价值数据进行采集,也就是corner case数据。
通过数据引擎,采集到的高价值数据将被送到自动标注系统快速的生成真值,用来迭代神经网络模型。而仿真系统则将进行测试,以此更新数据引擎的采集策略。
具体来看,每一款特斯拉量产车都配备有影子模式,它会在用户驾驶过程中收集各类驾驶数据,其中就包括高价值的corner case数据。
而为了从终端生成的海量数据中快速标注到corner case数据,特斯拉首先设置了一道“触发机关”,对需要的corner case数据类型进行设定。
通过触发机关,影子模式会重点关注对应的corner case数据,通过手动清洗及自动标注生成验证集与标签,并与其它真实、仿真数据混合,构成用于训练模型的数据集。
通过这一数据集,特斯拉得以建成数据闭环,首先是经过训练后的新算法模型同步至终端,经过影子模式采集触发新的corner case数据,再由此进行清洗、标注与混合,然后继续训练算法模型。
通过如此循环,特斯拉能够借助量产车队的扩张,收集并训练更多的corner case,从而逐步化解长尾难题,而这又要求特斯拉具备更高效的数据标注及训练能力。
建立数据闭环需要强大的算力与算法性能支持,对于这一点,特斯拉一方面自研高度拟合算法的算力芯片,另一方面则建立起了大数据+大模型的组合。
特斯拉引入了Transformer大模型,不同于传统的CNN和RNN模型,这一具备Attention机制的深度学习模型具备并行计算的能力,且训练数据集越大,训练效率越高。
以Transformer大模型为基础,特斯拉又引入了Occupancy网络,用以建立完全计算机语义的稠密3D点云地图。
在Occupancy网络中,所有网格都通过自动标注,由此可以帮助特斯拉实现高精度的轨迹预测,实现基于规划器的实时的规控策略输出能力。
与此同时,特斯拉也能对车主真实数据进行快速自动标注生成真值,对算法模型进行迭代,由此训练后的模型会更接近人类驾驶风格。
为了从海量数据中高效率筛选优质数据进行训练,特斯拉采用人工+自动标注的方式,建立了针对海量原始视频数据的视频训练库。
这一训练库的优势在于,不仅能够将数据直接提供给云端进行训练,其视频的格式也与特斯拉纯视觉路线的拟合程度更高,这又进一步提升了训练效率。
另一方面,经过训练的算法模型,会在基于Transformer大模型建立的仿真世界中进行验证。和建立感知世界的方式相似,仿真世界也以特斯拉从终端感知系统获取的数据重建,并且为了保证足够真实,还使用了虚幻4引擎进行渲染。
特斯拉的仿真世界不仅能对真实场景进行重建,也能生成随机场景,并针对一些现实中非常少见的场景进行定向数据增强,实现对包含corner case数据集的更高效训练。
而如果在验证中发现了失效场景,特斯拉就会以此进行重新训练,直到验证通过,由此化解corner case,而长尾难题也将由此逐步被化解。
可以看出,特斯拉的数据闭环是非常追求高效的,这不仅体现在对数据引擎、自动标注和仿真系统效率的不断提升,其与感知、算力系统也做到了高度的拟合,使整个数据闭环在“提效”的同时还做到了“降本”。
毫末智行:引入自监督与增量学习,提升标注&训练效率
毫末智行在成立之初就确立了数据驱动的发展策略,这使其非常重视对数据闭环的建立;而具体的建立方式,则与特斯拉大同小异。
毫末的数据智能体系与特斯拉相仿,首先通过量产车收集用户的真实驾驶数据,再从中标注高价值的数据,通过Transformer大模型进行算法模型的预训练。
由预训练得到的算法模型具备拟人化思维,能够输出更接近人类驾驶风格的规控策略,而在使用前,这些算法模型还将在仿真系统中进行验证与训练。最终,通过真实场景与仿真系统训练获得的新模型将在满足常规场景的基础上,逐步实现对各类corner case场景的拟合。
不同之处在于,毫末希望更大程度提升数据标注及训练效率。毫末智行认为,想要进入自动驾驶3.0时代,需要积累至少1亿公里的行驶里程数据。而当自动驾驶行驶里程突破1亿公里后,现有的自动标注及训练效率将无法满足海量数据的需要。
目前,毫末智行在过去一年多时间已经积累了超过2000万公里的辅助驾驶行驶里程,基于未来数十款近百万辆的预计搭载量,智能驾驶行使里程突破1亿公里将水到渠成。
另外,Transformer大模型需要大数据才能释放全力,尤其是包含各种corner case场景的数据,这意味着毫末智行需要寻找一种更高效的方式。
所以毫末的对策是,在不断提升自动标注效率的基础上,提出采用自监督学习来有效的利用未标注的数据。
在没有自监督学习前,感知系统想要从数据中提取特征,需要经历从底层特征到高层特征的逐步筛选的过程,既占用算力,也影响效率。而引入自监督学习后,毫末能够通过建立由海量未标注数据构成的3D场景,学习通用的底层特征,这类似于在重装电脑的过程中,为用户预装一套常用软件,从而为用户省去后期自行搜索、安装软件的时间和精力。
自监督学习的加入能够帮助感知系统在获取特征的过程中直接省去了一个步骤,而通过自监督学习和监督学习混合,毫末智行的训练效率与精度也有大幅度的提升。
训练方面,虽然在一亿公里后,毫末将拥有一个体积庞大的数据库,但这并不意味着其能够彻底化解长尾难题,依旧需要包含有corner case的高价值数据进行训练。
这将导致两个问题,第一是,在融入corner case数据后,数据库的整体训练效率会相对较低,因为数据库体量太大了;第二则是,新数据有被数据库快速稀释掉的隐患。
为此,毫末又建立了增量式学习训练平台,其原理是,在限定数据规模的前提下,尽可能多的保持其中所包含的信息量。
在获取到高价值的新数据后,采用增量式学习训练平台的毫末并不会直接将其融入数据库进行训练,而是从数据库中摘取一部分,再与新数据进行耦合。
通过耦合,毫末将确保耦合后的数据满足自然界数据的一般分布规律,然后再用这一数据去训练算法模型。
采用增量式学习训练平台的好处是显而易见的,既能保证数据库在拥有巨大存量数据的情况下依旧能对新数据保持敏感,又能进一步提升训练效率。
除了提升标注及训练效率,毫末智行还在通过优化仿真系统来提升训练效果,但不同于特斯拉的是,现阶段的毫末还不能完全借助感知数据建立仿真世界。
为此,毫末智行又选择了与阿里、德清政府合作,通过获取真实世界交通流,不断完善自身的仿真世界,让仿真系统能够与时俱进,实现对更多场景的模拟。
可以看出,毫末智行的数据智能体系,是建立在强大的量产能力基础上的,而通过提升数据处理能力来打造高效的数据闭环,则能够快速有效地将量产优势转化为迭代优势,促成整个自动驾驶系统的正向循环。
下半场竞争已经开始,数据闭环定成败
数据驱动时代下,特斯拉与毫末智行为自动驾驶企业如何建立数据闭环、利用数据驱动自动驾驶快速迭代做出了示范,并展示了各自不同的理解:
特斯拉结合其软硬件一体与工程实现能力,将自动标注与训练能力发挥到了极致,并建立了与自身纯视觉路线完全拟合的仿真世界与数据训练库。
而毫末智行则结合数据智能体系与量产优势,在辅助驾驶行驶里程快速增长阶段,就给到了更进一步提升标注与训练能力的方法。
在数据驱动时代下,自动驾驶企业必须要为更高效进行数据处理做好准备。而数据标注、训练、仿真本身也是实现自动驾驶的必修能力。
对此,毫末智行坚定地认为,随着自动驾驶技术的不断成熟,算法将逐步走向趋同、直至合流,届时数据就将成为决定自动驾驶能力的关键。
在这一趋势下,“数据自由”将成为自动驾驶企业的新奋斗目标,而为实现“数据自由”,自动驾驶算力性能也需要随之增强,这又要求自动驾驶企业掌握“算力自由”。
对于“算力自由”而言,特斯拉与毫末智行的自研算力平台与超算中心已经给出了答案,这将进一步加速特斯拉与毫末智行自动驾驶迭代速度,推动“数据自由”更快实现。
自动驾驶下半场竞争已经开始,数据闭环能力成为自动驾驶公司成败的关键。谁能掌握数据闭环能力,谁才最有可能在下半场竞争中走到最后。
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及中文陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。凡注明为其他媒体来源的信息,均为转载自其他媒体,转载并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件由任何怀疑或质疑,请即与CSDN联系,我们将迅速给您回应并做处理。】
