影响特斯拉长期估值的最重要未知变量:自主学习、Dojo、全自动驾驶

影响特斯拉长期估值的最重要未知变量:自主学习、Dojo、全自动驾驶

2020-01-13 18:57:27 猛兽财经

特斯拉—猛兽财经

猛兽财经(www.mengshoucaijing.com)消息:在我们看来,影响特斯拉(Tesla)长期估值的最重要的未知变量是该公司推出自动驾驶服务的能力(或缺乏)。这就是我们密切关注特斯拉最新软件更新的原因,这样我们就有希望更好地了解机器学习背后发生的事情。


特斯拉最近推出了一款名为“全自动驾驶可视化预览版”的软件,该软件更新后可以在汽车屏幕上显示目标检测,显示停车标志、红绿灯(颜色变化)、车道线、转向箭头,甚至垃圾桶。这个可视化看起来有点像一个带有极简图形的视频游戏。


特斯拉显然在继续发展其计算机视觉能力,近期的目标是为城市街道发布新的自动驾驶功能。在这篇文章中,我们将探讨我们认为的特斯拉正在做哪些与计算机视觉有关的事,以及为什么我们认为它在这个领域有竞争优势。


用于计算机视觉的弱监督学习

在我们上一篇关于特斯拉的文章中,我们讨论了人类行为线索如何为相机数据提供自动标签。这些自动标记的数据可以用来训练人工神经网络完成自动驾驶所需的计算机视觉任务。这种方法的技术名称是弱监督学习。我们探索的主要例子是将人类驾驶的区域标记为“自由空间”(即和其他地方的非自由空间。,占用空间)。另一个相关的例子(可能超出了视觉范围)是根据人类驾驶员的方向盘角度来预测道路的曲率:


特斯拉—猛兽财经


除了这些例子,人类行为和环境之间可能存在着各种各样的关系。例如,判断交通灯是红色还是绿色的一个通常很好的(但有一点不完美的)预测器是人类司机是停还是走。对于特斯拉来说,弱监督学习的优势在于,它能够比Cruise (GM)和Waymo (GOOG, GOOGL)等竞争对手多收集大约1000倍的自动标记训练数据。根据百度(BIDU)的研究,拥有1000倍以上的数据,特斯拉在能够获得自动标签的任务中,在神经网络性能上可能比竞争对手高出10倍或更多。


弱监督学习与全监督学习形成对比,全监督学习是计算机视觉中最常见的深度学习形式。在全监督学习中,图像或视频需要人工标注。全监督学习只能扩大到人力成本无法承受的程度。然而,它可以与弱监督学习等方法结合使用,因此,我们认为,在可预见的未来,它将继续发挥重要作用。


自我监督学习的计算机视觉


自我监督学习是另一种试图避免人工标记数据的劳动成本的方法。顾名思义,在自我监督学习中,数据是自我监督的。也就是说,告诉神经网络哪个输出正确,哪个输出错误的训练信号来自于数据本身。让我们举一个具体的例子。

像特斯拉这样的公司可以从车上的摄像头收集大量的图像数据。自我监督学习可以尝试学习这些图像的内部结构。通过对一个任务的训练,这个任务是我们真正想让神经网络做的事情的代理。技术术语称为代理任务(也称为借口任务)。


特斯拉—猛兽财经


例如,代理任务可能是取一个已经删除了随机补丁的图像,然后填充缺失的像素。在训练过程中,神经网络可以得到完整的、未经修改的图像。在测试时,神经网络会显示一组它从未见过的新图像,随机的小块缺失。通过将生成的像素与实际丢失的像素进行匹配,可以判断网络的准确性。

在训练类似这样的代理任务的过程中,神经网络学会了在内部代表物理世界的各个方面,包括汽车、人和自行车等物体,以及道路、人行道和草地等表面。


对一个代理任务(或多个代理任务)上的神经网络进行训练称为预训练。同样的神经网络也可以在手动标记的图像或视频上进行训练,这就是所谓的微调。注释器在像汽车这样的物体周围绘制三维方框,并对像道路这样的表面的每个像素进行颜色编码。神经网络学习这些明确的标签更快更好,因为它已经有这些视觉现象的内部表征。在全监督学习过程中,网络改进了这些现有的表示,并将它们与显式标签关联起来。这就是自我监督训练如何提高完全监督学习的表现。


在DeepMind最近发表的一篇论文中,研究人员发现,在自我监督的预先训练下,一个只给出一半手工标记的图像训练示例的神经网络,在图像识别方面要比给出两倍示例的同一个神经网络做得更好。因此,自我监督的预训练可以使神经网络的数据效率提高一倍以上。

在另一个版本的实验中,研究人员只给一个预先训练好的神经网络1%的典型手工标记的训练数据集。它用5%的训练数据击败了未经训练的网络。这是数据效率的五倍多。


深度学习的实践者认为,自我监督学习是一个有吸引力的研究领域,因为如果这个难题能够解决,它将改善计算机视觉(和其他深度学习任务),这些任务通过数据和计算来扩展,而不是通过人工劳动。YouTube上有数十亿小时的视频。谷歌已经收集了35万小时的YouTube视频剪辑,用于深度学习研究。


特斯拉约有75万辆车配有8个环绕摄像头,平均每天行驶约一小时。整个车队每个月大约有2000万小时的360度视频,每辆车上的8个摄像头每个月大约有1.7亿小时的视频。这是更多的视频比以往任何时候都是经济可行的手工标签。但是,如果有合适的代理任务,自监督学习可能会从视频海洋中自动管理的一小部分中提取出好的表现形式。这些表示可以将全监督学习的数据效率提高许多倍。


特斯拉—猛兽财经


特斯拉如何将自我监督学习用于计算机视觉


在今年4月的特斯拉自治日(Tesla Autonomy Day)上,首席执行官埃隆马斯克表示,自主学习是公司的首要任务。马斯克说:【这辆车是一台经过优化的计算机。我们在特斯拉有一个重要的项目——我们今天没有足够的时间来讨论,它——叫做Dojo。它是一台超级强大的训练电脑。Dojo的目标是能够在视频级别接收大量数据,并使用Dojo计算机对大量视频进行无监督的大规模培训。但那是以后的事了。”】


在最近的一次谈话中,特斯拉的高级人工智能总监Andrej Karpathy说,Dojo训练计算机的目标是以较低的成本实现性能上数量级的提高。目前还不清楚Dojo的开发进度,也不清楚它将在何时部署。

特斯拉拥有大约75万辆配备了摄像头、可联网的汽车,它可以使用主动学习来选择保存那些视频片段,并通过Wifi上传。主动学习是指通过各种方法选择最具指导意义的训练实例,使学习尽可能有效。例如,英伟达(NVDA)开发了一种方法来自动选择视频帧以用于训练,不同的神经网络对视频帧内容的分歧意味着这些帧将被使用。然后,英伟达将这种自动方法与付费请人查看视频片段和手动选择视频帧进行了比较。研究发现,当对自动选择的样本进行训练时,神经网络的性能比手动选择的样本提高了3-4倍。


因此,我们强烈怀疑特斯拉将使用主动学习来自动管理其车队的视觉数据,并将使用这些视觉数据通过Dojo加速的自监督学习来自动训练神经网络。前述的深度学习先驱扬•勒昆(Yann LeCun)预测,研究人员即将在视频自监督学习方面取得突破。他预计,到2020年,深度学习的实践者将最终能够认真地进行视觉数据自主学习。当这种情况发生时,我们相信特斯拉在基于视频的任务上可能会取得与DeepMind在图像识别上同样的结果:数据效率提高一倍、五倍甚至更多。


同样值得注意的是,主动学习可以应用于任何形式的数据收集,就像特斯拉对机器学习所做的那样。当训练实例被手工标记时,主动学习使劳动更有效率。当带宽、数据存储或计算成为约束条件时,主动学习允许特斯拉在这些约束条件下获得更多的神经网络性能。在路上行驶着约75万辆汽车的特斯拉,想必会比竞争对手遇到更多数量级的顶级例子。在计算机视觉方面,特斯拉不仅具有数据量优势的自监督学习和弱监督学习,还具有主动学习的优势,形成了良好的全监督学习。主动学习也适用于计算机视觉之外的领域。


激光雷达呢?


众所周知,特斯拉不使用激光雷达,也没有计划这样做。Mobileye (INTC)最近发布了一个令人印象深刻的演示视频,展示了它的一辆自动驾驶测试车在耶路撒冷的交通中行驶,只有8个摄像头作为传感器。测试车的计算能力也只有特斯拉最新车型的三分之一。


我们的观点是,如果像Waymo这样的竞争对手用激光雷达证明了自动驾驶是可能的,特斯拉没有激光雷达就无法开发自动驾驶,那么转向激光雷达对特斯拉来说就不会是一个巨大的挑战。特斯拉将在这场游戏中非常晚,但它也将在自动驾驶的几乎所有主要领域拥有大规模车队数据优势,除了激光雷达感知,包括计算机视觉。如果Waymo是第一家大规模推出真正的自动驾驶汽车业务的公司,我们相信特斯拉会快速跟进。在这种情况下,对特斯拉来说,收购一家长期致力于激光雷达感知的自动驾驶汽车初创公司可能是一个战略上的明智之举。


有了自动驾驶汽车车的收入,特斯拉可以为购买了全自动驾驶汽车的客户做一些事情,比如为他们提供汽车改装服务,自己买回汽车进行改装,或者一次性给他们一笔现金。

同样的思想也适用于计算硬件。如果特斯拉的量产汽车没有足够的计算能力来运行足够大的自动驾驶神经网络,它可以转向一种类似waymo的方法,在其自动驾驶汽车上安装昂贵的重型硬件。


行为预测的自监督学习


特斯拉自动驾驶系统的三个主要组成部分是计算机视觉、行为预测和规划。计算机视觉就是汽车看到的东西。行为预测是指预测路上行人、骑自行车的人、车辆、动物和其他移动物体的动作和轨迹。规划是汽车如何决定采取什么行动,以及如何决定它在空间和时间中的轨迹。

特斯拉可以用一种非常类似于勒昆预测计算机视觉自我监督学习的方式来训练神经网络进行行为预测。行为预测神经网络不需要预测未来的视频帧,只需要预测一个抽象表示的轨迹,就像一个围绕着车辆的三维边界框。训练是自我监督的,因为计算机视觉系统会告诉预测系统边界盒是否按照预测的轨迹运动。不需要人工注释。


模仿学习和计划强化学习

预测中使用的类似3D包围盒的抽象表示也可以用于规划。神经网络可以通过两种方式来学习规划。他们可以通过模仿人类行为来学习,这就是所谓的模仿学习,或者他们可以通过反复试验来学习,这就是所谓的强化学习。


模仿学习和强化学习相结合可以产生比任何一种单独的技术更好的性能。神经网络和手工编码软件也可以结合使用,使系统更好地处理缺乏训练数据的新情况。当神经网络不自信时,系统可以依靠手工编制的计划表。

在以后的文章中,我们将对模仿学习和强化学习有更多的阐述。


万亿美元问题


综上所述,特斯拉的大规模车队数据结合主动学习,有以下五个方面具有优势:


1、完全监督的计算机视觉学习(即自动标图像和视频培训)。

2、用于计算机视觉的弱监督学习(即在图像和视频上使用驱动程序生成的标签)。

3、用于计算机视觉的自监督学习(即使用视频的一部分预测视频的其他部分)。

4、用于预测的自监督学习(即使用抽象表示的过去行为(如边界框)来预测其未来行为)。

5、用于计划的模拟学习和强化学习(即利用人类行为和现实世界经验训练神经网络,以抽象表示作为输入做出驾驶决策)。


根据我上面提到的百度在这方面做的研究,在任何一个特斯拉能够收集到1000倍于竞争对手的训练数据的领域(即上面列出的第2、4和5项),它的神经网络性能最终可能会提高10倍。在大规模应用主动学习的地方(即列表中的所有五项,包括1和3),表现也可能高出数倍。例如,对于熊、驼鹿等珍稀野生动物或拖拉机等不常见的交通工具,特斯拉可能比车队规模很小的竞争对手多收集1000倍的样本。


这将足以解决自动驾驶吗?这是一个万亿美元的问题。ARK Invest的财务模型计算出,500万辆自动驾驶汽车车将为特斯拉带来1.4万亿美元的市值和6100美元的股价。全球自动驾驶汽车公司的总市值为4万亿美元。


仅在中国,麦肯锡就预计,当三分之二的乘客里程是全自动驾驶时,自动驾驶汽车的销售每年将创造2万亿美元的收入。

问题是:全自动驾驶汽车可能吗?

或许最鼓舞人心的消息是,Waymo终于为一些early access的测试者部署了无人驾驶的游乐设施


还有待观察的是,无人驾驶汽车是否能够安全地扩大规模,Waymo的统计数据必须表明,无人驾驶汽车比人类驾驶汽车更安全。我们希望Waymo能让无人驾驶成为一种常态,而不是例外。我们也希望它能发布一些严格的安全数据,向世界证明它正在做出一个审慎的决定。

克鲁斯在一份内部报告泄露给新闻界时,无意中向公众提供了其中一些数据。报告包括2019年年中做出的内部预测,到2019年底,克鲁斯的自动驾驶汽车将达到人类安全水平的5-11%。对我来说,这是令人鼓舞的,因为它表明,如果克鲁斯的预测被证明是正确的,那么现在只需要“10倍”到25倍的改进就可以实现比人类更高的安全性。对我来说,这比1000倍的数字更令人鼓舞。百度、DeepMind和英伟达的研究表明,在机器学习领域,10倍的进步并非闻所未闻。


我们最关注的是特斯拉发布的全自动驾驶技术,它本质上是自动驾驶的一个版本,,可以在城市街道和郊区运行。如果功能完整的全自动驾驶的最初版本与自动驾驶和智能导航的第一个版本有着同样的缺陷,我们一点也不惊讶。不过,我们预测,特斯拉将有一个很完善的版本,在1-3年内其首次发布。我们不知道何时或如果全自动驾驶将到达,但我们有信心预测特斯拉至少不远有未来的驾驶辅助技术,这将可能令传统汽车制造商非常羡慕。这不仅是电气化的一个开端,也有助于特斯拉在全球汽车市场开拓出一个丰田(Toyota)规模的市场。





猛兽财经致力于让每一个不甘心的青年人学会港美股投资,体验在世界上最成熟最合规的市场里做世界头号公司股东的乐趣和刺激。让每一个青年人有尊严、平等通过港美股投资获得自由。


猛兽财经


我们像猛兽一样关注着全球汹涌澎湃的美股、港股、创投等资本市场,并且为投资人和初创企业、上市公司、金融机构提供专业的财经资讯港美股研究分析金融圈社交品牌营销会议定制服务财务顾问(FA)服务IPO咨询海外营销财经公关港美股投资者关系维护等服务,欢迎需要以上服务的朋友联系我们。猛兽财经旗下还运营着一款基于地理位置的陌生人金融社交平台:金钱世界社区。


猛兽财经扫描二维码即可关注猛兽财经金钱世界微信公众号”即可加入猛兽财经港美股微信交流群与来自中国及全球各地的港美股投资者一起交流和参加线下活动。


猛兽财经                                 猛兽财经