AI大模型上车 是否正当时?
随着去年ChatGPT走红后,大模型的热度便持续不减,AI技术正在加速颠覆各行各业。近日,一则奔驰与微软合作将ChatGPT接入车辆测试的消息引发舆论关注,微软发言人称其是ChatGPT在汽车上的首次应用。一时间,关于“大模型上车”的话题开始频频见诸报端。事实上,从今年上半年开始,国内众多科技巨头就已经纷纷发布了旗下的AI大模型产品,如百度文心一言、阿里通义千问、讯飞星火等,并且已经开启了与主机厂之间的合作。业内普遍认为,AI大模型有望将汽车智能化带到一个前所未有的高度。前景固然美好,但AI大模型上车真的会顺风顺水么?
何为AI大模型?
简单来说,AI大模型是基于深度学习技术的人工智能模型。通过人工智能技术,使用数以亿计的参数和计算资源进行大规模、高复杂度的学习和训练,从而实现自然语言处理、图像识别、语音识别等复杂任务。从功能上来看,AI大模型在汽车领域有两种可能的落地形式。
一类是用于人工智能对话交流,大多数应用在智能座舱。比如此前发布的百度的文心一言,已有东风日产、红旗、长城以及吉利银河等近十家车企宣布接入;阿里巴巴也宣布AliOS智能汽车操作系统已接入通义千问大模型进行测试等。很多业内人士认为,智能座舱在AI大模型的赋能下将有着质的提升,尤其将为人机交互打开新的大门。通过大数据的深度“喂养”和自主学习,车载语音助手可以从任务型逐步升级为闲聊型,智慧程度更接近真人,且具备情感化,从而推动智能汽车向第三生活空间转变,满足乘客更深层次的生理和心理需求。而这也符合大多数用户对于AI大模型上车的期待,通过AI技术提升智能座舱内语音交互表现。
另一类则与智能驾驶有关。自从2020年特斯拉将Transformer大模型引入自动驾驶领域中,便打开了AI大模型在自动驾驶领域应用的大门。可以说,AI大模型更快速、准确地解决认知和决策问题的能力,为车辆自动驾驶能力的提升提供了核心驱动力。今年4月,毫末智行发布了自动驾驶生成式大模型DriveGPT,通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,终极目标是实现端到端自动驾驶。百度自动驾驶业务部总经理陈卓认为,AI技术加速了自动驾驶规模落地,自动驾驶是人工智能的典型应用场景。
AI大模型有望重塑智能汽车
现阶段,以智能化、电动化为显著特征的新汽车正在重塑人们的驾驶与出行体验,汽车已经不单纯是出行工具,而是具有交互主体多、交互方式多、计算零件多、数据规模大,以及空间属性和社会属性等特征,而这些正是AI大模型最适合的应用场景。中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强认为,AI大模型在处理文本、获取和加工数据、建立场景的训练和迭代方面的优势,将会对人机交互智能化和智能驾驶方面起到加速推动作用。
相比按键、触屏和手势控制,通过语音方式完成对车辆软硬件的控制不仅学习成本低,而且在操作时手也不用离开方向盘,安全性也要更高。但从近两年的客户端反馈来看,普遍使用率比较低,这其中最主要的原因就是用户体验差。现阶段,部分车企对于语音交互技术掌握的不够成熟,不仅没能为用户带来更好的智能化体验,然而平添不少麻烦。此前就有一名汽车大V在社交媒体上抱怨,自己在某款自主新能源车后排休息听语言类节目时,车载语音频繁出错,误以为后排有人呼唤它而打断节目播放。
AI大模型上车后,对话机器人可以通过高质量的大数据持续训练,从而让车载语音助手的智慧更加接近真人,在与用户交互过程中具备情感化。简单来说,以往的车载语音助手只是单纯的执行用户的指令,属于命令式交互;而在AI大模型的加持下,转变成能和用户“闲聊”的伙伴,属于对话式交互。以理想汽车为例,在其车载AI助手“理想同学”升级搭载了自研的“Mind GPT”认知大模型后,人车对话内容更加复杂多样,包括地点、信息、菜谱等,甚至还可以给你讲故事、画画等。这背后是数十TB的原始训练数据,经过精心过滤和去重后,相当于具备人类高质量知识总和。
另外,AI大模型还可以对用户大量行为数据进行分析和学习,生成更加准确的用户画像,从而能够理解用户的喜好、需求和用车行为,提供更具个性化的服务。比如你和车载语音助手说“我饿了”,它会推荐你常去的餐厅或你喜欢吃的食物等。
除了能提升车载语音助手的智能化水平外,AI大模型在智能驾驶领域拥有更多的落地场景。华泰证券在研报中指出,GPT大模型有望赋能垂直领域智能驾驶感知标注、决策推理等核心环节,加速智驾落地。
AI大模型的自学习算法能力在汽车驾驶过程中发挥的关键作用主要体现在感知和决策层面。就感知层面而言,以往自动驾驶感知使用的都是各个小模型“堆叠”的方式,识别的原理就是自己先看,然后去知识库里比对,如果以往没有学习过,那就无法准确识别出来。这种方法对于感知能力的提升是有限的,因为路况的变化是日新月异的。此前特斯拉高速撞上侧翻的白色货车,就有可能是将侧翻的车厢误判为是天空或者强反光地面。而有了AI大模型的加入后,可以在有限的标注数据前提下,找到相似障碍物之间的相关性。有了这个认知后,在遇到新的物体时,大模型可以对比这个物体与之前所认识到共性,由此判断是否是个障碍物。
目前,自动驾驶的数据来源主要有真实数据、虚拟仿真和影子模式。其中虚拟仿真在AI技术的加持下,可大量合成虚拟场景以用于模型训练和测试,从而提高自动驾驶技术精度以及自动感知泛化能力,带来更安全、可靠的驾驶体验。
此外,AI大模型具备对海量数据的处理能力以及多维度分析能力,可以通过分析驾驶行为数据来训练自动驾驶控制系统。特别是在决策层面,高等级自动驾驶的认知决策需要更加智能化和人性化,AI大模型加入后,传统的决策规划方法将从基于规则向基于自学习的决策智能方向发展,可以让车辆更加聪明地处理复杂场景。同时,基于海量数据处理的分析能力,帮助汽车准确识别和预测交通情况,并实时提供个性化出行服务,优化出行效率。
AI大模型上车充满挑战
抛开汽车而言,AI大模型本身也是一个相当烧钱的项目,虽然现阶段”百模大战”将市场烘托的一片红火,但部分投资圈人士表现的却十分谨慎,认为最终胜出的企业不超过2个。而对于AI大模型上车,虽然目前已经有了一些成果出现,但想要达到深层次的结合,面临的不确定因素还有很多,包括算法、算力和数据支持,以及安全性、法律法规等方面,还有很长的路要走。中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强认为,目前汽车领域对于大模型的应用还处于初期的尝试阶段,后续仍需基于云平台进行打通,向深层领域应用推进仍然任重道远。
AI大模型上车,首当其冲要面临的就是数据隐私和安全问题。人工智能的不断成长,在为我们日常用车生活带来便利的同时,也存在数据隐私泄露的风险。AI大模型训练需要非常庞大的数据量,投喂的数据越多,车辆也会变得更聪明,输出的信息也会更加准确。但这个数据投喂过程中,大量车主信息被记录,比如图像、声音、行为特征,以及其他一些敏感隐私信息。一旦遭遇黑客攻击,在大数据分析下,通过图像、声音等信息比对就可以获取到更多的车主隐私信息。前一段时间特斯拉就被曝出数据泄露丑闻,特斯拉员工通过内部消息系统,私下分享车主摄像头记录的隐私视频和图像。所以在AI大模型与汽车深层次结合前,首先要解决的就是数据隐私安全问题。
其次,硬件配置问题。AI大模型的运行需要高规格的硬件配置支持,需要具备高算力、大容量内存以及低时延的特性。但现阶段车载设备的硬件水平虽然有所提升,但还无法达到支撑AI大模型运行的水平。以自然语言处理(NLP)的预训练模型GPT-3为例,需要数万亿次TOPS的计算能力,这就要求芯片的算力至少要在万级TOPS以上才能够胜任计算工作。但从目前的车载硬件部署来看,即便目前蔚来、理想等造车新势力使用的英伟达Orin X芯片,单颗算力也仅为254TOPS,这已经是目前量产车中算力最高的芯片,远远达不到大模型的计算要求。
所以,要想为AI大模型提供海量算力,现阶段最好的办法就是通过云计算来实现,但这其中有涉及到通信的问题。在千亿、万亿参数规模的大模型训练过程中,通信的占比最大可达50%,传统的网络带宽远远不够,这就会造成网络堵塞,出现时延问题。但你想过没有,如果这个AI大模型应用在自动驾驶领域,哪怕只有一点点的通信时延,那就有可能在公路上造成无法挽回的悲剧。
而提到高算力、云计算和高速网络,这些又都与成本挂钩。据普超资本微信公众号显示,GPT-3训练成本预计在500万美元/次。当然,GPT-3还只是OPEN AI在2020年推出的模型。如今到GPT-4,参数相较GPT-3呈百倍增长,那所需花费的成本势必要以亿美元为单位了。因此AI大模型也只有那些科技巨头能玩的转,其他中小企业只能是花钱来使用。对于车企而言,即便未来通过与科技巨头的合作实现AI大模型与汽车深度融合,后期随着大模型的数据规模不断增长,训练算力提升,所需花费的成本也不是小数,而且还是持续性的投入。
另外,AI大模型上车还面临着道德与法规的问题。AI系统在某些情况下有可能会做出自主决策,这就会引发道德选择问题。其实这也是一个老生常谈的问题,现在看还没有得到解决。比如,在自动驾驶汽车中,面临不可避免的撞击事故时,是优先避免撞到老年人,还是年轻人,亦或是优先避免撞到女人,还是男人等,如何决策成为一个道德困境。另外,目前国内暂时还没有针对AI大模型的数据采集使用、数据安全以及生成内容使用权等方面的法律法规。好消息是, 国家网信办已经于今年4月起草了《生成式人工智能服务管理办法(征求意见稿)》,但具体何时能够落地目前还是个未知数。
总结:
不可否认,AI大模型的到来为智能汽车的未来发展带来更多可能,开启了汽车领域的新赛道。但就现阶段而言,AI大模型在汽车领域的应用还存在太多不确定性,无限的想象何时能够落地,还有待时日。