AI+汽车,环境式计算让主动智能无处不在 | 王晓刚2025汽车蓝皮书论坛精彩分享
作者:微信文章近日,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚受邀出席第十七届轩辕汽车蓝皮书论坛,以“AI+将给汽车产业打开什么新版图”为主题,分享了他的深刻思考与独到见解。
▎开源模型与专业垂类模型缺一不可
在推动大模型技术落地的过程中,开源基础模型与垂直领域专业模型这两条路径缺一不可。
一方面,我们要积极拥抱开源,DeepSeek等优秀的开源模型能有效促进社区生态繁荣,加速各类场景的探索与创新。众多厂商基于开源模型进行微调和应用开发,快速实现初步能力,达到70-80分水平。
另一方面,特定领域如智能汽车行业,对模型能力有更深层、专业化的需求。通用模型在理解汽车行业专业知识、特别是处理车载场景(如座舱多模态交互、深度推理)时,并不能非常完美地去解决问题,这时候就需要车载垂类模型。其中的关键就在于,垂类模型需在基础预训练阶段就融入专业知识。例如,在训练绝影的车端多模态大模型时,提前注入车载场景数据,后续微调效果提升明显。若基础模型缺乏相关数据,后期优化就事倍功半。
这同样适用于智驾世界模型。通用视频生成模型(如SORA)难以满足自动驾驶对多摄像头时空一致性的严苛要求,只有将世界模型技术与自动驾驶研发深度结合、持续迭代,才能生成面向量产的训练数据。
▎未来的人工智能会像空气一样,无处不在
智能座舱正成为下一代智能交互的关键场景——基于环境式计算,人工智能会像空气一样,无处不在,它能够时刻感受用户需求,主动提供服务,而不是像过去的智能设备那样只能被动响应指令。
这需要四大要素,包括强大的AI计算力、丰富的多模态传感器、领先的多模态大模型以及持续稳定的记忆能力。
其中,模型的端侧部署是实现“人工智能像空气一样无处不在”的关键,现有依赖云端能力的架构难以满足环境式计算无处不在且实时的感知需求。未来需依托端侧芯片进行MOE架构多模态大模型的本地化部署,确保AI时刻在线。而记忆能力容易被人忽略,但是它是人类情感链接的基础,数据积累形成的“记忆”也会构成新的竞争壁垒。
这四大要素不仅适用于智能座舱,更是具身智能机器人、可穿戴设备等未来智能终端的共性基础。当前在汽车场景下打造的创新交互方式,很有机会向更广泛的智能硬件领域拓展。
同时,在智能驾驶领域,我也非常看好仿真引擎和世界模型。之前端到端辅助驾驶是基于模仿学习的训练框架,有了世界模型之后,结合强化学习,模型有希望能够突破数据的瓶颈、突破人类的上限,把辅助驾驶带到下一个阶段。接下去的1-2年,结合世界模型和强化学习的辅助驾驶技术方案会快速迭代,未来同样能够拓展到机器人等新兴领域。
▎大模型时代,商业模式不能是“芯片论斤卖”,要打造业务闭环
今天的大模型时代,人工智能不再只是单纯的工具,而是需要直接交付结果和完整体验。以智能座舱为例,我们就不能只是提供模型,更需要与车企深度合作,共同面向终端用户输出完整产品,从而构建专业领域的竞争壁垒。
前面提到了具备四大要素的未来新一代智能设备将会颠覆我们使用AI的方式,这其中蕴含着巨大机遇,但想要成功,必须依赖于软件和硬件的深度融合。过去几年,互联网大厂、AI创业公司都在提供通用大模型,模型按Token收费,价格还越来越低,就好像是花了几十上百亿研发出来的芯片“论斤卖”,这样仅通过提供模型能力赚钱的商业模式被证明很难走通,真正可持续的路径是需要打造业务闭环,直接触达消费者。
但是打造业务闭环不一定是全都自己做,其中的关键在于找到明确自己的核心价值和差异化定位,比如在汽车行业,AI操作系统是未来智能汽车的核心之一,但如果AI公司自己打造一个AI操作系统,主机厂们是不会用的,他们一定是要自主可控。可行的策略是聚焦提供高门槛、不可替代的关键AI技术模块,我们称之为AI内核。
AI内核不是通用大模型,后者的可替代性很非常强,但是如原生智能体框架、记忆系统、MOE架构等核心AI能力,既是我们绝影这类AI公司比较擅长的领域,也是别人很难快速模仿和复制的。然后我们将这些能力深度嵌入主机厂的操作系统中,结合车载场景,深度融合智能汽车的软硬件体系,这是行业发展的必然趋势。
页:
[1]