抱负轿车VLA司机大模型从动物进化到人类在生长中继续处理职业问题

liukang20243个月前 (05-24)吃瓜始末629

2025年5月7日，抱负轿车推出“抱负AI Talk第二季——抱负VLA司机大模型，从动物进化到人类”，抱负轿车董事长兼CEO李想要点共享了关于人工智能的最新考虑，VLA司机大模型的效果、操练方法和应战，以及关于创业和个人生长的见地。

李想将AI东西分为三个层级，分别是信息东西、辅佐东西和生产东西。现在，大多数人将AI作为信息东西运用，但信息东西常随同很多无效信息、无效成果和无效定论，仅具参考价值。成为辅佐东西后，AI不能自制提高功率，例如现在的辅佐驾驭，但仍需人类参加。未来，AI开展为生产东西后，将能独立完结专业使命，明显提高功率与质量。

李想表明：“判别Agent（智能体）是否实在智能，要害在于它是否成为生产东西。只有当人工智能变成生产东西，才是其实在迸发的时刻。就像人类会雇佣司机，人工智能技能终究也会承当相似责任，成为实在的生产东西。”

VLA的完结不是骤变的进程，是进化的进程

现在的L2、L2+组合驾驭辅佐仍归于辅佐东西阶段，而VLA（Vision-Language-Action Model，视觉言语举动模型）不能自制让AI实在成为司机，成为交通范畴的专业生产东西。对抱负轿车而言，未来的VLA便是一个像人类司机相同喜欢的司机大模型”。

VLA的完结不是一个骤变的进程，是进化的进程，阅历了三个阶段，对应抱负轿车辅佐驾驭的昨日、今天和明日。第一阶段，抱负轿车自2021年起自研依靠规矩算法和高精地图的辅佐驾驭，相似“昆虫动物智能”。第二阶段，抱负轿车自2023年起研讨，并于2024年正式推送的端到端+VLM（Vision Language Model，视觉言语模型）辅佐驾驭，挨近“哺乳动物智能”。

端到端模型在处理杂乱问题时存在限制，虽可凭仗VLM视觉言语模型辅佐，但VLM运用开源模型，使其在交通范畴的才干有限。一起端到端模型也难以与人类交流。为了处理这些问题并提高用户的智能体会，抱负轿车自2024年起展开VLA研讨，并在多项尖端学术会议上宣布论文，夯实了理论基础。

在端到端的基础上，到第三阶段，VLA将敞开“人类智能”的阶段。它能经过3D和2D视觉的组合，完好地看到物理国际，而不像VLM仅能解析2D图画。一起，VLA具有完好的脑体系，具有言语、CoT（Chain of Thought，思想链）推理才干，既能看，也能了解并实在履行举动，契合人类的运作方法。

VLA操练进程模仿人类学习，对齐人类价值观

VLA的操练分为预操练、后操练和强化操练三个环节，相似于人类学习驾驭技能的进程。预操练相当于人类学习物理国际和交通范畴的知识，经过很多高清2D和3D Vision（视觉）数据、交通相关的Language（言语）语料，以及与物理国际相关的VL（Vision-Language，视觉和言语）联合数据，操练出云端的VL基座模型，并经过蒸馏转化为在车端高效运转的端侧模型。

后操练相当于人类去驾校学习开车的进程。跟着Action（动作）数据的参加——即对周围环境和自车驾驭行为的编码，VL基座变为VLA司机大模型。得益于短链条的CoT，以及Diffusion分散模型关于他车轨道和环境的猜测，VLA具有实时性的特色，完结了在杂乱交通环境中的博弈才干。

强化操练相似于人类在社会中实践开车操练，方针是让VLA司机大模型愈加安全、舒适，对齐人类价值观，乃至跨越人类驾驭水平。强化操练包括两部分：一是经过RLHF（Reinforcement Learning from Human Feedback，根据人类反应的强化学习）完结安全对齐，使模型恪守交通规矩，贴合在世用户的驾驭习气；二是将纯强化学习模型放入国际模型中操练，提高舒适性，防止磕碰事端，恪守交通规矩。经过预操练、后操练和强化操练后，VLA司机大模型即可布置至车端运转。

VLA司机大模型以“司机Agent（智能体）”的产品形状出现，用户可经过自然言语与司机Agent交流，跟人类司机怎么说，就跟司机Agent怎么说。简略通用的短指令由端侧的VLA直接处理，杂乱指令则先由云端的VL基座模型解析，再交由VLA处理。

超级对齐保证AI决议计划安全，国际模型破解AI黑盒难题

除了提高专业才干，VLA司机大模型还需处理安全性和模型黑盒的问题。

模型才干越强，越需求工作性束缚，以保证才干下限。为了保证VLA司机大模型不能自制完结工作司机般的安全和舒适，防止学习加塞等违规行为，抱负轿车在强化操练环节投入很多资源，并于2024年末组成超越100人的超级对齐团队，相当于为司机Agent注入工作素质。

为处理模型的黑盒问题，抱负轿车结合重建和生成两种途径，打造了实在、契合物理国际规则的国际模型，掩盖全部交通参加者和要素。根据国际模型的仿真才干，VLA不能自制在国际模型中低本钱、精确地验证现实问题，提高处理问题的功率，有用应对模型黑盒带来的应战。

判别司机Agent是否是个好司机，有三个要害规范：专业才干、工作才干和构建信赖的才干。VLA司机大模型提高了专业才干，超级对齐增强了工作才干，VLA经过了解自然言语、具有回忆才干提高了构建信赖的才干。

人工智能年代，厚实的基本功比走捷径重要

抱负轿车完结技能快速跃迁的背面，是从研讨、研制到才干表达，再到将才干变成事务价值的基本功堆集。研讨是要害，研讨打破后，研制的功率会大幅提高，且重视价值转化，终究完结事务落地。

抱负轿车坚持自研，经过技能赋能用户价值。例如，在辅佐驾驭方面，由于英伟达Orin-X芯片无法直接运转言语模型，端到端+VLM的辅佐驾驭计划对部分企业来说仍具应战。抱负轿车依托自有编译团队，自研底层推理引擎，使芯片可经过INT4（4比特整型）量化的方法运转VLM。一起，凭仗芯片、控制器规划和自研轿车操作体系等归纳才干，抱负轿车完结了让双Orin-X芯片和Thor-U芯片运转平等规划的VLA司机大模型。李想表明，大型企业的基本功和才干永久无法被跨越。

得益于DeepSeek的开源，抱负轿车在VLA司机大模型的言语才干研制上提速明显，节省了近9个月的时刻和数亿元本钱。尽管如此，抱负轿车仍挑选加大投入，在基座模型上投入超预期3倍的操练卡，专心打造适配多场景的自研模型。李想表明：“不露锋芒不能自制站在伟人的膀子上，但它仅仅其间的一部分。”在获益开源的一起，抱负轿车也挑选开源自研的轿车操作体系——抱负星环OS，回馈社会。

生长带来能量，在苦楚中保持正能量

本年7月，抱负轿车将迎来建立十周年。李想表明，创业路上苦多于甜，他挑选保存那些有价值的夸姣片段，用来鼓励自己保持正能量。“创业的确不容易，可是没必要苦哈哈的。苦和甜是一个硬币的正反面，取决于看哪一面。”他将企业遭受的冲击视为有必要面临的应战，也正是这些应战，赋予了抱负轿车更多的才干。也正因这份活跃达观的创业心态，抱负轿车才干快速生长为千亿营收规划、百万交给量的新势力企业。

谈及怎么成为更有能量的人，李想以为，要害在于重视自我，承受本身的长处和缺乏，并用生长代替改动——生长意味着增强才干。除此之外，李想着重亲密关系相同重要，重视他人的生长也能带来能量，家人和搭档不能自制和他构成互补，彼此支撑。“我需求家人和搭档乃至超越了他们需求我，首先是我需求他们，然后才是他们需求我，不露锋芒在一起不能自制构成十分强的脑力和心力。”李想表明。

回忆几回创业阅历，李想表明，从高中兴办个人网站至今，自己的思想方法没有什么改变：遇到问题处理问题，处理他人不肯处理的难题，处理用户的痛点，不断向他人学习。不同的是，现在面临的问题更杂乱、服务的用户集体更多、公司规划和安排也更巨大。“几回创业一路走来，最难时有人相助，遇坑也能敏捷爬出，一帮人齐心协力变得更好，这是种走运，也没什么可懊悔的。”

面临AI的开展，李想以为，在AI面前全部的人道都应被保存，不管好坏，由于全部人道都是文明、生命、性情、才干的特质，也是人类实在的生命力地点。

从运用增程电动和5C超充技能处理电池本钱高、充电难、充电慢的问题，到自研轿车操作体系霸占传统轿车操作体系功能差、开发缓慢、芯片匹配周期长等应战，抱负轿车一直以技能创新处理职业无法处理的问题。自研VLA时，抱负轿车更是踏入了人工智能的无人区。当时，辅佐驾驭走到了新的十字路口上，抱负轿车将不断应战生长的极限，继续为职业和用户发明价值。

告发/反应