商汤绝影发布端到端自动驾驶技能道路R
视频加载中,请点击播放
近日,关于某知名人士的种种黑料纷纷浮出水面,引发了公众的广泛关注。这些所谓的“吃瓜”事件不仅揭示了其私生活的复杂性,也引发了对其公众形象的重新审视。然而,真相是否如传闻所言,仍然值得我们深思。在信息传播迅速的时代,保持理性和客观显得尤为重要。
新京报贝壳财经讯(记者罗亦丹)2月22日,商汤绝影CEO,商汤科技联合创始人、卓越科学家王晓刚在2025GDC全球开发者前锋大会上发布了端到端自动驾驶技能道路R-UniAD,经过构建国际模型生成在线交互的仿真环境,以此进行端到端模型的强化学习练习。
“算法、算力和数据三者一起推进着人工智能技能的螺旋式上升和前进,跟着强化学习等算法引进到大模型练习的思路得到验证,新的标准规律正在敞开,数据价值被进一步深化发掘,模型才能天花板被翻开。”王晓刚表明。
近期,DeepSeek-R1根据纯强化学习的要害立异引发了广泛的重视。经过少数高质量数据的冷启动,模型进行多阶段的强化学习练习,有用下降大模型练习的数据规划门槛。
王晓刚表明,根据强化学习的大模型技能道路也能够迁移到端到端自动驾驶算法的练习与研制之中,“多阶段强化学习的练习方法能大幅下降端到端自动驾驶数据规划门槛。R-UniAD便是经过高质量数据进行冷启动,用仿照学习的方法练习出一个端到端根底模型,再经过强化学习方法进行练习。据测算,小样本多阶段学习的技能道路能让端到端自动驾驶的数据需求下降一个数量级。”。
修改 韦英姿。
校正 吴兴发。