Chen Yuanpei:具体的智力最终需要TOC

8月8日至12日,举行的“ 2025年世界机器人会议”向北京经济和技术发展区开放。“ AI大型模型授权机器人和体现的智能行业新范式交换活动”是8月8日举行的2025年世界机器人会议的特别活动。 以下是语音成绩单: 今天,我将与您分享一些不同的事情,并与您谈谈灵巧操作领域未来发展与合作的一些历史。 我们认为,体现身体的领域主要由四个方面组成,首先是本体论。这可以确定您正在制作的方案,收集哪些数据以及数据将用于训练算法。 一个非常重要的一点是,您的算法可以指定硬件,因此我们期望要做的是循环过程。根据算法,我们可以确定您需要哪种智能手,什么与它们不同指标。 对于算法,我们通常将其分为四个级别。第一级不是标准自动化。 CVS和其他方法的使用可以进行一些相对固定的操作,但是概括是非常有限的,并且会过渡到其他情况和一些问题。 第二级具有一些集中数据馈送的端到端算法,并且可以进行一些相对聪明和一般的操作,但是尚未解决的是长期任务确实很困难,第二个是成功率的问题。从本质上讲,研究模仿是为了产生数据分布,而您不知道这项工作的具体目的。因此,我们在Lingchu定位开始时制作的L3是多年生和敏捷性的。我们认为,VLA技术和增强技术在这里更为重要。 VLA被分为端到端的体系结构已成为一个相对较大的共识。我们建议在那个时候,大脑和小脑。但是我们认为,有一个从未得到充分解释的观点,即如何完成长期任务以及如何添加强化研究。这两个是我们公司的伟大。 这是培训我提前进行的强化教育的任务。许多朋友问我,在这么多演示中,真的很难说是通过模仿研究完成的,哪一个是对强化的教育。但是想想这是一个更好的例子。很难收集模仿研究数据,因此应通过加强研究来实现。这也是我们一开始的亮点。 它的整个系统由两个敏捷的手和两个手臂组成。我们还在此处使用一些多重增强和联合培训。在模拟中,通常以各种姿势姿势。总体效果也处于不同形式的事物,包括投掷位置,但我们有相对较快的捕获速度,这也反映了研究加强高动力和高敏捷活动的好处。 之后,我们做了一项任务,将长期任务用两只手和手连接起来。合成活动非常狂热。例如,诸如饺子饺子之类的任务是由八种不同技能组成的。为什么我选择一只聪明的手?我们不想只做一个任务,因此我们正在考虑如何使用机器人进行相对设定的活动,例如Lego,可能涉及搜索,癫痫发作,进入等。后来有许多操作操作,包括经验丰富的活动,例如癫痫发作,钢琴弹奏等。 这些任务中的大多数仅包括使用任务。许多人认为两项任务更容易连接。单独训练任务是足够的,但是我们有一个更好的例子,例如从桌子上选择锤子。我们可以单独训练,但实际上,连接水平相对较低。事实证明,我的previou状态的尽头抓住工作的任务可能是更大的蓝色圆圈,但下一个任务是内部较小的圆圈可以成功。因此,此空间将导致两个连贯的链接在一起,但不必正确连接,因此我们建议进行双向优化的图。 换句话说,我们考虑了整个过程,并且我们已经使用了先前对后续结果的成功或失败的引用。在此过程中,我们参与了加强研究的研究,并考虑了如何做下一个和更适合上一个任务的研究。 除此之外,我们将此大纲应用于开发乐高的任务。其中有4种技能,看着乐高堆,然后面对,插入和插入。所有这些事情实际上是我们使用加强研究对我们训练的,并且使用了我们的一组方法将它们连接在一起。它有几个概括的节目,我们可以在不同形状的不同对象中概括。 完成后是锻炼,您可以在里面找到它,然后 - 在塞子面上拿起并插入它。它可以取得更好的结果,包括许多已插入并且不再插入的对象。 这是我们的新系统,这是最终的总体影响,也相对稳定。例如,如果它自动在相同的真乐高堆上自动flip,则转动插入并说出,然后将其插入并插入下面。当您干预它时,它也可能会非常快速恢复。所有系统都集中促进培训加固,然后改用真正的机器。如果您观看了很多视频,则可以访问我们的网站。 从运行单个对象的明智操作到连接许多事物的长期任务。接下来是大脑的上部,这就是我们的VLA的制作方式。 VLA也是分层体系结构。一开始,将有一个顶级计划者和控制者,最后根据任务进行控制。我们有一个相对独特的观点,我们的上部ND下层通过我们主要设计的Actionoken连接。具体而言,上层可以通过自己的婴儿床确定哪个任务最适合下层。就像乐高积木仅显示的那样,然后选择适当的节点。这将使与长期工作的连接平稳。那么成功率很年轻。 这里的主要技术是训练上层。我们还练习了几种大型模型,例如DeepSeekr1。我们所有的事情都可以通过模拟来完成。例如,游戏Mahjong的最新演示都接受了模拟训练,经过验证后,它被转移到了真实的机器上。有一些真实的机器数据,但使用量较少。 对于VLA,我们认为从连接中没有更好的相似性,因此我们进行了这样的评论。 VLA变得越来越流行,所有这些都开始意识到,如果您想执行相对一般的任务,VLA很重要。也有一些adva全球范围内的演示,例如Google。 因此,我们与北京大学Lingchu联合实验室一起进行了全面的VLA审查。由于我们的看法,开发VLA系统的最重要的事情是它是端到端的。如果不是端到端,那么由哪些上层和下层连接到了,这确实会影响VLA性能。 我们还使用了至少一个基本模型给出了VLA的相当一般含义,并且使用了相当大的预训练模型,我们将其定义为VLA。 为什么使用VLA?从大型模型的角度来看,从使人体体现智力的智力的角度来看,必须有一个影响世界的生物,因此从大型模型的角度看VLA非常重要。从机器人的角度来看,它与我所说的有关执行任务,然后执行许多任务并连接到许多任务的事情相同。这也需要一种非常有力的感觉,所以为什么VLA来自两个Fields。 这些也是我们的一些开发和类别图表。如果您有兴趣,可以查看我们的评论。 从我们的角度来看,VLA的要点是如何连接上层和下层。我们几乎将其分为多种类型。例如,代码具有一些VLA。上层可以输出多个代码,然后使用下层调用代码执行,并使用一些端到端行。潜在的仍然有一些联系,我们还提供了更好的感觉,还结合了市场上的所有论文,以促进每个人对这一领域的了解。这是对不同令牌的回忆。这也是当今发展一些VLA的历史的图表,将会有一些留下。如果您有兴趣,则可以详细介绍它。 接下来,让我们谈谈将来需要如何开发智能操作领域。我们认为,最重要的模型数据现在分为四层:互联网数据,仿真数据,真实数据和真实的机器数据。正确的一个戴着野手套。 为什么对我们定义真实数据有效?因为我们判断存在很大的可能性是存在真正的差距,所以特定固定产品的真实机器收集的数据可能是有效的,但是由于不可能将所有产品,所有物品,所有物品,所有物品以及所有世界的运营转移到采矿数据工厂,因此收集的数据不足以收集。 例如,一些室友可能会戴MGA手套和相机,不会影响他的工作正常,并有一天记录他的操作。这与Internet数据确实有所不同,因为Internet数据有些混乱。例如,一只小狗和一些从洗衣机上搭起衣服的人一起跑来跑去,他们的手被挡住了。这就是为什么我们说我们需要手套。 第二点是触摸非常重要。我们在这种触摸之前意识到是r非常重要的一点。由于人手的骨头与机器人手不同,包括机器人的骨头,因此它们看起来也有所不同,但是如果没有触摸,一个非常重要的一点是,我们可以通过触觉信息来接地实施缝隙,因此我们的手套是触觉信息传感器。 之后,我们有了一种独特的加固方式,可以转换为良好的房地机数据,我们可以将其介绍。 这也是我们在2024年所做的研究。这是当时将人类力量数据转换为机器人技术并能够正常工作的第一种方法。当时,我们有一个非常重要的观点。知道纯净的加固有点困难,因为它可能很难探索,即使它确实受过训练,它的运动也不是很好。因此,我们认为当时有很多人类力量数据和人类数据确实不同,那么我们如何使用人类力量数据提供机器人培训? 在TH之前是的,还有其他一些研究,这些研究可能会从互联网上的某些视频中积累动作,并且可以使用人类数据并在现实世界中做到这一点。但是,仅仅因为我只是说,这些数据的质量就是该数据,因此除了选择和放置之外,它们几乎无法做任何事情。 除了我刚刚介绍的相对较长的活动,尽管可以在一定程度上培训一定程度的一般一般,如果您想在不同的情况下真正成为一般的一般性,那么数据仍然缺乏。这也是为什么我们说纯RL仍然不够的原因,我们应该介绍Manu -Data。 因此,我们使用了两组良好的操作数据,我们试图使用他的一些人来查看他们的手机,例如打开机柜与机器人一起使用。我们的主要观点是我们刚刚说过的模拟机器人的数据没有体现差距,因此,我们认为,质量高于人力资源的质量,但是由于各种PR,很难完全实现Oblems。可以收集人类的数据,因此他们具有更好的扩展能力。但是,它对于真正的机器人有差距,人们无法使用它的原因很多。 因此,对我们来说,一个非常关键的观点是,我们可以通过研究强化来优化机器人的Manu -Data,因此这是我们的轮廓。例如,我们拥有高水平的计划者和一个较低的控制器。我们输入的高级别计划者是如何移动对象的方式。我们有一个生成的模型来产生双手和手腕的粗糙轨迹。 在较低层,我们使用加固的研究来训练真实和敏捷的手动轨迹。在这里,我们认为该情节的奇妙点是,我们对Lahat关于RL始终忽略的问题建模,也就是说,每个任务都需要一个奖励,但是这样,所有任务都可以是某种东西,可以使我有一个轨迹如何移动对象。 RL的任务是操作此问题,以便对象可以满足此轨迹,So我们所有的奖励功能都可以是一个公式,这是物体姿势和目标姿势之间的区别。因此,在这种情况下,我们可以训练一些不同的操作,并成功将一些人类手动数据传输到机器人。 认识到首先使用我的上限计划者为我提供大型模型或输出,以便如何移动某些东西。例如,饮用水意味着在您的嘴里喝一杯水。我们这一代的莫雷尔(Molel)发展了几个手腕的粗糙轨迹,主要来自人类数据,在该数据中,仔细涉及碰撞操作是通过增强研究训练的。 所有这些都是反向推动的训练,这也是我们的效果。在真实的机器中,增加了自由度超过60度的手臂和手。您可能会发现该操作是非常 - 在个人中,然后以及用双手举起东西的一些动作。所有这些都是很多。 这也是我们聪明的原因。使用嗡嗡声非常重要数据。 硬件将非常便宜。我发现最终的体现情报仍然需要TOC,并且C端的成本应增加以继续。至于如何启动音量,必须拥有一个非常强大的预训练模型,该模型可以非常快地适应EnyScenario。它刚刚回到了封闭的循环。很难实现模仿技术,因此应使用人类数据,因为人的手和敏捷的手相对较近,因此差距是最小的,这也是我们需要做出灵巧的手的相反原因。这是我们从后者开始的概念。 关于这种情况,将来,由于限制,将制作TOC,我们将首先从某些TOB和工厂物流开始,然后慢慢积累数据和模型。在对概括的概括性概括之前,我们将更快地创建一个新的方案,并慢慢发展为段。 这是我的演讲,谢谢大家! 鳍Ance的官方帐户 24小时广播滚动滚动最新的财务和视频信息,并扫描QR码,以供莫尔波粉丝遵循(Sinafinance)
请尊重我们的辛苦付出,未经允许,请不要转载金宝搏188网址登录_金宝搏188手机登录的文章!

下一篇:没有了