财经新闻网消息:
② 深耕运动控制,Meta侧重交互能力。 这两项能力是机器人走进千家万户的前提。
如今,科技巨头纷纷主动承担起机器人研发的重任,奔赴下一场科技盛宴。 当地时间10月20日,和Meta各自发布了重磅机器人训练工具。
开发的AI代理可以教机器人复杂的运动控制技能,例如转动笔、打开抽屉和柜子、扔球和接球以及操作剪刀。 英伟达表示,这一突破将重新定义机器学习。
Meta推出了3.0模拟器,可以教机器人如何与物理世界交互。 Meta称其为“社交智能机器人发展的里程碑”。
它是什么样的工具? 新成果有何意义?
▌——大模型参与训练机器人
全称是——Kit for Agent,本质上是一个大模型驱动的算法生成工具。 借助GPT-4的代码编写能力,具有优秀的奖励函数设计能力,可以独立编写奖励算法来训练机器人。
关键是通过上下文实现人类水平的奖励算法设计。 简单来说,GPT-4的零样本生成、代码编写和上下文改进功能用于优化奖励执行策略,从而通过强化学习来执行复杂的技能。
声称,奖励设计在 29 种不同的开源强化学习 (RL) 环境中实现了人类水平的表现,其中包括 10 种不同的机器人形态(四足动物、四轴飞行器、两足动物、机械手和机器人)。 几种类型的灵活性)。 在没有任何特定于任务的提示或奖励模板的情况下,生成的奖励计划在 80% 以上的任务上优于专家编写的奖励计划。 这使机器人的平均性能提高了 50% 以上。
的研究是与宾夕法尼亚大学、加州理工学院和德克萨斯大学奥斯汀分校的研究人员合作完成的。 该项目目前是完全开源的。
在机器人领域,存在着一个“莫拉维克悖论”——人类特有的高阶智能能力需要很少的计算能力,但需要无意识的技能和直觉(例如识别面孔、举起铅笔以及在物体周围移动的能力)。房间、回答问题等)需要大量的计算能力,也就是说,越简单的事情就越困难,越困难的事情就越简单。
这就是为什么人类已经创造出了可以击败世界顶尖棋手的机器人,却仍然无法赋予机器人像两三岁孩子一样的感知和行动能力。
的最新成果展示了大型模型在机器人精确控制中的作用。 在的推动下,更多智能的机器学习方法有望快速引入工业和消费应用中。
▌Meta——人机交互直指体现智能
Meta 也是为训练机器人而设计的。 据介绍,3.0是第一个支持在多样化、真实的室内环境中大规模训练人机交互任务的模拟器。
具体来说,3.0可以利用红外捕捉系统精心构建一个虚拟环境,例如办公空间、住宅、仓库等,其中物体的形状和大小完全复制现实世界。 该工具还可以对人类的外观和姿势进行逼真的模拟。 模拟支持从简单(如行走、挥手)到复杂(如与物体交互)的各种类型的动作,还可以模拟现实生活中的各种社交场景。
机器人和人形化身生活在同一个空间,虚拟环境中的人形化身可以通过算法或真人通过键盘、鼠标和VR耳机来控制。 网上已经有人期待体验Meta Quest VR 3.0。
Meta 的目的很明确——让 AI 智能体通过 3.0 与现实世界中的人类进行交互。
值得注意的是,与现实世界的交互是实现具身智能的基础。 正如Meta的人工智能研究部门(FAIR)所说,3.0等新产品的发布代表了他们在具身智能方面的进步。
FAIR表示,3.0将把机器人AI代理的学习时间从几个月甚至几年缩短到几天。 它还允许在安全的模拟环境中更快地测试新模型,没有任何风险。
在推出3.0的同时,Meta还宣布发布合成场景数据集( Scene ),这是一个由艺术家编写的三维数据集,可用于训练人工智能导航代理; 它还宣布发布Home Robot,这是一个可在模拟和真实环境中使用的机器人助手软硬件平台。
深耕运动控制,Meta则专注于交互能力。 这两项能力是机器人走进千家万户的前提。
华为“天才少年”智慧君离开华为,开始做机器人生意。 他曾在自己的机器人产品首次亮相时引用了一个网络笑话:我们希望人工智能做的是做饭、打扫房间、洗衣服、扔垃圾。 然而,他们实际上在做的只是聊天、画画、写作、作曲、玩游戏……
如今工业机器人越来越普及,如何让机器人成为普通家庭的助手、日常生活的伙伴,成为了新的技术热点。
我们距离能做家务、做家务的家用机器人还有多远?
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com