Nvidia公布用在机器人编程的Eureka人工智能系统

发布时间：2023-11-03 12:32:10 所属栏目：外闻来源：网络

导读： 　　最近NVIDIA向公众详述了名为Eureka的软件平台，它能够自我学习并优化以完成任务为目标的智能机器。在一次内部评估中，Nvidia使用Eureka教10个模拟机器人29种不同的动作。工程师通常会在

　　最近NVIDIA向公众详述了名为Eureka的软件平台，它能够自我学习并优化以完成任务为目标的智能机器。在一次内部评估中，Nvidia使用Eureka教10个模拟机器人29种不同的动作。工程师通常会在构建机器之前创建机器模拟版本以支持开发工作Eureka教Nvidia的虚拟机器人打开抽屉、表演转笔技巧以及执行其他相对复杂的任务。

　　很多机器人都是由强化学习模型的神经网络提供动力的。强化学习模型通过反复试验来学习执行任务：它们在模拟环境中多次重复该任务，直到弄清楚如何正确执行该任务。模拟学习环境中，包括一个充当神经网络测试台的虚拟机器人。

　　为强化学习模型编写奖励函数历来是一项耗时且技术含量高的任务。据Nvidia称，这次推出的Eureka系统可以实现这个过程的自动化，系统会根据自然语言指令生成奖励函数，例如“教机械臂下棋”等。

　　Eureka在幕后使用OpenAI GPT-4将用户提示转化为奖励函数。除了提示本身之外，系统还接受所谓的环境代码作为输入，这是一种描述模拟机器人通过训练以执行新任务的代码。

　　据已经有Nvidia消息人士称，Eureka 不仅会简单扼要的生成类似的奖励指纹识别器的函数，还会随着运行时间的推移对其进行不断改进。该系统创建了多个版本的奖励函数，并通过将其应用到模拟机器人来评估工作效果，然后会分析评估结果以找出改进的机会。

　　Eureka系统还可以在此过程中考虑开发人员的反馈，特别是允许工程师就如何增强机器人的奖励功能提供建议，这些建议已经纳入到代码优化过程中。

　　Nvidia表示，在测试的80%多的机器人动作中，Eureka奖励函数的表现优于人类编写的代码。结果，作为该项目一部分开发的10个模拟机器人更有效地执行了分配的任务，Nvidia的研究人员记录到机器人性能提高了52%。

　　参与Eureka开发的Nvidia人工智能研究高级总监Anima Anandkumar表示：“强化学习在过去十年中取得了令人印象深刻的胜利，但仍然存在许多挑战，例如奖励设计，这仍然是一个试错的过程。Eureka是开发新算法的第一步，这种算法集成了生成式学习和强化学习方法来解决那些困难的任务。”

　　Nvidia已经在GitHub上发布了Eureka的关键组件以及描述其工作原理的学术论文。工程师可以使用Nvidia的Isaac Gym程序运行该软件，该软件是一种专门为支持AI驱动型机器人开发而设计的模拟工具。ai驱动型机器人的研究已经持续了几十年，但直到现在才真正进入实用阶段。随着人工智能技术的发展，这一领域的研究也在不断深入。

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!