当前位置:首页 > 站长资讯 > 正文内容

谷歌的代码即政策允许机器人编写自己的代码

yc8881年前 (2022-12-01)站长资讯198

谷歌机器人团队的研究人员开源了代码即策略(CaP),这是一种机器人控制方法,它使用大型语言模型(LLM)生成实现用户指定目标的机器人控制代码。CaP 使用分层提示技术进行代码生成,在 HumanEval 代码生成基准测试中优于以前的方法。

该技术和实验在arXiv上发表的一篇论文中进行了描述。CaP与以前使用LLM控制机器人的尝试不同;CaP 不是生成一系列要由机器人调用的高级步骤或策略,而是直接为这些策略生成 Python 代码。Google 团队开发了一组改进代码生成的提示技术,包括一种新的分层提示方法。这项技术在HumanEval基准测试中取得了39.8%pass@1的新先进分数。根据谷歌团队的说法:

代码即策略是迈向机器人的一步,机器人可以修改其行为并相应地扩展其功能。这可以启用,但灵活性也会增加潜在风险,因为合成程序(除非每个运行时手动检查)可能会导致物理硬件出现意外行为。我们可以通过绑定系统可以访问的控制基元的内置安全检查来降低这些风险,但还需要做更多的工作来确保已知基元的新组合同样安全。我们欢迎就如何最大限度地降低这些风险,同时最大限度地发挥对更通用机器人的潜在积极影响进行广泛讨论。

LLM已被证明可以展示许多主题的一般知识,并且可以解决广泛的自然语言处理(NLP)任务。然而,它们也可以产生响应,虽然逻辑上合理,但对控制机器人没有帮助。例如,在回答“我洒了饮料,你能帮忙吗?”LLM可能会回答“你可以尝试使用真空吸尘器”。今年早些时候,InfoQ介绍了谷歌的SayCan方法,该方法使用大型语言模型(LLM)来规划一系列机器人动作;为了提高LLM的产出,SayCan引入了一个价值函数,该函数指示根据当前世界状况,该计划成功的可能性。

代码即策略流

图片来源:https://code-as-policies.github.io/

CaP 的关键组件是生成语言模型程序 (LMP),该程序从用户的自然语言指令映射到在机器人上执行的程序,并从机器人的传感器获取感知输入并调用控制器 API。这些是由 LLM 在“少数镜头”模式下生成的,该模式会提示提示和示例 LMP。生成的 LMP 可以包含高级控制结构(如循环和条件)以及分层生成的函数。在后一种情况下,将生成包含对未定义函数的调用的高级 LMP。解析此 LMP 以查找这些未定义的引用,并调用对生成的函数进行微调的第二个 LLM 来创建函数定义。

谷歌在多个基准和任务上评估了CaP。除了HumanEval之外,该团队还开发了一个新的代码生成基准,RoboCodeGen,专门针对机器人问题。该团队还使用CaP来控制执行多项实际任务的物理机器人:厨房环境中的移动机器人导航和操作,以及绘制机器人手臂的形状,拾取和放置以及桌面操作。

谷歌研究员Jacky Liang在Twitter上讨论了这项工作。在回答有关从块构建复杂结构的CaPs问题的问题时,梁回答说:

当新 [命令] 和提示处于相似的抽象级别时,CaP 运行最佳。构建复杂的结构类似于在抽象级别上“提升几级”,贪婪的LLM解码正在努力解决。应该是可能的,但可能需要更好的方法来[提示]。

用于重现论文实验的代码可在GitHub上找到。代码生成技术的交互式演示可在HuggingFace上找到。


本站发布的内容若侵犯到您的权益,请邮件联系站长删除,我们将及时处理!


从您进入本站开始,已表示您已同意接受本站【免责声明】中的一切条款!


本站大部分下载资源收集于网络,不保证其完整性以及安全性,请下载后自行研究。


本站资源仅供学习和交流使用,版权归原作者所有,请勿商业运营、违法使用和传播!请在下载后24小时之内自觉删除。


若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,使用者自行承担,概与本站无关。


本文链接:https://www.10zhan.com/zhanzhang/10141.html

标签: CaP
分享给朋友:

“谷歌的代码即政策允许机器人编写自己的代码” 的相关文章

【说站】Win10专业版如何激活?Win10激活工具

【说站】Win10专业版如何激活?Win10激活工具

本人用的Win10专业版一直用的好好地,今天桌面右下方就提示“激活Windows 转到设置以激活Windows”,因为一直用的是盗版Windows 10,出现这样的提示也蛮正常,没得办法,见招拆招,在...

【说站】Excel如何快速删除空行?WPS删除excel空白行

【说站】Excel如何快速删除空行?WPS删除excel空白行

站长我经常会处理excel文档,之前介绍过Microsoft Office excel文档删除空行的办法,今天介绍WPS Office下面的excel如何删除空白行。方法一:筛选  选中数据所在的那一...

【说站】宝塔如何按日期每天生成一个网站日志文件

【说站】宝塔如何按日期每天生成一个网站日志文件

宝塔面板默认的会按照nginx.conf的配置生成在/www/wwwlogs目录下面生成一个网站访问日志和一个网站错误日志,每当有新的记录时系统会不断的对这两个文件进行写入操作,但随着访问量的增长,日...

【说站】判断服务器IP否被墙 是否被TCP阻断

【说站】判断服务器IP否被墙 是否被TCP阻断

现在国内很多购买国外主机服务器的,但往往很多主机商的机子用的人多了,国内使用者用这些服务器做啥的都有,正儿八经的做外贸其实没多大事情,但往往有些人就是不遵守法律法规,长此以往用的人多了,这些国外的主机...

【说站】WordPress网站文章ID不连续如何解决?

【说站】WordPress网站文章ID不连续如何解决?

对于WordPress网站文章ID不连续的问题困扰了我很久,今天将WordPress文章ID不连续的原因和具体解决办法做详细的说明。WordPress文章ID不连续的原因:用WordPress做网站的...

【说站】删除WordPress页脚的 由WordPress强力驱动

【说站】删除WordPress页脚的 由WordPress强力驱动

所周知目前最新版的WordPress搭建的个人博客的2020主题(Twenty_Twenty)在网页的末端会有“由WordPress强力驱动”链接跳转字样,即WordPress的商业推广。作为网站搭建...