当前位置: 首页 -> 头条焦点

谷歌DeepMind推GeminiRobotics,赋能机器人智能交互

责任编辑:赵奢    来源:中国广告网   发布时间:2025-03-30 13:59阅读量:14942      会员投稿

谷歌DeepMind推出GeminiRobotics,为机器人智能交互能力提升添砖加瓦

盖世汽车从外媒处获取到一则振奋人心的消息:谷歌 DeepMind 宣布推出两款专为控制机器人而研发的新型人工智能模型,分别为 Gemini Robotics 和 Gemini Robotics - ER 。谷歌方面宣称,这两款模型将助力各类形态与尺寸的机器人,更高效、精准地认知世界,并与现实物理环境展开互动,为人形机器人助手等前沿应用奠定基础。

在机器人技术领域,虽然机器人平台的硬件水平一直在稳步提升,然而,开发出一款能够让机器人在全新场景中安全、精准地自主行动的人工智能模型,始终是一大挑战。谷歌此次推出的新模型,正是为了解决这一难题。

谷歌的这两款新模型以其 Gemini 2.0 大型语言模型为基础,并增添了适用于机器人应用的特殊功能。Gemini Robotics 具备谷歌所描述的 “视觉 - 语言 - 动作” 能力。这意味着它能够处理视觉信息,理解人类下达的语言指令,并据此产生相应的身体动作。例如,当接收到 “将桌子上的杯子拿起来放到旁边的柜子里” 这样的指令时,它可以通过视觉识别找到杯子和柜子的位置,然后控制机器人手臂完成抓取和放置的动作。

与之不同的是,Gemini Robotics - ER 则侧重于 “具身推理 (embodied reasoning)”,这一模型极大地增强了机器人的空间理解能力。凭借这种能力,机器人专家能够将其与现有的机器人控制系统相连接,使机器人在复杂的空间环境中更好地规划行动路径,完成各种任务。例如,在一个堆满杂物的仓库中,机器人能够借助 Gemini Robotics - ER 的能力,准确判断如何在不碰撞周围物品的前提下,移动到指定位置拿取货物。谷歌 DeepMind 推出的这两款人工智能模型,有望为机器人领域带来新的突破,推动机器人在更多场景中发挥更大作用,为未来智能生活开启新的篇章。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

热词:    

相关阅读