您当前的位置 : 浙江在线  >  杭州频道 > 今日视点 > 本网专稿   正文

     |  打印
放大   原大   缩小   打印  

抓起来、放下去 这场机器人比赛为什么聚焦“最基础”的技能?

  “五一”劳动节来了,谁不想美美地享受假期、彻底躺平?可手头的工作还摆在眼前,不干不行。不过,也许不久后,机器人就能变成最给力的“打工搭子”,在我们想要休息的时候稳稳“接班”。

  5月15日至16日,杭州市西湖区云栖小镇将迎来2026杭州国际具身机器人场景应用大赛。其中有一场“基于乐云平台和机械臂的日常抓取任务创新挑战赛”,它不比跑得快、不拼跳得高,而是让机器人学会看似最简单的“抓取”与“放置”。

  抓放之间

  一项“最基础”技能的挑战

  “抓取与放置,是机器人执行几乎所有实用任务的基础动作。”项目主办方阿里巴巴达摩院相关负责人表示,生活中常见的现象,例如从冰箱取饮料、给超市货架补货等,都需要用到抓取与放置。没有扎实的抓放能力,再炫酷的机器人也只是个摆设。

 LeRobot SO-ARM 101 机械臂套件 阿里巴巴达摩院供图

  在这场比赛里,参赛团队需围绕真实生活需求,设计并实现“抓取与放置”场景下的创新应用方案,使用达摩院与矽递科技联合打造的LeRobot SO-ARM 101机械臂,基于乐云具身智能开发平台(以下简称“乐云平台”)提供的开源VLA模型进行微调,完成数据采集、模型训练、真机部署全流程,最终让机械臂在真实场景中自主完成抓取与放置任务。

  比赛看似简单,实则大有学问。细看评分标准会发现,抓取要一次即精准到位,过程中要流畅连贯,并且要在不同场景下精准识别目标物。这些细节表明:抓放远非“一抓一放”那么简单,而是一项融合了视觉识别、运动规划、力量控制的“技术活”。

  “通过设置这样的赛题,我们希望能展现机械臂在真实环境,比如家庭、办公室或服务业中的实用价值及其广泛的适应性。”达摩院相关负责人介绍,无论是家庭服务中帮助拿取物品,还是工业场景下的高效分拣装配,抓取与放置都是最基本同时也是最关键的能力之一。做好了抓取,机器人才能实现更复杂的动作。

  抓放之外

  为机器人走进千家万户铺路

  比赛数据的采集有讲究:不仅要至少包含100条有效高质量数据,且需覆盖包括不同摆放位置、光照变化、复杂背景、干扰物与部分遮挡等多样化场景,还要包含抓取失败、放置失败等负样本数据。

控制主臂完成数据采集 阿里巴巴达摩院供图

  为什么要记录上传这么多条数据?“实际场景中机械臂的任务完成度,主要看对模型训练的程度。”达摩院相关负责人介绍,参赛团队从乐云平台能获取的基础模型都是一样的,最后谁的机械臂更灵巧、更有力则主要取决于参赛者“投喂”的数据,包括数量多少,以及有没有失败的、有缺陷的数据集。参赛团队采集的每一次成功或失败的数据,都会被上传到乐云平台,用于微调开源的VLA模型。通过数据训练,模型可以在不断学习的过程中得到优化。

  当前,具身智能虽火,但开源模型的二次开发门槛高,且缺乏面向实际场景的标准化工具链。去年,达摩院联合中国互联网协会共同发起了乐云平台,它最大的特色是为开发者提供零门槛一键式开发能力。这与大赛初衷不谋而合:降低开发者学习具身智能的门槛,打通“模型→数据→硬件”的闭环,鼓励开发者从真实需求出发,推动机器人技术走向家庭、办公、服务等场景。

机械臂在抓取物品 阿里巴巴达摩院供图

  事实上,这不仅仅是一场比赛,更是一次开源协作的集体探索。所有参赛团队贡献的数据和模型调整,都会沉淀在乐云平台上,供后来者学习、使用。“我们希望大赛里训练好的模型能变成通用的‘技能’。未来有其他团队想做类似任务时,就不需要重新调试,而是直接复用这个‘技能’就行。”达摩院相关负责人表示。

  这项赛事不是封闭的实验室表演,而是开放、可复现的真实场景挑战。也许明年的“五一”,我们就能看到一群“打工搭子”努力试着分担任务——离心安理得躺平的日子,又近了一点点。

  【潮新闻+】

  赛事报名:

  前往现场观赛的市民,请点击链接或扫码报名,进入界面后点击立即报名、观众报名入口,即可完成报名。

  https://my.31huiyi.com/lite/pc/zh-CN/605d0000-2776-c61f-c7d2-08dddfb5e995/apply?sourceFrom=mpsite&theme=light

  也可以扫描下方二维码报名↓

相关稿件