字节跳动推出了用于机器人的人工智能“脑”

字节跳动推出机器人用的人工智能“大脑”

拥有 TikTok 的公司字节跳动推出了一种系统,充当机器人的“大脑”。它可以执行家务任务,如晾衣服或清理桌子。

GR-3是一种大规模的“视觉-语言-行动”语言模型,使得机器人能够理解自然语言指令,并执行与未知物体相关的通用任务。它们可以在新的环境中工作,或处理与尺寸和空间关系相关的抽象概念。

在网站发布的视频中,展示了实验室的双臂机器人ByteMini如何将衣架插入衬衫并将其放置在架子上。

🚀🚀🚀 想知道机器人处理现实世界家庭任务需要什么吗?长时间执行、可变形物体灵巧性和未见物体泛化——来见见 GR-3,字节跳动种子团队的新视觉-语言-行动(VLA)模型!

GR-3 是一种可推广的...pic.twitter.com/zECRjaXC0J

— Xiao 马 (@yusufma555) 2025 年 7 月 22 日

在单独的技术报告中,团队表示,机器人能够处理短袖衣物,尽管“所有训练数据中的物品都是长袖的。”

通过GR-3,机器人能够从多个选项中选择特定物品并将其放置在指定位置。

系统不仅能够根据名称识别对象,例如“大小盘子”,也可以根据空间特征,例如“左边”。它可以通过一个指令完全执行“清理餐桌”的任务。

为了训练模型,字节跳动采用了多组件的方法,包括:

  • 在“大数据集”格式的“图像-文本”上进行联合学习;
  • 在通过VR设备收集的人类行为轨迹信息上进行再训练;
  • 模仿方法基于安卓设备的运动数据进行设置。

«我们希望 GR-3 能够成为创建能够帮助人们日常生活的通用机器人的一步」,团队在声明中表示。

提醒一下,在一月份,初创公司 Perplexity AI 宣布计划收购美国 TikTok。该公司向 ByteDance 提出了将 Perplexity、TikTok U.S. 和新的资本合作伙伴合并为一个法律结构的提议。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)