能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

首页 热门新闻 最新资讯

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

热搜大全 2024-01-12

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

近期,一款名为 Mobile ALOHA 的机器人因其出色的烹饪和家务技能在网络上迅速走红。

视频中的机器人外观较为基础,主要由两只机械臂、提供运算能力的主机以及底部移动平台构成。从整体上看,这款机器人尚处于初级阶段,更像是一个粗糙的 " 原型机 "。与我们在科幻作品中看到的 " 机器人管家 " 相比,它还有很大的提升空间。尽管如此,这款机器人的潜力却不容小觑。

此前也有不少服务机器人展示过烹饪、搀扶、地面清洁等能力,为何说 Mobile ALOHA 的潜力很大呢?主要原因是它拥有便宜且开源这两个特点。换句话说,只要你花费 32000 美元(约 23 万元)且动手与学习能力足够强的话,就能自己在家复刻一台具备这些技能的机器人。

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

开发出 Mobile ALOHA 的斯坦福三人组

这个由斯坦福三人团队研发的通用机器人 Mobile ALOHA,可以通过模仿学习,执行各种复杂的任务。同时在操控层面,除了可以自主操作外,还可以支持全身远程操控。

人类的 " 机器梦 " 何时才能圆?

从机器人发展的整体方向来看,可以被简单划分为专用机器人和通用机器人两类,前者主要聚焦于提升单一场景的生产、干活效率。在日常生活中,人们或多或少都会接触到此类产品,像智能工厂里应用的各类机械臂,家里用于清洁地面的扫地机器人、酒店中用于派送物品的送货机器人等,都可以划分为专用机器人。

通用机器人与之相比则拥有更广泛的适用性,尤其是在 " 为人提供服务 " 的层面,通用机器人的一大结构特点就是更具 " 拟人化 " 特征。因为它的最大用途就是代替用户去完成一部分日常工作,像做家务、做饭等等,所以很多科技公司以及研究机构在产品设计之初,就会将 " 人形机器人 " 作为未来持续投入的发展方向。

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

WABOT-1

世界上第一个全尺寸人形 " 智能 " 机器人 WABOT-1 诞生于 1972 年,但早期的电机、驱动程序、算力都很难满足机器人的应用需求,WABOT-1 只是一个形态上具备类人特征的产物。2009 年,波士顿动力开始研发 PETMAN 人形机器人,此后又推出了不断迭代的 Atlas,在整个 21 世纪 10 年代,它就是受关注度最高的人形机器人产品。

2022 年,随着特斯拉首次展示 Optimus 机器人,这台能走路、能挥手能举重甚至可以组装另一个 " 自己 " 的机器人再次刷新了大众对于人形机器人发展速度的认知。

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

CyberOne

除了国外企业,近两年国内科技企业也在加速布局人形机器赛道,像蒂艾斯科技的 exrobots、优必选发布的 WALKER X 机器人、小米推出的 CyberOne 等等。但以上这些机器人都存在一个问题,就是它们只属于 " 未来 ",特斯拉预计 2030 年才会将 Optimus 完成大规模量产并推向市场。

而 Mobile ALOHA 的出现,则开启了普通人与机器人接触的低门槛通道,斯坦福团队除了在网页中展示了 Mobile ALOHA 所能实现的能力以外,也完整开源了机器人的软硬件所涉及到的各类参数、资料内容,比如机器人使用的硬件以及具体的参数信息。

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

具备学习能力的 " 机器人保姆 "

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

Mobile ALOHA 配备有 2 个腕部摄像头,和 1 个顶部摄像头,并配有移动电源和本地计算模块,在其自主执行时只使用 2 个 ViperX 300。两只手臂的最低 / 最高高度分别为 65 厘米 /200 厘米,并可以从底座向四周最长能够伸出 100 厘米。

算力方面,从视频中可以看到,Mobile ALOHA 的 " 大脑 " 其实是一台笔记本电脑,根据官方公布的资料,其配置为英特尔第十二代酷睿处理器 i7-12800H,显卡则采用了英伟达 RTX3070ti,这套配置放在 2024 年的市场来看,意味着只需要一台 8000 元左右的游戏本,就能满足 Mobile ALOHA 的算力需求。

为了让机器人具备更大的活动范围,研发团队在组建 Mobile ALOHA 时选择了将 AgileX Tracer AGV(Tracer)作为了移动底座,这原本是一个专为仓库物流设计的移动平台,其移动速度可以达到 1.6m/s、最大有效载荷为 100kg,由于全套资料均为开源,因此在组建过程中,其他人也可以根据自身需求对方案做进一步的 DIY。

除了硬件以外,Mobile ALOHA 还通过加入数据和视觉的学习能力,也就是当下比较流行的 " 大模型 " 人工智能。Mobile ALOHA 的学习能力由两部分组成,包括静态 ALOHA 数据集以及基于视觉识别或手动操控获得 " 模仿能力 "。

能做饭会收拾,斯坦福一团队仅用23万元就造出了“机器人保姆”

目前已经开源的静态 ALOHA 数据集总共有 825 个演示任务,包括密封袋子、拿起叉子、包装糖果、撕纸巾、打开带盖塑料杯、玩乒乓球、使用咖啡机、翻转铅笔、固定魔术贴电缆、装上电池和操作螺丝刀等等。

演示中,研究人员每个任务只用了 50 个演示就可以让 Mobile ALOHA 机器人开始学会做这件事,比如连续 9 次擦拭洒在桌子上的葡萄酒,连续 5 次乘坐电梯。最终呈现的整体效果还是不错的,Mobile ALOHA 完成了从备菜烹饪到最后清扫收拾的所有环节。

钛媒体 App 注意到在烹饪环节,Mobile ALOHA 除了可以执行切菜的固定动作以外,也学会了颠勺、摆盘等操作。在收拾的过程中,它既能够挪动对椅子这样体积较大且笨重的家具,同时也能够对盘子这样体积小且光滑的物品的抓握与清洁,说明作为通用机器人其场景应用空间还是很大的。

那么对于整个机器人产业来说,Mobile ALOHA 也有很大意义,首先是作为开源项目,自然会吸引到很多企业以它为基础蓝本开始探索类似机器人的商业落地能力,并且随着零部件从目前的单独采购变为规模化供应,成品的成本将会进一步降低,进而推动机器人的普及化。

同时,Mobile ALOHA 也指明了当机械组件不断成熟后,依靠大模型人工智能为机器人赋予的学习能力,能够让机器人的应用潜力得到更快的释放。

此前斯坦福大学机器人实验室主任、计算机科学教授,IEEE 会士,国际机器人研究基金会主席 Oussama Khatib 就曾表示:" 机器人面临新的环境和新的挑战之一便是复杂的环境带来的学习成本问题,如今机器人要面对的是从工厂当中走出来,进入到实际复杂的人类环境,因此它需要具备人类的智慧。"

而大模型人工智能与日渐成熟的机器人零部件供应体系,显然让 " 机器人走入普通家庭为大众服务 " 的进程得到了加速。(本文首发钛媒体 App,作者 / 邓剑云,编辑 / 钟毅)

最受喜欢

斯坦福 机械臂 开源 人工智能 机器人 热点 本地 社区 美图 视频 直播 资讯

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13