Facebook:不会“犯错”的机器人不是“聪明”的机器人

656次阅读  |  发布于5年以前

“明知故犯”是“智”也

在 Facebook 位于硅谷的新实验室里,有一个叫作 Sawyer 的机器人(来自已经倒闭的 Rethink Robotics 公司),它红黑相间的手臂挥舞着,试图完成研究人员交给它的任务。

按照指令,Sawyer 的手臂应该移动到右边一处固定位置,然而,Sawyer 把手臂抬高,然后偏离轨道,错开了指定位置,重新回到了原点;研究人员只好将 Sawyer 重置,让它继续完成之前的任务。这一次,Sawyer 的手臂确实往右移了,但就在非常接近指定位置的时候,它再一次偏离了运动轨道,回到了起始位置。两次任务都失败了。

或许有人会觉得 Sawyer 的“顽劣”行为令人抓狂。但就像兔子为了躲避猎鹰而迂回前进一样,Sawyer 看似笨拙的行为实际上是一种特殊的聪明。

Facebook 认为,无论是对于机器人的开发,还是 AI 的开发来说,这种聪明都至关重要。

强化学习让机器人更“聪明”

一般来说,开发者会编程机器人,让他们通过这些设定好的指令来执行动作,不过从某种程度上来说,这种方式有点死板。

而我们人类在学习上则要聪明得多。因为,即使是婴儿也明白,物体从视野中消失并不代表从世界上消失;玩具球可以滚来滚去,沙发却不行;长大后,人们能够学习驾驶,而不是撞车。

这一切都要归功于人类大脑里建立起来的世界模型。

Facebook 首席 AI 科学家 Yann LeCun 表示:

如果我们在悬崖边开车,方向盘只要往右转,汽车就会掉下去,所以,我们绝不会这样做。我们大脑里的世界模型会阻止我们自己做傻事。

Facebook 也在尝试为机器提供这种模式,Yann LeCun 补充道说,建立世界模型的系统是 AI 取得重大进展的下一个挑战。

实际上,Facebook 并不是第一个尝试让机器人学会自我移动的团队。

上图为 Brett 机器人及其开发者 Pieter Abbeel

在加州大学伯克利分校,研究人员使用了一种名为强化学习(reinforcement learning)的技术,让双臂机器人 Brett 把方形钉子塞进一个方形洞里。

在此过程中,研究人员会让 Brett 尝试许许多多随机的动作:如果 Brett 更接近目标,系统就会给它“奖励”;如果 Brett 搞砸了,系统会给它“记过”。

这些记录,Brett 都会保存下来,然后经过多次迭代,它会越来越精准地找到方洞,并把钉子放进去。

创新的自我监督学习

而 Facebook 的尝试有点不同,Facebook AI 研究科学家 Franziska Meier 表示:

我们想尝试的是给机器人灌输好奇心的概念。

人类就是通过好奇心来认识世界的,比如,孩子们想知道猛拽猫尾巴会发生什么,所以他们会去做这种尝试。因此,Brett 是通过一点一点地靠近目标,来改进自己的动作,而 Facebook 的 Sawyer 则是靠近目标,然后故意偏离轨道。

Facebook 研究人员旨在让 Sawyer 自由地尝试非最佳动作,而不是奖励它不断取得的成功,即使这在当时看起来并不理性。Meier 说:

虽然 Sawyer 没有完成任务,但它给了我们更多的数据,我们通过这种方式获得的数据比传统的方式要多。

这个概念被称为自我监督学习——机器人尝试新行为并更新软件模型,从而帮助它预测自己的行为后果。

上图为 Facebook 所说的“自我监督学习”的算法模型

这样做的目的是让机器能够更加灵活地去完成任务,或者说,更容易适应动态的人类环境。

比如,机器人要将架子上的杯子放到旁边的架子,最好的方法是将杯子直接平移,然而两个架子之间有隔板,这就需要机器人反复试验、反复犯错,直到它探索出更好的解决方案。

正如奥斯陆大学的机器人专家 Tonnes Nygaard 所说的那样:

如果我们一直执着于一个解决方案,我们可能会走进死胡同;我们更应该专注于探索更多新的解决方案。

模拟与现实之间的差距

一些研究人员通过模拟来教机器人完成任务——建立一个数字世界,再让其中的动画对象通过“犯错”的方式来完成任务。这种方法相对较快,因为当数字“机器”不受现实世界物理定律的约束,它们迭代的速度要快得多。

不过,虽然模拟更高效,但它并不能完美地反映真实世界,模拟动态人类环境的复杂性。

这就导致,机器人在模拟环境中能够完美匹配的理论,在现实世界中却不适用。在现实世界中做任何事情都可能更慢、更费力,但好处是,机器人能获得的数据更纯粹。

Facebook的人工智能研究科学家 Roberto Calandra 表示:

如果它在现实世界中行得通,那它就真的行得通。

毕竟,机器人在现实世界中要面对各种意想不到的麻烦,程序员不可能对每一个都预先进行编码。

AI 和机器人相得益彰

上图是 Facebook 的六足机器人

从某种程度上来说,Facebook 的项目是 AI 和机器人的伟大融合。

虽然谷歌和亚马逊和 Facebook 等科技巨头已经大大推动了 AI 的发展,比如让机器进行图像识别,不过这个任务仍基于人们事先给图片贴好标签。不得不承认,机器还是不够聪明。

随着 AI 研究人员开始使用机器人作为平台来改进软件算法,这种情况开始发生变化。

例如,Facebook 教机器人独立完成一系列任务,这反过来可能会对开发 AI 助手有所启发,让它们能够更好地为用户服务。LeCun 说道:

如果机器人解决了一个问题,同理,它也能在另一种情况下解决这个问题。

简而言之就是,AI 正在让机器人变得更聪明,而机器人也在帮助推进 AI 的发展。

不过,Facebook 表示,目前,公司的这项研究并没有连接到特定的产品。不过,LeCun 说:

我们认为,机器人将在远程呈现中发挥重要作用。毕竟,Facebook 拥有 Portal 和 Oculus VR 系统。

推荐文章

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8