搜索
NFT元宇宙Web3
近期热门

DeepMind的新AI可以执行600多项任务,从玩游戏到控制机器人

Founder

对人工智能行业的一些人来说,最终的成就是创造一个具有人工通用智能(AGI)的系统,或理解和学习人类所能完成的任何任务的能力。长期以来,AGI被归入科幻小说的范畴,有人认为AGI将带来具有推理、计划、学习、代表知识和用自然语言交流能力的系统。

并不是每个专家都相信AGI是一个可以现实的目标。但可以说,由Alphabet支持的研究实验室DeepMind本周发布了一个名为Gato的人工智能系统,为实现这一目标做出了贡献。

Gato是DeepMind描述的 “通用 “系统,一个可以被教导执行许多不同类型任务的系统。DeepMind的研究人员训练Gato完成了604项任务,确切地说,包括给图像加标题,进行对话,用真正的机器人手臂堆积积木,以及玩Atari游戏。

艾伦人工智能研究所的研究科学家Jack Hessel指出,一个能够解决许多任务的人工智能系统并不新鲜。例如,谷歌最近开始在谷歌搜索中使用一个名为多任务统一模型的系统,或称MUM,它可以处理文本、图像和视频,以执行从寻找单词拼写的跨语言变化到将搜索查询与图像联系起来的任务。但是,Hessel说,这里有可能是较新的,是所处理的任务和训练方法的多样性。

Hessel通过电子邮件告诉媒体:”我们之前已经看到证据表明,单个模型可以处理令人惊讶的不同输入集。在我看来,当涉及到多任务学习时,核心问题……是任务之间是否相互补充。你可以设想一种更无聊的情况,如果模型在解决这些任务之前隐含地将它们分开,例如,’如果我检测到任务A作为输入,我将使用子网络A,如果我反而检测到任务B,我将使用不同的子网络B’。 对于这种无效假设,通过分别训练A和B可以达到类似的性能,这是不太理想的。相比之下,如果联合训练A和B会导致任何一个(或两个!)的改进,那么事情就更令人兴奋了。”

像所有的人工智能系统一样,Gato通过实例学习,以标记的形式摄取了数十亿字、来自真实世界和模拟环境的图像、按下的按钮、关节扭力等等。这些标记以Gato能够理解的方式表示数据,使系统能够–例如–找出霹雳的机械原理,或者在一个句子中哪个词的组合可能具有语法意义。

Gato不一定能很好地完成这些任务。例如,在与人聊天时,系统经常以肤浅或与事实不符的回答来回应(例如,在回答 “法国的首都是什么 “时说 “马赛”)。在给图片加标题时,Gato给人加错了性别。而且该系统在使用现实世界的机器人时,只有60%的时间能正确地堆放积木。

但在上述604项任务中的450项,DeepMind声称,Gato在一半以上的时间里表现得比专家好。

阿尔伯塔大学计算科学助理教授Matthew Guzdial通过电子邮件告诉媒体:”如果你认为我们需要通用[系统],也就是人工智能和机器学习领域的很多人,那么[Gato是]一个大问题。我认为人们说这是迈向AGI的重要一步有点夸大其词,因为我们仍然没有达到人类智能,而且很可能不会很快达到(在我看来)。我个人更倾向于认为许多小模型[和系统]更有用,但就其训练数据之外的任务表现而言,这些通用模型肯定有好处。”

奇怪的是,从架构的角度来看,Gato与当今生产中的许多人工智能系统并没有明显的不同。它与OpenAI的GPT-3有共同的特点,即它是一个 “变形器”。追溯到2017年,Transformer已经成为复杂推理任务的首选架构,在总结文件、生成音乐、对图像中的物体进行分类和分析蛋白质序列方面表现出了良好的能力。

也许更值得注意的是,就参数数量而言,Gato比包括GPT-3在内的单任务系统要小几个数量级。参数是系统从训练数据中学到的部分,基本上定义了系统在某个问题上的技能,如生成文本。Gato只有12亿个,而GPT-3有超过1700亿个。

DeepMind的研究人员特意将Gato保持得很小,以便该系统能够实时控制一个机械臂。但他们假设,如果扩大规模,Gato可以处理任何 “感兴趣的任务、行为和体现”。

假设事实如此,它还必须克服其他几个障碍,使Gato在特定任务中优于尖端的单一任务系统,比如Gato无法持续学习。像大多数基于Transformer的系统一样,Gato对世界的认识是建立在训练数据的基础上的,并且是静态的。如果你问Gato一个对日期敏感的问题,比如美国现任总统,它有可能会做出错误的回答。

Transformer–以及Gato–在其上下文窗口中还有另一个限制,或者说系统在特定任务的背景下能够 “记住 “的信息量。即使是最好的基于Transformer的语言模型,也无法写出一篇长文章,更不用说一本书了,而不会记不住关键细节,从而失去对情节的追踪。遗忘发生在任何任务中,无论是写作还是控制机器人,这就是为什么一些专家将其称为机器学习的 “阿喀琉斯之踵”。

由于这些原因和其他原因,Knives & Paintbrushes研究小组的成员迈克-库克(Mike Cook)告诫说,不要假设Gato是通往真正通用人工智能的道路。

库克通过电子邮件告诉媒体:”我认为这个结果在某种程度上是可以被误解的。人工智能能够完成所有这些听起来非常不同的任务,这听起来令人很兴奋,因为对我们来说,写文本与控制机器人听起来非常不同。但实际上,这与GPT-3理解普通英文文本和Python代码之间并没有太大区别。Gato接收关于这些任务的具体训练数据,就像其他同类人工智能一样,它学习数据中的模式如何相互关联,包括学习将某些类型的输入与某些类型的输出联系起来。这并不是说这很容易,但对外部观察者来说,这可能听起来像是人工智能也能泡一杯茶,或轻松地学习另外10或50个其他任务,而它不能这样做。我们知道,目前大规模建模的方法可以让它同时学习多项任务。我认为这是一项很好的工作,但它并没有让我觉得是通往任何东西的主要垫脚石。”

编辑于 2022-05-14 01:46
「 真诚赞赏,手留余香 」
赞赏

发表评论已发布0

手机APP 意见反馈 返回顶部 返回底部