欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

合久必分:分布式“机器学习”应运而生

程序员文章站 2022-04-22 12:36:47
从语音识别系统到自助停车等人工智能领域,“机器学习”的最新进展总能吸引大众的眼球。所谓机器学习,就是让计算机在数据库中搜索特定模型从而获得新技能,以及让自主机器人[-0.74%...

从语音识别系统到自助停车等人工智能领域,“机器学习”的最新进展总能吸引大众的眼球。

所谓机器学习,就是让计算机在数据库中搜索特定模型从而获得新技能,以及让自主机器人[-0.74%资金研报]对所处环境建立行为模型。但是,这种建模在集群机器人协同工作中变得非常复杂。这些机器人可能集体搜集到很完美的、但对单个机器人毫无用处的模型。

如果机器人由于动力、通信和运算的限制不能将所有数据整合到一起,它们怎么能完成共同建模?

据物理学家组织网近日报道,即将在7月份举行的“人工智能的不确定性”研讨会上,来自麻省理工学院信息与决策系统实验室的研究人员,会解答上述问题。他们将展示一组运算方法,证明让两个间谍机器人共同搜索一栋建筑物,在它们经过大厅时,会彼此交换分析结果。

先分再合不“卡壳”

在这个实验中,研究人员运用了分布式运算方案,这一方案优于目前流行的将数据聚合在单个位置的标准算法。

“单个计算机需要从巨型批处理数据库学习建模以处理难题,但在糟糕的处理方案出现时,它们通常会卡壳。如果小数据块被单个计算机预先处理再整合,最后建立的模型则很少出现卡壳现象。”麻省理工学院航空航天专业毕业生特雷沃·坎贝尔在与导师乔纳森·豪尔·理查德·科克马克劳林教授共同写的一篇论文中总结道。坎贝尔的新算法是非常灵活的分散网络学习程序。

想象一下,多个机器人在不熟悉的办公空间中展开搜索,你会对坎贝尔和豪尔解决的问题有点感觉。如果这些机器人的学习程序在平均水平,它们不需要预先知道什么是椅子、什么是桌子或什么是一间会议室或办公室。但是它们可以判断出,有些房间包含一些小型椅子形状的物品和大概同样多桌子形状的物品,而另一个房间包含大量椅子形状的物品和一张桌子形状的物品。

随着时间的推移,每个机器人会根据自己搜索的房间和屋内物品建立自己的清单。但是也存在误差:比如一个机器人碰巧进到一间会议室,会议室里有一些参观人员留下的手提箱,从而总结出“手提箱”也是会议室的常规特征;另一个机器人可能进入厨房,而咖啡机被打开的冰箱门遮挡住,从而将咖啡壶从厨房用品的清单中删除。

理想情况下,当两个机器人相遇,它们会自动比较双方的产品清单,加强对彼此的观察,防止遗漏或以偏概全。问题是,它们不知道如何与“厨房”或“会议室”的类别标签进行匹配,它们只能判断出是“房间1”和“房间3”,但这个机器人的“房间1”很可能就是另一个机器人的“房间3”。

用坎贝尔和豪尔的算法,这些机器人会尝试在共享物品清单的基础上相互匹配类别,并尽全力合并有关联物品的清单。当任意一个机器人遇见其他机器人时,都将执行相同的程序,最关键的是,每个机器人都是先独立列出清单再去跟其他的机器人进行匹配,从而逐步构建更多和更精确的模型。

人工重建新“秩序”

研究人员在论文中呈现了上述看起来比较简单的程序,但是这个简单的程序背后,是一些相当复杂的数学分析。

“近年来,机器学习的方式是假设一个简单的模型,然后用它来接近你想要的结果,当然前提条件是你能够处理所有的细微差别和复杂性。”坎贝尔说,“我们的算法是一种人工重构,即在你成功解决简单问题后,使用该人工重构恰当地合并模型。”

在实际应用中,机器人不会被指派去区分含有不同物品的房间,而更可能会被用来区分物品本身和用途。坎贝尔和豪尔的算法可以启发“机器学习”面临的其他问题。

此外,这个根据房屋内物品辨别房间的例子,类似于自然语言处理中的主题建模,即一台计算机可以使用单词的关联频率进行主题文件分类。

传统的机器学习算法可以对所有存放在一个集中网址的所有文件采用一致的分类方案,但是坎贝尔和豪尔的算法,可以用分布式服务器将分散在网络角落里的文档集中在一个主题下进行建模。

“分布式计算在部署登陆机器人和空降机器人等多种机器人时将发挥关键作用。”杜克大学计算机工程和研究部副教务长劳伦斯·卡恩教授说,“在本文中提出的分布式运算方法既高效又实用,关键是它打破了贝叶斯推理中证明的对称性。这个问题解决方案非常新颖,并很可能被其他研究人员继续运用。”