欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

谷歌DeepMind刚做的两件事所带来的AI创业启示

程序员文章站 2022-10-17 15:00:39
看起来DeepMind用AlphaGo战败李世石后似乎就没啥动静了,但其实不是的,这家公司正推动着AI往纵深发展,而不是单纯的停留在围棋这样的领域。只不过这些事情没有那么抓眼球,所以很多人并没注意到。...

谷歌DeepMind刚做的两件事所带来的AI创业启示

看起来DeepMind用AlphaGo战败李世石后似乎就没啥动静了,但其实不是的,这家公司正推动着AI往纵深发展,而不是单纯的停留在围棋这样的领域。只不过这些事情没有那么抓眼球,所以很多人并没注意到。很有意思的是从当前DeepMind所做的事情里我们其实可以抽取出一些更有价值的模式,比如什么是人工智能+,到底应该怎么加。

案例1:降低能源消耗

DeepMind第一件在做的事情是用机器学习来管理数据中心,期望达到比人管理更省电的效果。最终结果非常不错,实际成绩是:比人管理的时候节电40%。

为把事情说清楚需要简单介绍一下背景:

Google这类大互联网公司的应用比如搜索、Gmail、公有云服务等是完全跑在自己的服务器集群上的,这些集群无比庞大通常有数百万台服务器。

由于服务器太多因此并不会只放在一个地方,而是分布在多个数据中心里。管理各个数据中心时,一个核心问题就是冷却。我们手机用时间长了还发热,那么多总是在跑的服务器如果没有有效的冷却措施,那数据中心会变的火炉一样。

数据中心的冷却系统和*空调差不多,这样一来就需要来根据环境来控制什么时候开冷却系统,开多少度等。但每个数据中心所处的地点、架构并不完全一致,这就给管理带来了一些麻烦。

DeepMind把这种麻烦总结为三点:

1. 冷却设备、操作设备的方法、环境之间不是简单的线性关系。也就是说不是环境温度是30度时,那冷却系统调成20度就完了。

2. 冷却系统并不能迅速响应内部或外部的变化。也就是说外部气温上升,你据此进行调整,但实际起效果的时候,外部气温可能又下降了。

3. 每个数据中心都有自己独特的架构和地理位置。

DeepMind解决这问题时显然又会用神经网络,这次他们训练了三个神经网络:

一个神经网络用各种传感器收集来的数据进行训练,比如:温度、功率、泵速等;

一个神经网络被训练用于预测下一小时的温度;

一个神经网络被训练用于预测下一小时的工作负荷。

都训练完之后DeepMind把这三个神经网络在某一个数据中心进行了应用,评测的指标是PUE(Power Usage Effectiveness),这个值表示数据中心能源消耗在整个IT能源消耗中的占比(显然越低越好)。为了说明结果,DeepMind贴了一张图出来:

谷歌DeepMind刚做的两件事所带来的AI创业启示

取得效果后DeepMind认为,它的这个神经网络不只可以用于数据中心,而还有一定的通用性,所以准备把它展开到发电厂、半导*造等。

案例原文:https://deepmind.com/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-40/

案例2:看病去

DeepMind的另一个尝试是用神经网络看病,并且专门给项目起了个名叫DeepMind Health。

医疗现实是这样:每11个成年人里就有1个会得糖尿病,而糖尿病会让患者失明的概率提高25倍,如果失明的症状能在早期发现,那么有98%的可能性来治愈这疾玻

但很可惜的是传统的分析方法非常复杂,非常有经验的眼科专家也要花很多时间才能做出诊断,所以很难及时的对所有病人进行精确诊断。

DeepMind解决问题的思路还是通过导入神经网络。他们同一家叫Moorfields的机构合作,拿到了近百万的原始数据。

我们可以想象这些数据有两个显然的好处:一个是这些数据是原始的医疗数据,清晰度足够;一个是这些数据实际上是标记过的。

DeepMind会用这些数据训练它们的神经网络,然后诊断的问题就变成了从图片中提取特征的问题,而如我们所知深度学习在图像识别上其错误率是比人低的,并且会越来越准。

这个项目还没有取得实际效果,但从Imagenet上不断提高识别率上来推断,这会导致诊断的精度和速度有根本性提升。

案例原文:https://deepmind.com/blog/announcing-deepmind-health-research-partnership-moorfields-eye-hospital/

A.I.创业上的启示

跳出来看的话,我们可以发现DeepMind的两个尝试具有这样的特征:

1.垂直的领域,但机器学习可以促成质的飞跃;

2.垂直领域牵涉的商业价值足够大;

3.能够比较容易的获取有效数据。

我们有理由相信这会是未来人工智能落地的普遍模式。现在的人工智能具有通用性,但远不是通用智能,并不能够什么都干。

这样一来从投入产出比的角度看,它就只有落地在那些显然能产出较大回报点上,这样才能真的获得应用。一个点获得应用后,那再展开到类似的领域,比如DeepMind从数据中心展开到发电厂,这样就可以形成“技术进步-投资-回报”上的正反溃这很像新一代的单点突破,横向展开,所不同的是同一时间可以做的点实际上也还受制于是否能获得数据。

反过来讲这也意味着号称能做通用智能的基本上是骗子和疯子。声智科技(一家提供声学、语音方案的创业公司)的CEO陈孝良对此有非常清醒的认识,他的一个核心观点正是:智能不是越通用越好,数据也不是越多越好,认知技术能力边界非常关键。

上面所提到的基本模式未来很可能成为人工智能+的基本模式。有意思的事情是,这种落地并不只是DeepMind公司才能做,而是普遍存在于各个行业之中。

我们可以把能够做神经网络的团队分成两类:一类是真的能对模型本身有所改进,对社区做出根本性贡献的团队;一类是能够用好模型,把它落地的很好的团队。前者无疑是非常稀缺的,并且也只有极大的、有野心的公司才养得起,后者则门槛相对较低,与此同时应用范围则极广,极端点可以认为可以应用到所有匹配上述模式的地方,也正因此这里才蕴含了比较多的创业机会。

这里必须一提的是,真创业的话,DeepMind这个公司本身并不是一个很好的模仿对象,这公司实际成功的方法是:先屯一批很牛的人,不管落地方向,做些很牛的事情。等到抱上Google的大腿,再考虑怎么落地。这方法正常创业公司完全学不来,上面主要想强调的是它落地的方法值得学习,而非公司自身的创业思路。

小结

很多点获得突破和应用后,事实上就为真的通用智能做了充足的准备。想象下,我们的电力、医疗、教育都非常依赖于数据和垂直的智能,那只要AI的技术真的有突破,那么,一种超级智能来接管这一切就会变得非常容易。到那个点上,社会结构、经济形态就会产生根本性变化。当然这是另一个非常宏大的话题,真感兴趣的话,可以看我的新书《终极复制:人工智能将如何推动社会巨变》(硬广,汗...)。