欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

未来已来:大数据时代,如何掌握数据安全的主动权?

程序员文章站 2022-03-01 21:32:39
问答q&a神州2020.10.16“我们可以从信息空间中去改造一个物理空间”2020年8月,创新工场董事长兼ceo李开复在一场活动中表示:新冠疫情正加速社会&ldquo...

问答

q&a

神州

2020.10.16

“我们可以从信息空间中

去改造一个物理空间”

2020年8月,创新工场董事长兼ceo李开复在一场活动中表示:新冠疫情正加速社会“化”。而“”,这个早在1956年就被提出,经历了相当一段时间低潮期的学科,正迎来前所未有的高潮。中国第一批投入人工智能方向的专家,中国工程院院士、国家新一代人工智能战略咨询委员会组长潘云鹤曾提到:新一代人工智能最本质的改变之一,是在原本的人类社会空间,和物理空间的基础上,增加了信息空间。

潘云鹤:比如说交通问题,过去我们只能够看到一个十字路口的变化,现在我们可以在信息空间里看到这个十字路口的变化,是怎么去影响周围四个十字路口的变化。不但可以看到它,而且可以改造它。我们可以从信息空间中,去改造一个物理空间。比如说,以前做一次人口调查要半年,需要成千上万个工作人员。五年以后我们再做一次人口调查,也许几个星期、几百个人就够了。当我们把收集起来,例如户口、购物、等等,就可以给每一个人进行画像。

以前的人工智能,基本上是基于知识的人工智能。现在的人工智能实际上不再基于知识,而是基于数据。它们的不同之处在于,它能够自动地把数据变成知识。所以我们把它取了个新的名字,叫“智能”。

另外一个非常重要的方向就是,老一代人工智能的目标,是想把做好,造出越来越有用的机器人。那么新一代人工智能,不但要把变得更聪明,而且应该把计算机和人连在一起,把它合成一个更加聪明的智能系统。

潘云鹤:我们现在遇到的数据,很多是很差的,质量上面非常差,而且有的数据太偏,数据不完整。比如我拿到了很多数据,只是一个方面的,另外一方面的数据根本就没有,这些问题都会反映到最后形成的知识水平上面来。那么人为什么会逐渐地进行进化呢?就是因为人能够用学到的东西,去指导后面的智能,他能够不断积累。现在的人工智能也能自己成长,但是它知识不够完整,它只能在那个圈子里成长。如果我们把知识再扩大一块,比如把人大脑中间的形象知识包括进去,让计算机能成长起来。

吴小莉:您觉得这个过程要多久?

潘云鹤:我估计大概要一、二十年。

时代

该如何掌握数据的主动权?

方滨兴:、人工智能的处理能力,前提都是要有原始的数据。数据为王,谁拥有数据,谁就是王。为什么有gdpr(通用数据保护条例),就是因为他们没有强大的服务能力,所以它会对别人的服务高度担心。如果它自己有这么大的企业,它可能也不会有这么多的担心。但现在它的全部数据都是在,所以他们就要有一个特别强硬的法律,来对它们加以限制,来保护自己。美国确实太强大了,它们基本上“吃遍”了全球。

我们看回中国的例子,原来别国的产品想要入驻中国时,中国说你可以运行,但是必须按照我们的要求进行管理,比方说,有害信息你不能跟着传播等等。但是它不接受,它说那我就不进了。那现在看来,中国就跟着起来了,中国就出来了百度、微信了。

吴小莉:bat(百度、阿里巴巴、腾讯)。

方滨兴:所以从这方面,等于无形中让中国自己的产业做起来了。因为这个产业,它构成的是一种服务中心,这种服务中心能够获取一个国家的很多的核心信息。

国内开源生态 正在建立中

如今,各类创新应用场景催生出多样化的数据,使得业界对提出一种全新计算架构的呼声愈来愈烈。随着算力成为时代各国的核心竞争力之一,巨型科技公司也逐渐开始自建能力开源。鹏城实验室主任、中国工程院院士高文提到:利用开源平台集合众人智慧,是推动软硬件智能化升级的重要一环。

高文:说到人工智能,它现在是叫“框架平台”。现在就有好几个版本, 国际上影响比较大的包括谷歌、亚马逊、facebook、ibm、微软。它把人工智能的源程序都放在自己的开源框架里,供别人下载,如果别人再往上加东西,就需要再放回去。现在影响最大的是谷歌的,所有的大学、中学都在上面玩,所以它这个东西就会越滚越大。

吴小莉:其实开源开放的平台的优势在什么地方?

高文:开源其实是领域发展的一个新做法、新文化。以前软件都是卖版权的,比如我设计的软件,你想使用就需要支付版权费。但是大概三十多年前,mit的一些教授就开始倡导开源软件。就是下载我的软件,是有许可证的。许可证要求的是你下载后,如果对这个软件有任何修改的地方,需要放回来。

在国内,其实二十几年前也很倡导这个东西,这个是有一个很好的案例,就是华为的案例。华为有一段时间,就是从网上拿来版本后,有一些人就提出,我们自己开发就可以,也不用拿出去了。另外一些人就说,我们应该交回去,按照许可证的要求来做。所以华为内部就说,那既然你们两方谁也不服谁,就按照各自的方案走一段时间,然后两边就开始铆足了劲干。半年以后,私有的那个团队跟不上了,另一个写了往回交的团队,还在往上升。所以开源就是一种文化,软件是一种文化。

目前在全球范围内,美国拥有数量最多、应用最广的ai开源平台,在框架和大部分应用领域均处于领先地位。但是近年来,中国在计算机视觉、智能语音、中文、无人系统等领域的开源平台,也逐渐在国际上占据一席之地。

9月18日,2020中关村论坛“ai开源创新与产业智能化”平行论坛举行。中国科协学会学术部部长刘兴平在致辞中提到,开源的应用已经突破了单纯的技术层面,成为跨国界大规模协作生产方式的代表。

人工智能不仅要有“智”

更要有“德”

2020年的新冠疫情,让本已参与在各行各业的ai技术迎来风口。无论是业界还是学界,都对人工智能人才求贤若渴。世界工程组织联合会主席龚克提到:顶尖人才缺口大、人工智能人才培养的*不够灵活,同样限制了中国的人工智能产业发展。另外,他也提到,虽然人工智能已经诞生了63年,但是中国的人工智能技术的发展顶多只有十几岁。中国在人工智能技术方面的基础算法、基础研究的积淀与美国相比,仍存在着比较大的差距。

龚克:我谈人工智能包括五个要素,通常你会看到谈三个要素,包括数据、算法、算力。但是我认为另外两个要素比较重要,分别是应用场景和人才。我认为人工智能的发展必须要具备这五个要素。首先,因为中国现在的应用面铺得特别开,所以我们在应用上应该在全世界是走在前面的。但是我们的弱点在什么地方?比如卷积。各国都在卷积上做了很多的更新,结合了具体的应用场景。但是卷积深度学习的这方面研究,仍然是美国人提出来的,而且美国人现在在集中解决算法可解释性的问题,我预期今后几年可能会提出新的算法或者数学上的更大突破。所以在这方面,我们现在是相对地走在后面。

其次,现在人才缺失是全球性的难题。不仅中国缺,美国、、欧洲也缺。但是中国从人才角度来讲,我们缺的是顶尖的、领军的人才。因为人工智能是一个跨学科、新的学问。它既是计算机科学,也是电子科学,还要跟机械、、等紧密结合。而中国的*,恰恰有比较窄、比较专的专业划分,所以目前的教育*对我们人工智能的培养是非常不利的。

我们现在把人工智能和教育分成了几个部分:第一类,是以人工智能为内容的教育,培养专业的工程师;第二类,是要渗透到所有专业里面的“人工智能+”教育。比如说机器人,过去是机械专业里面的东西,但如今光懂算法是不行的,它一定要跟很多力学的原理结合在一起;第三类,是通识教育,我们未来的公民是智能时代的公民,人们对人工智能要有一定的了解。另外还有一个重要的教育,是要保障人工智能具有人类价值观。

吴小莉:还要把“德”放进去。

龚克:对,那么这个就需要教师了解智能时代的伦理等等知识,例如数据的伦理、技术的伦理。

安全与创新 伴生前行

2019年8月,一款名为“zao”的换脸软件一度爆红于社交网络。通过这款软件,用户可以“一键”进入明星出演的影视片段。但是,因涉嫌过度收集用户个人信息,“zao”刷屏社交网络仅几天后,中国工信部就对其涉及的网络数据安全问题开展问询约谈。

2020年10月1日,新版《技术个人信息安全规范》正式实施,针对个人信息方面的要求,进行细化并完善。

方滨兴:技术在先,安全在后。它们是伴生而来的。我们每年都说安全方面有很多问题,就是因为不断有新技术,新技术带来新的安全问题。这就好像打扫卫生,一个地方老住着人,就算天天都有人打扫卫生,还有人每天都说卫生不好,是因为这里一直住着人。所以我们说安全伴生技术:只要出现了一个新技术,一定有新安全问题。一个新技术在安全领域可能赋能防御,也可能赋能攻击。

高文:人工智能在这点上非常像原子能--用好了是造福社会、造福人类,但是如果往坏里用,会对社会带来极大的危害。

吴小莉:您提到了人类的智能时代,大约会在2030年左右会到来。那想象一下,到那个时候,中国人工智能的发展,会是个什么样的景象?

高文:应该比现在还热闹。是这样,我们都说任何事都有一个从量变到质变的过程,现在还是在做量的积累,还不够。可能再有十年的积累,可能会往质变的方面翻转。到时候我们就更方便了,人可以做得更懒一点、更*一点。

潘云鹤:也许到那时候,人就不需要竞争了。你们去看科学的发展,实际上和人的理想的发展,有时候很类似。因为科学技术最后还是掌握在人的手里面,它一定是向着推动人类拥有更美好的生活,这个方向发展的。