欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

百度沈抖:百度已将人工智能运用于金融创新

程序员文章站 2022-07-24 21:26:55
10月27日, 百度金融研发负责人沈抖在出席2016中国科技金融FinTech创新大会时表示,百度金融正在通过人工智能驱动身份识别、安全防护、智能获客、大数据风控、智能投顾和量化投资等六大金融科技创新...

10月27日, 百度金融研发负责人沈抖在出席2016中国科技金融FinTech创新大会时表示,百度金融正在通过人工智能驱动身份识别、安全防护、智能获客、大数据风控、智能投顾和量化投资等六大金融科技创新技术,解决金融科技浪潮下,实现普惠金融所面临的获客成本增加、产品差异化程度低等问题与挑战。同时,大会还为百度金融颁发卓越金融科技企业奖。(温泉)

百度沈抖:百度已将人工智能运用于金融创新

以下是演讲实录:

今天跟大家分享一下百度在金融科技方面的一些思考。首先金融科技已经形成大的浪潮,我想很多人也很清楚,单从一个维度就可以看出来,我们可以看到金融科技领域的投资增长速度非常之快。埃森哲的一份报告显示,2015年的时候,金融科技的投资在北美地区涨了44%,欧洲地区上涨120%,亚太地区涨了将近300%,其中在中国涨幅为450%。从这个角度我们可以看到,金融科技确实是在蓬勃的发展。它之所以发展,一个很大的原因是我们确实面临了很大的困难,我们在从传统的金融向普惠金融过渡的过程中有这么几个问题。

一个就是需求的多元化,这个无论是从信贷还是从理财的角度来讲,我们都出现了这种多元化的需求。从信贷的角度来讲,以前我们很多不具备贷款条件的借款人他有各种各样的场景需要借款,比如线上线下的购物、教育以及家装,都有贷款的需求。同时,理财也一样,我相信现在很少有人愿意把自己的钱放在银行里做一个定期,从收益和灵活性的角度来讲都愿意找到更多的渠道和途径。虽然需求多元化,但是产品现在比较单一,因为有很多技术原因使得产品很难多元化。同样是因为这个原因,获客成本也在增加。因为大家都在PK同样一帮人,比如要做借贷的放贷者都盯着有央行征信的这批人,很难触达更广的蓝海用户,所以获客成本也会比较高。

为了解决所有这些问题,我们现在极力地降低产品的门槛,把很多事情挪到线上。风控就是其中一个必须挪到线上的,因为它要实现秒批,实现动态的额度调整,但是为了解决这些问题风控挑战就很大。对于银行信用卡来说,发卡的时候用户真正要激活还是需要“三个亲自”。因为通过这种方式确实可以大幅降低团伙欺诈的风险,但是这种方式无疑跟前面几个问题有很大的矛盾,如果我们不能解决线上的问题,那前面的需求多元化、产品的多样性以及获客的成本都没法解决。

在解决这几个方面上当然我们有很多的思路,金融科技诸多方面中我们重点说这么几个,身份识别、安全防护、智能获客、大数据风控、智能投顾和量化投资。首先,身份识别对我们做互联网金融意义非常大,正是为了把所有的事情线上化,我们必须做到身份认证,做到真人真身份,知道这个人就是这个人。身份证识别和银行卡识别理论上讲是非常传统的一些技术,OCR已经做了很久,但是第一把它做到可用的程度现在还是很难的,第二把它真正用在金融场景里也不是那么容易。因为这个一方面可以让输入身份证的时间、卡号的时间大幅下降,另一方面也提高了团伙欺诈的成本,毕竟要做成实物的卡和身份。

人脸识别,现在我们真正要做远程开户,这些事情我们不可避免的要做到一个真人真身份识别的问题。这样的识别其实有时候人都很难去区分,比如这里面上面两张图,其实对人来讲也是很难的事情,但是机器通过深度学习和大量语料训练,它可以抓到人和人之间的区别,反而能做到更好的识别。在百度内部我们自己在设计一个非常复杂的数据基因,这些数字本身可能并不代表什么,但是从同一个数据局的更新速度来讲我们可以看到它的效果提升是非常明显的,在几个月的时间内我们从错误率8%降到1%,这样的技术才能真正商用。另外,手写签名,这是我自己做的一个Demo,左边是我自己在系统里录入的签名,右边是高仿签名。这种情况下大家要猜也未必能猜的准哪个是我真实的签名,哪个是别人高仿的签名。这两个签名,第一个会失败,第二个会通过。因为我们现在每个人手里都有一个智能手机,很多时候都是在线上活动,这时候这个签名不只是一个形体,更多的是你运笔的方式和速度,以及力度,所有的因素都决定一个人使用的习惯,所以在这种情况下我们可以做出更精准的签名的识别。如果我们能解决身份识别上这个问题,在互联网金融里很多欺诈的行为都可以解决掉,至少能保证真人真身份,再也不会发生大量从某个工地或者农村收一大批身份证,然后批量开卡,批量欺诈。

另外是安全防护,做金融、尤其我们24小时不间断线上金融服务的情况下,安全防护尤其重要。我们一方面要正常的用户很好的使用这个服务,另外一方面要把攻击者挡在门外。这里面有几个维度。第一个是端上的安全,再一个是传输过程中的安全,再一个是账号的入侵检测和保护,最后还是要通过生物的活体来保证这个的真实性。

刚才我们讲到获客成本现在大幅度的提高,智能获客其实不是一个新鲜的概念,从我们有商业活动以来就一直在谈,都是希望找到自己最想要的那部分人,尤其十几、二十年互联网广告的发展,在这个领域上其实已经有非常大的进展和突破。所以,这是为什么大家在某一个网站上看到一个商品,接下来你换任何一个网站这个商品都跟着你走,即使你买了还接着让你看。

在金融领域智能获客就显得尤其重要,我相信在座的诸位从事这个领域和行业的会知道一个获客成本是非常高的,你想放出去一笔贷款都是几百块钱到上千块钱的获客成本。所以,这时候要想解决获客成本的问题大概有三个方面。一个是必须得去有足够多的数据来精准的刻画这样一个用户,第二个就是必须有这种能力去发现这个用户产生金融需求的那一瞬间、那一刹那,这时候你才能真正捕捉到他,这是因为在获客上也是一种赛跑和竞争的过程。另外,要足够多的流量使得我们能够去触达这些用户,即使我们不能在第一时间触达他,但是我们可以持续的找到他。

所以,从百度的角度来讲,一方面对用户洞察上,在各个维度进行刻画,同时也有大量的金融需求的流量在发生,有这么多的流量可以触达他。这样我们就提供了金融商城这样一个服务。一方面我们是请金融服务商,无论是信贷的、理财的、保险的,这些都可以在这样一个平台上提供服务。另外一方面就是利用百度的技术和流量抓取用户,发现需求,在商品上实现对接。

风控对金融来讲更不是一个陌生的概念。我们任何时候其实都是在做风险控制,无论是在我们在做To C的信贷还是我们在做一些资产管理To

B的业务,都是离不开风险控制。在互联网时候,在金融科技这样一个大的前提下,这个风控有什么特点呢?我们是觉得应该增加它的迭代速度,实现基于大数据的快速迭代来和欺诈、信用做对抗。一方面是现在确实有很多的数据,无论是金融服务的数据、搜索社交的数据、O2O、LBS的数据,总而言之,我们其实可以得到很多关于个人和企业的数据,通过这样一些数据挖掘和行业的洞察形成一些用户和企业的一些特征,进而有一些模型,一些相对比较成熟的技术可以对用户做出判定,好人、坏人,企业的好坏,接下来在线上形成体验性的闭环。虽然在金融领域它有一个特点,就是验证的滞后性,因为你发一张信用卡出去,你放一笔贷款过去你不到他还贷的时候你不知道他是好人还是坏人,甚至还债的时候前几期他老老实实给你还,但到最后的时候他可能不还了。所以,整个验证是有比较明显的滞后性,但是即使这种情况下在某些领域我们还是可以做快速对抗,尤其是欺诈的,一些系统性的风险方面还是要快速的迭代。

从人的特征上来看,怎么去刻画一个人是我们现在大量看的一些维度,一方面是他贷款的意愿、还款的能力和欺诈可能性,这里面还是有很多信息可以帮助我们判断。一个人他想欺诈,其实他内心是很纠结的,尤其一个新手,他要在很多途径、很多渠道找朋友不好意思问,朋友圈偷偷看,各个网站上偷偷的去搜,他要搞清楚欺诈的成本到底有多高,风险有多大。这些必然留下很多线索,只是我们怎么把这些线索给收集起来。同样,他的贷款意愿在什么时间点上有什么贷款需求,根据他平时的消费习惯,以及大事件的发生,比如他突然毕业了要就业,要租房,要买车买房,所有这些时间点能帮助我们判断他的贷款意愿。从一个企业的角度来讲,其实现在我们也掌握了比以前更多的数据可以帮助我们去判断一些资产的质量。举个很简单的例子,比如我们要看一个商业地产或者一家企业它的经营情况,当然有很多途径可以拿到数据,其中一个数据可以通过这个店的客流量。以前我们可能要站在马路上去数,现在通过LBS数据可以帮我们快速的判断这个企业的客流和经营情况。

接下来我们谈一下智能投顾,这个概念虽然非常热,但是实际执行起来还是有一定的难度,这个也是解决我们刚才提到的多元化需求的一个关键点,在理财的领域里大家根据他自己的资金情况,风险偏好的情况,我们需要把用户的这种诉求和一个资产的收益和风险情况对接起来。要想做到这一点首先要有一个非常完整的金融的知识图谱,能够来刻画用户的金融需求和资产的质量等各种维度。接下来我们需要去理解一个用户,形成一个用户的画像,通过他的行为数据来判断他的需求。同样,在这样一个金融知识图谱的前提下我们也可以给资产做一个资产的画像,这时候就可以做人和资产之间智能的匹配,同时进行自动的监控,最终才能实现个性化的理财需求。

最后我跟大家分享量化投资。这个从概念上来讲也是非常热,而且我相信大家也都非常熟悉这样一个概念,但是真正在操作的时候,每一个公司,每一个企业其实有他自己的特点和优势。量化投资到底是不是可行,取决于各个维度是不是真的能够做到独特的手段。一般来讲流程上看有一个标的的研究,接下来标的的筛选,建立投资组合,最后做组合的风险控制,但是在每一步每一个维度上大家都可以做自己的工作。比如标的的调研上,以前我们可能要去读财报,然后读一些公司的基本面,大量的去查,去做各种各样的笔记。实际上现在随着文本的理解、深度学习、语义的理解,我们可以做到很多财报的智能解读,包括我们刚才讲的一个厂区的LBS数据判断它的经营状况,以及全网的舆情监控,然后大家进一步对一个资产、对一个企业的经营状况,它的上下游,很多时候反映它经营状况的这些指标大家都会在互联网上留下一些足迹,形成一些舆情,这些都可以用来帮助判断标的的好坏。

另外,对标的筛选的时候很多传统的因子,我相信大家也都在用,对一个互联网公司来讲,它确实可以考虑更互联网的特色,比如搜索情绪的因子、行业热点的聚合、模式识别,再加上一些量化的基本面这些因子。这样的话投资组合和风险控制也是每个企业都在各显神通做这些事情。

刚才我快速的从我们现在百度在做的一些工作,以及我们金融科技领域的一些理解,非常浅显地跟大家快速过了一下,因为时间非常有限。虽然这是百度自己的一个愿望,同时也是我们所有在座的每一位都在孜孜不倦追求的一个理想,就是我们利用人工智能的这些技术优势,升级传统金融,实现普惠金融的梦想。谢谢大家!