天云大数据CEO雷涛:AI建模平台演进趋势着力于Auto Machine Learning
ai democracy 的核心是将科学家在传统实验室完成的工作,赋予更多人使用,降低使用门槛,让更多的开发者、业务人员能够使用人工智能。ai不是少数人的专利,未来人工智能发展趋势更应凸显规模化生产能力,让企业获取机器智能像读书一样简单。——天云大数据ceo雷涛在2018全球人工智能技术大会(gaitc)上如是说。
ai democracy 的核心是将科学家在传统实验室完成的工作,赋予更多人使用,降低使用门槛,让更多的开发者、业务人员能够使用人工智能。ai不是少数人的专利,未来人工智能发展趋势更应凸显规模化生产能力,让企业获取机器智能像读书一样简单。——天云大数据ceo雷涛在2018全球人工智能技术大会(gaitc)上如是说。
ai *化 吸引更多使用者
人工智能在各个领域的发展呈不平衡态势,如无人驾驶、人脸识别以及机器人等领域,因其算法与目的都很明确,又因媒体关注的推动,资本与数据的聚焦之下容易找到最佳实践;但针对算法纷繁复杂、数据私有与云服务私有的商业智能领域,ai应用程度参差不齐,ai正经历从api 向paas的发展,ai模型的规模化、智能化生产能力尤为重要。
在日前举办的2018 gaitc会议上,天云大数据ceo雷涛发表了“ai平台演进趋势着力于auto machine learning”主题演讲。在他看来,ai paas化,智能化是突破昂贵商业价值交付的关键。
从无人驾驶到智能投顾,从视觉识别到风险欺诈,核心算法都是开放的深度学习(deep learning)。在开源的核心基础技术主导的新市场规则下,新的商业实践和市场结构正在形成。ai算法是开源的,但商业价值的交付却是昂贵、复杂和低效的。a(algorithm)、b(bigdata)、c(cloud)的有效融合,成为ai商业推广与工程化实施的关键。三者的融合,使得无需掌握太多数据科学经验的人也可尝试ai。通过ai的paas化,没有用过ai的团队也可以快速利用ai平台进行建模,相比传统的sas数据挖掘平台,可以更高效的利用数据科学工具解决业务问题。
团队规模决定了产出量。要实现规模化,需要跨越“数据科学”“分布式计算”等关键科技,海量数据规模化转换为商业价值,这种跨界难度非常之大,雷涛用近期某大型银行最新发布的app版本举例说明了ai paas化的必要性,银行沉淀大量数据资产,有大量建模需求,最近某大型银行发布手机app6.0版本,3000人的团队即可年生产600种模型,是以人工智能赋能金融,实现规模化模型生产的最佳范本。
这种矛盾和挑战是指a和c的融合,不同知识技能在工程上的融合,目前国内已经出现致力于将计算能力和数据科学能力融合在一起,面向业务定义快速生产ai模型的流水线式ai建模平台,比如天云大数据的maxim ai平台。
auto machine learning : ai 建模平台演进趋势,优化 ai 的 ai
雷涛指出,应用机器学习技术解决现实世界问题是昂贵而困难的。利用基于ai的技术方案来克服这一应用过程中的难题,就是自动化机器学习(automl);automl指的是”用于优化ai”的ai;微软和谷歌先后利用图片分类的案例给出了其对automl的答案:建模者只需付出最少的操作(上传、选择和评估),利用微软或谷歌云ai平台的能力,即可获得具有一定精度的机器学习模型。
专家经验在机器学习建模过程中起重要作用,这导致了建模昂贵、困难,而包括微软和谷歌等企业的实践表明,ai建模平台应沿着减少人工干预和减少专家经验依赖的方向发展。天云maxim ai平台最新推出的3.0版本,能实现模型智能化生产,实现自动化机器学习:具体包括,自动选择算法模型、自动调优超参数、自动实现多模型集成学习和自动实现模型性能对比,最终输出最优的模型;还包括“让数据就绪到可以进行机器学习”的自动特征工程,提供丰富的特征空间。通过上述自动化方法,天云maxim ai平台大大减少了对专家经验的依赖,大大降低了企业应用ai建模平台的门槛。
天云分布式数据科学平台maxim ai是基于hadoop/spark分布式底层架构的机器学习及建模平台产品,采用图形用户界面交互免编码模式,简化了整个建模流程和模型生命周期管理,支持全量数据建模,实现了分布式运行深度学习、梯度提升、逻辑回归、随机森林等热门机器学习算法,实现了机器学习模型生产批量化和智能化,可以有效的帮助企业简化建模流程,将编程建模方式简化为免编码建模方式,更加高效的利用机器学习模型解决业务问题。
元学习、迁移学习:未来第四代ai建模平台演进方向
据雷涛介绍,未来天云第四代ai建模平台演进方向是元学习、迁移学习,相比超参数调优、自动特征工程等对建模某个子流程的自动化设计,迁移学习和元学习从更宏观的角度支持ai建模自动化,使得模型复用更加有效,一个新的建模过程可更加充分的利用机器学习到的经验。
maxim ai是通用数据科学平台,目前,不仅成功地在多家大型股份制银行部署,也为batj这样的大型互联网公司提供底层技术服务,同时在能源、*等领域也得到了成功验证。在能源领域,通过对油井故障排查方面进行单井功图数据训练,针对不同功况,做实时诊断并做长期预警。在*领域,助力跨境电商缉私业务风险识别。
在金融领域,通过maximai建立的现金分期响应模型,能够预测和筛选办理此业务的概率较高的客户,进而帮助银行提高营销活动的效率,从而降低成本、提高银行利润。类似的,还可利用该平台建立循环授信响应模型,依据客户行为特征对客户群体进行分类,筛选接受循环授信业务概率较高的客户,进而向这些客户推送循环授信业务,提高营销活动效率,降低成本,提高利润。该平台还成功的应用于风控领域,建立了贷前申请评分卡模型、贷前反欺诈模型、贷中行为评分和风险预警模型和贷后催收模型,有效降低银行在贷前、贷中和贷后整个业务流程中的风险,减少损失。天云大数据智能平台在互联网金融黑名单、多头贷发现、失联修复、循环担保等方面也有成功的项目实施案例。
作为专注于大数据基础设施软件平台和分布式人工智能建模平台的科技创新公司,天云大数据智能平台在大型股份制银行、保险、证券和互联网金融公司、石油行业、海关总署都已落地部署样本工程。
凭借多年的大数据平台和人工智能服务经验,天云期待通过ai赋能,不断降低行业应用门槛,让企业获取机器智能像读书一样简单。