为什么说阿里巴巴本身是云上数据中台的最佳实践 阿里巴巴数据挖掘算法
程序员文章站
2022-05-30 16:57:34
...
作者:品鉴 \[ 更多内容详见数据中台官网 [https://dp.alibaba.com](https://dp.alibaba.com/) \]
```
数据中台门在阿里巴巴集团干什么的,由哪个部门掌管?数据中台在阿里巴巴的主要作用是什么呢?外面吹嘘这么神秘的数据中台在阿里实践的如何呢?今天小编正好要采访数据技术及产品部门里面一个老大,带大家来一探究竟。
刚一开头,老大就陷入沉思,沉重的说:“数据技术及产品部门在阿里巴巴集团其实已走过16个年头,掌管着全集团的数据资产,那么多年的积累,帮助阿里建立起了一套完整的数据体系,对业务有全面的支撑。”整个数据中台从基础设施,基础数据技术起步,到数据资产管理;从内部的数据挖掘到体系规范、标准、流程和体系制定;外部产出从数据可视化技术到数据应用,使得内部的小二从方方面面都感受到数据中台的真实存在。
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
**数据技术及产品部门历史**
```
说到数据中台不能不说阿里的底层基础架构的扎实程度,数据中台基于阿里云的基础设施,使用了Maxcompute大数据平台、Analysis database、HBase、ECS等基础组件,基于这些基础组件之上,数据技术及产品部门的智慧工程师们开发了数据资产,它管理着全域大数据,统一的数据建设、管理、服务,服务阿里外部千万用户和内部业务给全集团小二们方便使用全集团的数据,当然这些都有严格的安全和权限管理哦,只有有需要的小二才可以看到和使用哦!
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
```
数据技术及产品部门汇集了各种数据,因此数据官们开发了各种各样的数据技术帮助业务部门实现快速而准确的数据,大家耳熟能详的oneID技术、反 技术、牛逼的双十一实时计算大屏技术等都是数据技术及产品部门小二们开发的哦,非常赞的科技!这些牛逼的技术帮助阿里实现了各种场景的对外和对内的数据应用,数据挖掘技术产出帮助阿里小二们更好的对业务作出判断,实现更好的营销,对外赋能生意参谋产品,使得商家对天猫和淘宝小店的业主们了解自己的生意,生意参谋通过生意背后一盘数据的数据产品服务。基于全渠道数据融合、全链路数据产品集成,为商家提供数据披露、分析、诊断、建议、优化、预测等一站式数据产品服务。目前,生意参谋服务的商家已经超过2000万,月服务商家超过600万;在月成交额30万元以上的商家中,逾90%在使用生意参谋,这可是一个非常高的比例喔!
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
![image](https://yqfile.alicdn.com/4e58c1310e75d7e39f4c4900bc7ebacc2786c393.png)
生意参谋截图
```
得益于阿里巴巴生态和业务体系,阿里数据沉淀了包括电商交易、搜索、物流、支付、广告、风控、移动、视频等种类多样的高质量数据,因此产生了各种数据应用为不同的部门和外部客户提供各种数据服务,采访领导讲,这些应用实在太多了,有为公司高管决策服务的数据挖掘分析产品;有为品牌厂商提供人群分析的品牌银行数据服务;有为集团服务的OneID查询,通过算法和深度挖掘实现的人群画像服务;为其他部门Web或App端开发规范和数据采集的数据埋点和采集系统;甚至还有为阿里云的用户实现敏捷报表开发的QuickBI产品…,哎呀呀,什么生意参谋、quickBI,Dataphin、FBI、可视化埋点、品牌银行、企业参谋,数据质量,数据资产…巴拉巴拉几十个名字,一大串数据产品名字,小编快记不过来,临了领导还提醒小编要保密哦。不过最后小编看到一个叫阿里数据的产品,印象深刻,这可真是一个宝贝,让小编有”一机在手,全盘掌握”的感觉。
很多人都以为数据技术及产品部门是一个ETL或数据处理部门,其实数据技术及产品部门大部分人都是码农哦,他们用最新的技术打造最好用的数据,大家都知道开源的流处理Flink吧,它是流处理技术的后期之秀哦,现在看几乎已经要打败sparkstreaming,storm等前辈,之所以被码农们普遍接受,很重要一点就是阿里的工程师在flink上实现了SQL编程,贡献给社区,让流计算开发变得简单、易用。这些阿里贡献给社区的还有很多,比如DataX,Hadoop等,另一块大家看的眼馋的是数据可视化技术、阿里利用最新的Web端技术、2D、3D的*发挥,大规模的数据量绘制,借助图形化手段,清晰有效的出阿达数据意义,这块在阿里双十一零点那刻发挥的淋漓尽致。
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
![image](https://yqfile.alicdn.com/afb33098c2ce9d0691b42e62b2aee0127f726fae.png)
双11全球狂欢节数据屏
```
数据技术及产品部门不仅数据应用和数据产品做得好,阿里还非常重视体系,组织和标准化的建设,你要知道阿里巴巴是一个10万人的大经济体,阿里的数据服务涵盖所有部门,因此标准、数据规范、采、建、管、控、用的流程非常重要,需要有一个体系,一整套标准来保障阿里数据运行和业务发展,这套标准体系可是阿里的宝贝,不轻易对外的。
数据技术及产品部门除了产品做的好、数据质量高外,也不是一个封闭固步自封的小团体,他还非常重视数据生态圈建设,以开放、分享、赋能为己任,以开放、分享的心态,将阿里在大数据上沉淀多年的经验和能力,赋予阿里外部千万用户和内部业务,帮助商家、中小创业者、传统企业等共同发展、繁荣,与很多院校建立了联系,部分成果开源社区,让大家来分享大家的成功,如果大家想也建设一套数据中台,可以看一下Dataphin、QuickBI、企业参谋、可视化埋点采集系统,这些都是数据技术及产品部门通过阿里云输出的标准产品,海底捞,飞鹤、南方航空、大润发等一大波企业已经在用了哦!
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
除了基础、技术、产品、数据、标准外,数据技术及产品部门形成一套数据中台方法论体系,OneData数据中台是其中一个高度概括,它解决了IT部门数据开发的高人力成本、数据错误、浪费资源、杂乱无章、效率低下等这些经常出现的问题,OneData都能轻松解决,说到这里,小编觉得其实外面说的大数据平台落地难,实施难其实最缺乏的就是阿里的OneData数据中台啊!
```
总之,数据技术及产品部门依托于丰富的数据资产和强大的技术能力和对数据分析、挖掘能力,充分应用到实际业务中。通过算法,深度挖掘人群画像等,并沉淀出一系列优质数据,为阿里的业务创新应用提供数据决策基础和依据。为阿里发挥大数据的价值奠定坚实基础。
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
**结尾:** \[ 更多内容详见数据中台官网 [https://dp.alibaba.com](https://dp.alibaba.com/) \]
阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!
阿里巴巴数据中台解决方案,核心产品:
· Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;
· Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;
· Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。
欢迎志同道合者一起成长!
[原文链接](https://yq.aliyun.com/articles/720863?utm_content=g_1000083376)
本文为云栖社区原创内容,未经允许不得转载。
```
数据中台门在阿里巴巴集团干什么的,由哪个部门掌管?数据中台在阿里巴巴的主要作用是什么呢?外面吹嘘这么神秘的数据中台在阿里实践的如何呢?今天小编正好要采访数据技术及产品部门里面一个老大,带大家来一探究竟。
刚一开头,老大就陷入沉思,沉重的说:“数据技术及产品部门在阿里巴巴集团其实已走过16个年头,掌管着全集团的数据资产,那么多年的积累,帮助阿里建立起了一套完整的数据体系,对业务有全面的支撑。”整个数据中台从基础设施,基础数据技术起步,到数据资产管理;从内部的数据挖掘到体系规范、标准、流程和体系制定;外部产出从数据可视化技术到数据应用,使得内部的小二从方方面面都感受到数据中台的真实存在。
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
**数据技术及产品部门历史**
```
说到数据中台不能不说阿里的底层基础架构的扎实程度,数据中台基于阿里云的基础设施,使用了Maxcompute大数据平台、Analysis database、HBase、ECS等基础组件,基于这些基础组件之上,数据技术及产品部门的智慧工程师们开发了数据资产,它管理着全域大数据,统一的数据建设、管理、服务,服务阿里外部千万用户和内部业务给全集团小二们方便使用全集团的数据,当然这些都有严格的安全和权限管理哦,只有有需要的小二才可以看到和使用哦!
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
```
数据技术及产品部门汇集了各种数据,因此数据官们开发了各种各样的数据技术帮助业务部门实现快速而准确的数据,大家耳熟能详的oneID技术、反 技术、牛逼的双十一实时计算大屏技术等都是数据技术及产品部门小二们开发的哦,非常赞的科技!这些牛逼的技术帮助阿里实现了各种场景的对外和对内的数据应用,数据挖掘技术产出帮助阿里小二们更好的对业务作出判断,实现更好的营销,对外赋能生意参谋产品,使得商家对天猫和淘宝小店的业主们了解自己的生意,生意参谋通过生意背后一盘数据的数据产品服务。基于全渠道数据融合、全链路数据产品集成,为商家提供数据披露、分析、诊断、建议、优化、预测等一站式数据产品服务。目前,生意参谋服务的商家已经超过2000万,月服务商家超过600万;在月成交额30万元以上的商家中,逾90%在使用生意参谋,这可是一个非常高的比例喔!
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
![image](https://yqfile.alicdn.com/4e58c1310e75d7e39f4c4900bc7ebacc2786c393.png)
生意参谋截图
```
得益于阿里巴巴生态和业务体系,阿里数据沉淀了包括电商交易、搜索、物流、支付、广告、风控、移动、视频等种类多样的高质量数据,因此产生了各种数据应用为不同的部门和外部客户提供各种数据服务,采访领导讲,这些应用实在太多了,有为公司高管决策服务的数据挖掘分析产品;有为品牌厂商提供人群分析的品牌银行数据服务;有为集团服务的OneID查询,通过算法和深度挖掘实现的人群画像服务;为其他部门Web或App端开发规范和数据采集的数据埋点和采集系统;甚至还有为阿里云的用户实现敏捷报表开发的QuickBI产品…,哎呀呀,什么生意参谋、quickBI,Dataphin、FBI、可视化埋点、品牌银行、企业参谋,数据质量,数据资产…巴拉巴拉几十个名字,一大串数据产品名字,小编快记不过来,临了领导还提醒小编要保密哦。不过最后小编看到一个叫阿里数据的产品,印象深刻,这可真是一个宝贝,让小编有”一机在手,全盘掌握”的感觉。
很多人都以为数据技术及产品部门是一个ETL或数据处理部门,其实数据技术及产品部门大部分人都是码农哦,他们用最新的技术打造最好用的数据,大家都知道开源的流处理Flink吧,它是流处理技术的后期之秀哦,现在看几乎已经要打败sparkstreaming,storm等前辈,之所以被码农们普遍接受,很重要一点就是阿里的工程师在flink上实现了SQL编程,贡献给社区,让流计算开发变得简单、易用。这些阿里贡献给社区的还有很多,比如DataX,Hadoop等,另一块大家看的眼馋的是数据可视化技术、阿里利用最新的Web端技术、2D、3D的*发挥,大规模的数据量绘制,借助图形化手段,清晰有效的出阿达数据意义,这块在阿里双十一零点那刻发挥的淋漓尽致。
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
![image](https://yqfile.alicdn.com/afb33098c2ce9d0691b42e62b2aee0127f726fae.png)
双11全球狂欢节数据屏
```
数据技术及产品部门不仅数据应用和数据产品做得好,阿里还非常重视体系,组织和标准化的建设,你要知道阿里巴巴是一个10万人的大经济体,阿里的数据服务涵盖所有部门,因此标准、数据规范、采、建、管、控、用的流程非常重要,需要有一个体系,一整套标准来保障阿里数据运行和业务发展,这套标准体系可是阿里的宝贝,不轻易对外的。
数据技术及产品部门除了产品做的好、数据质量高外,也不是一个封闭固步自封的小团体,他还非常重视数据生态圈建设,以开放、分享、赋能为己任,以开放、分享的心态,将阿里在大数据上沉淀多年的经验和能力,赋予阿里外部千万用户和内部业务,帮助商家、中小创业者、传统企业等共同发展、繁荣,与很多院校建立了联系,部分成果开源社区,让大家来分享大家的成功,如果大家想也建设一套数据中台,可以看一下Dataphin、QuickBI、企业参谋、可视化埋点采集系统,这些都是数据技术及产品部门通过阿里云输出的标准产品,海底捞,飞鹤、南方航空、大润发等一大波企业已经在用了哦!
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
除了基础、技术、产品、数据、标准外,数据技术及产品部门形成一套数据中台方法论体系,OneData数据中台是其中一个高度概括,它解决了IT部门数据开发的高人力成本、数据错误、浪费资源、杂乱无章、效率低下等这些经常出现的问题,OneData都能轻松解决,说到这里,小编觉得其实外面说的大数据平台落地难,实施难其实最缺乏的就是阿里的OneData数据中台啊!
```
总之,数据技术及产品部门依托于丰富的数据资产和强大的技术能力和对数据分析、挖掘能力,充分应用到实际业务中。通过算法,深度挖掘人群画像等,并沉淀出一系列优质数据,为阿里的业务创新应用提供数据决策基础和依据。为阿里发挥大数据的价值奠定坚实基础。
```
![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "点击并拖拽以移动")
**结尾:** \[ 更多内容详见数据中台官网 [https://dp.alibaba.com](https://dp.alibaba.com/) \]
阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!
阿里巴巴数据中台解决方案,核心产品:
· Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;
· Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;
· Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。
欢迎志同道合者一起成长!
[原文链接](https://yq.aliyun.com/articles/720863?utm_content=g_1000083376)
本文为云栖社区原创内容,未经允许不得转载。