CarbonData 大数据交互式分析实践(spark summit)
程序员文章站
2022-06-10 18:19:24
是一种高性能大数据存储方案,支持快速过滤查找和即席OLAP分析,已在20+企业生产环境上部署应用,其中最大的单一集群数据规模达到几万亿。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,业务驱动下的数据分析灵活性要求越来越高,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支... ......
carbondata是一种高性能大数据存储方案,支持快速过滤查找和即席olap分析,已在20+企业生产环境上部署应用,其中最大的单一集群数据规模达到几万亿。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,业务驱动下的数据分析灵活性要求越来越高,carbondata提供了一种新的融合数据存储方案,以一份数据同时支持多种应用场景,并通过多级索引、字典编码、预聚合、动态partition、准实时数据查询等特性提升了io扫描和计算性能,实现万亿数据分析秒级响应。
具体可复制链接到https://www.slidestalk.com/s/carbondatasparksummitchina201783653