大数据基础概述
程序员文章站
2022-03-08 14:27:39
...
前言:大数据是时下很热门的话题,作为一名数学专业的程序员,很早就听老师说过,只是一直没有机会去系统的学习,最近狠下心准备研究研究!话不多说,撸起来
一、什么是大数据
大数据是现代硬件、软件高速发展的产物。主要体现在:
数据量大,常以TB、PB更甚
有大量数据所引发的存在大量数据管理及存储工作
大数据分析
大量用户群体
二、大数据4V特征
如图,可分为:
- 数据量大(PB、TB、ZB…)
- 速度快(高速I/O操作)
- 多样性或复杂性(数据来源复杂[视频、音频、图片等],数据格式复杂[非结构化和结构化数据])
- 基于高度分析的新价值(预测预警等)
三、大数据带来的技术变革
主要有技术变革和商业变革
1、技术驱动
- 存储:单机文件存储–>分布式存储
- 计算:单机计算–> 分布式计算
- 网络:万兆网络
- 数据库:RDBMS --> NOSQL(Hbase/redis等)
2、商业驱动
业务和技术结合
四、大数据现存模式
- 有大数据技术,但无数据(一些第三方大数据企业)
- 有数据但没有技术(传统企业居多,也涉及到物联网发展等等)
- 有技术也有大数据(比如BAT)