hive调优

程序员文章站 2022-04-20 18:15:03

1、表和sql的优化 -》大表拆分成小表、分区表、外部表、临时表都是属于优化的一块 -》分区表：检索更快速 -》外部表：数据安全性 -》临时表&拆分子表：简化复杂的SQL以及需求 2、SQL可以从join和fliter两方面深入 3、MR优化 -》map和reduce的个数 -》一个分片就是一个块， ......

1、表和sql的优化
       -》大表拆分成小表、分区表、外部表、临时表都是属于优化的一块
           -》分区表：检索更快速
           -》外部表：数据安全性
           -》临时表&拆分子表：简化复杂的SQL以及需求

2、SQL可以从join和fliter两方面深入

3、MR优化
           -》map和reduce的个数
               -》一个分片就是一个块，一个块对应一个maptask
               -》Hadoop源码中有一个计算公式
           min(max_split_size,max(min_split_size,block_size))
           -》min_split_size默认值0（最小分片大小）
           -》max取的时候取的是block_size，block_size默认是128
           -》max_split_size默认值256（最大分片大小）
           -》这个公式决定了map的个数
           -》肯定不能直接去修改HDFS的block_size
           -》一般在实际的生产环境中HDFS一旦format格式化之后，block_size大小不会去修改的
           -》通过修改max_split_size和min_split_size来影响map的个数
           -》并行执行
               -》针对有些互相没有依赖关系的独立的job，可以选择并发的执行job
               hive.exec.parallel
               -》是否开启并行执行的功能
               hive.exec.parallel.thread.number
               -》设置并行执行的线程个数
               -》一般在工作中会选择去开启该功能
               -》根据实际的集群的状况和服务器的性能合理的设置线程数目
           -》JVM重用
               -》mapreduce.job.jvm.numtasks通过合理的测试，设置一个合理的数目
           -》推测执行
               -》当某个任务出现迟迟不结束的情况，那么会考虑开启推测执行，开启一个一模一样的任务去完成
               -》两个任务谁先完成，就会关闭另一个
               -》分为map端的推测和reduce端的推测
               -》不好的地方：过多的消耗资源
               mapreduce.map.speculative
               mapreduce.reduce.speculative
               -》额外消耗节点资源
               -》可能会出现重复写入的情况，产生异常

4、hive本地模式
               -》业务场景：处理小数据集的时候，速度会更快一些
               -》hive.exec.mode.local.auto
               -》本地模式的限制：数据的输入大小不能超过128MB
               -》本地模式的限制：map数不能超过4个
               -》本地模式的限制：reduce的个数不能超过1个

上一篇： iOS-UIImage图片绘制颜色

下一篇：深圳美食攻略，不要再说你不知道深圳美食有哪些了！

hive调优

优酷视频客户端怎么设置始终跳过片头片尾？

优酷大酷卡与小酷卡哪个划算？优酷大酷卡与小酷卡套餐资费区别对比

优酷大酷卡与腾讯大王卡哪个好？大酷卡和腾讯大王卡套餐资费对比区别介绍

优酷盒子k1怎么用怎么安装应用(操作全程图解)

PHP实现使用优酷土豆视频地址获取swf播放器分享地址

cad2017经典模式的调法详解

优酷视频可下载吗图文教你无需任何软件就可下载优酷土豆视频

联想Z500屏幕亮度怎么调？联想Z500屏幕变暗无法调节的解决办法详解

Win10系统优酷播放器出现绿屏的两种原因分析及解决方法图文教程

Hive与Oracle之间利用Sqoop进行数据的导入导出时遇到的问题及解决方法

hive调优

优酷视频客户端怎么设置始终跳过片头片尾？

优酷大酷卡与小酷卡哪个划算？优酷大酷卡与小酷卡套餐资费区别对比

优酷大酷卡与腾讯大王卡哪个好？大酷卡和腾讯大王卡套餐资费对比区别介绍

优酷盒子k1怎么用怎么安装应用(操作全程图解)

PHP实现使用优酷土豆视频地址获取swf播放器分享地址

cad2017经典模式的调法详解

优酷视频可下载吗 图文教你无需任何软件就可下载优酷土豆视频

联想Z500屏幕亮度怎么调？联想Z500屏幕变暗无法调节的解决办法详解

Win10系统优酷播放器出现绿屏的两种原因分析及解决方法图文教程

Hive与Oracle之间利用Sqoop进行数据的导入导出时遇到的问题及解决方法

优酷视频可下载吗图文教你无需任何软件就可下载优酷土豆视频