set hive.exec.mode.local.auto=true - 梦幻之都 - ITeye博客

`

zhaomengsen

浏览: 196924 次
性别:
来自: 河北

最近访客更多访客>>

adamkisy

zllhit

sdyjmc

wd1282988143

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

6420285：你的文章很棒，很多地方讲的通俗易懂，非常感谢。 ...
深入掌握JMS（一）：JSM基础
xs.cctv：不错
zeroDateTimeBehavior=convertToNull
hanyannan0123：搞不清楚，此话属于经典呢，还是废话。
超类好
czy584521： ```我肯定他用了谷歌金山词霸
IBM的面试官被我忽悠蒙了
yuantong：老板跳槽？什么概念
我们老板跳槽了！！！

set hive.exec.mode.local.auto=true

博客分类：

hadoop 源代码

阅读更多

0.7版本后Hive开始支持任务执行选择本地模式(local mode)。大多数的Hadoop job是需要hadoop提供的完整的可扩展性来处理大数据的。不过，有时hive的输入数据量是非常小的。在这种情况下，为查询出发执行任务的时间消耗可能会比实际job的执行时间要多的多。对于大多数这种情况，hive可以通过本地模式在单台机器上处理所有的任务。对于小数据集，执行时间会明显被缩短。

如此一来，对数据量比较小的操作，就可以在本地执行，这样要比提交任务到集群执行效率要快很多。

配置如下参数，可以开启Hive的本地模式：
hive> set hive.exec.mode.local.auto=true;(默认为false)

当一个job满足如下条件才能真正使用本地模式：
1.job的输入数据大小必须小于参数：hive.exec.mode.local.auto.inputbytes.max(默认128MB)
2.job的map数必须小于参数：hive.exec.mode.local.auto.tasks.max(默认4)
3.job的reduce数必须为0或者1

可以设置这三个参数
hive> set hive.exec.mode.local.auto=true;
hive> set hive.exec.mode.local.auto.inputbytes.max=50000000;
hive> set hive.exec.mode.local.auto.tasks.max=10;

参看
http://blog.csdn.net/wisgood/article/details/17383247

分享到：

hive的hive.exec.parallel参数说明 | centos yum 安装mysql

2014-05-08 18:38
浏览 1511
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hive错误之 Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误分析_xiaohu21的博客-CSDN博客.mht: Hive错误之 Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误分析_xiaohu21的博客-CSDN博客.mht

【hive on spark Error】return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask.: ERROR : FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. 前言报错信息异常分析配置改动后记前言在成功消除Cloudare管理界面上那些可恶的警告之后，我又对yarn...

hive-exec-2.1.1.jar: hive2.1.1 show create table 表名，hive中文乱码，替换hive-exec-2.1.1.jar

hive-exec-*.jar包: Missing Hive Execution Jar: /hive/hive1.2.1/lib/hive-exec-*.jar

hive-exec-1.2.1.spark2.jar: hive-exec-1.2.1.spark2.jar spark2-shell 支持 hive2 hadoop3

hive-exec-3.1.2.jar: guava-27.0-jre.jar 编译的hive-exec-3.1.2.jar

Hive优化（提高hive运行速度）: 文章目录一、Hive使用本地模式执行操作（Hive使用资源大于20M的时候还是会采用集群yarn的方式运行）具体设置方法1、设置临时的2、修改hive配置文件（hive-site.xml），永久有效... set hive.exec.mode.local.auto=true;

hive-exec-3.1.2 排除guava: hive-exec-3.1.2 排除guava

《Hadoop系统搭建及项目实践》课件08分布式数据仓库技术 Hive.pdf: 《Hadoop系统搭建及项目实践》课件08分布式数据仓库技术 Hive.pdf《Hadoop系统搭建及项目实践》课件08分布式数据仓库技术 Hive.pdf《Hadoop系统搭建及项目实践》课件08分布式数据仓库技术 Hive.pdf《Hadoop系统搭建...

seatunnel 支持hive jdbc: driver = "org.apache.hive.jdbc.HiveDriver" user = "hive" password = "hive" table = ods_wjw_jb_gxy_hz_glk query = "select a,b,c from ods_wjw_jb_gxy_hz_glk" fetch_size = 300 } }

大数据技术学习笔记之Hive.docx: 大数据技术学习笔记之Hive.docx

spark-1.6.3-bin-hadoop2.4-without-hive.tgz: spark-1.6.3-bin-hadoop2.4-without-hive.tgz 经测试，hadoop 2.8.2下可用。hive2.1.1 可用

mysql-to-hive.ktr: 从数据库(mysql)中读取数据写入HDFS并建hive表；在该转换中，需要配置2个DB链接（Mysql和HiveServer2），配置Hadoop集群（HDFS），配置子服务器（远程执行服务器）。需要实践的元数据文件：mysql-to-hive.ktr

hive-exec-2.1.1-cdh6.3.1.jar: hive-exec-2.1.1-cdh6.3.1.jar

hive 中join和Group的优化: set hive.map.aggr = true; //是否在 Map 端进行聚合，默认为 True ；该设置会消耗更多的内存。 set hive.groupby.mapaggr.checkinterval = 100000000; //在 Map 端进行聚合操作的条目数目 set hive.groupby....

Could not resolve dependencies for project org.apache.hive:hive-exec:jar:2.3.0:: hive 开发UDF 使用maven工程引发jar包缺失 hive 开发UDF 使用maven工程引发jar包缺失

hadoop,spark,hive.....: hadoop,spark,hive.....

hive-exec-2.1.0.jar: hive-exec-2.1.0.jar

Global site tag (gtag.js) - Google Analytics