Hive中向量化查询的示例分析

这篇文章主要介绍了Hive中向量化查询的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

创新互联是一家专注于成都网站制作、做网站、外贸营销网站建设与策划设计,五龙口网站建设哪家好?创新互联做网站,专注于网站建设十多年,网设计领域的专业建站公司;建站业务涵盖:五龙口等地区。五龙口做网站价格咨询:18982081108

向量化

Hive中的向量化查询执行大大减少了典型查询操作(如扫描,过滤器,聚合和连接)的CPU使用率。

标准查询执行系统一次处理一行,在处理下一行之前,单行数据会被查询中的所有运算符进行处理,导致CPU使用效率非常低。在向量化查询执行中,数据行被批处理在一起(默认=> 1024行),表示为一组列向量。

要使用向量化查询执行,必须以ORC格式(CDH 5)存储数据,并设置以下变量。

SET hive.vectorized.execution.enabled=true

在CDH 6中默认启用Hive查询向量化,启用查询向量化后,还可以设置其他属性来调整查询向量化的方式

感谢你能够认真阅读完这篇文章,希望小编分享的“Hive中向量化查询的示例分析”这篇文章对大家有帮助,同时也希望大家多多支持创新互联,关注创新互联行业资讯频道,更多相关知识等着你来学习!


分享文章:Hive中向量化查询的示例分析
文章URL:http://ybzwz.com/article/pepceo.html