Hive中向量化查询的示例分析-web开发-互联网-天达云

Hive中向量化查询的示例分析
更新：HHH 时间：2023-1-7

这篇文章主要介绍了Hive中向量化查询的示例分析，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

Hive中的向量化查询执行大大减少了典型查询操作（如扫描，过滤器，聚合和连接）的CPU使用率。

标准查询执行系统一次处理一行，在处理下一行之前，单行数据会被查询中的所有运算符进行处理，导致CPU使用效率非常低。在向量化查询执行中，数据行被批处理在一起（默认=> 1024行），表示为一组列向量。

要使用向量化查询执行，必须以ORC格式（CDH 5）存储数据，并设置以下变量。

SET hive.vectorized.execution.enabled=true

在CDH 6中默认启用Hive查询向量化，启用查询向量化后，还可以设置其他属性来调整查询向量化的方式

感谢你能够认真阅读完这篇文章，希望小编分享的“Hive中向量化查询的示例分析”这篇文章对大家有帮助，同时也希望大家多多支持天达云，关注天达云行业资讯频道，更多相关知识等着你来学习!