Apache Hive是Spark上的SQL引擎,也是大数据系统中重要的数据仓库工具。
举一反三
- Spark SQL支持访问Hive数据仓库,并在Spark引擎中进行统计分析。
- 下列关于Hive的说法中,错误的是()。 A: Hive是一个基于Hadoop的数据仓库框架 B: Hive本身是一个计算引擎 C: Hive并不能解决所有的大数据问题 D: Hive利用MapReduce、Spark、Tez等引擎执行数据查询操作
- Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中。
- Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中() A: 正确 B: 错误
- Spark SQL复用了Hive提供的元数据仓库(Metastore)、HiveQL、【】以及序列化和反序列工具(SerDes)。