您的位置：鳄鱼CMS > sparksql启动命令 Spark SQL开始

sparksql启动命令 Spark SQL开始

2023-05-21 02:31 Spark编程指南

sparksql启动命令

Spark SQL开始

Spark中所有相关功能的入口点是SQLContext类或者它的子类，创建一个SQLContext的所有需要仅仅是一个SparkContext。

val sc: SparkContext // An existing SparkContext.
val sqlContext = new org.apache.spark.sql.SQLContext(sc)

// createSchemaRDD is used to implicitly convert an RDD to a SchemaRDD.
import sqlContext.createSchemaRDD

除了一个基本的SQLContext，你也能够创建一个HiveContext，它支持基本SQLContext所支持功能的一个超集。它的额外的功能包括用更完整的HiveQL分析器写查询去访问HiveUDFs的能力、从Hive表读取数据的能力。用HiveContext你不需要一个已经存在的Hive开启，SQLContext可用的数据源对HiveContext也可用。HiveContext分开打包是为了避免在Spark构建时包含了所有的Hive依赖。如果对你的应用程序来说，这些依赖不存在问题，Spark 1.2推荐使用HiveContext。以后的稳定版本将专注于为SQLContext提供与HiveContext等价的功能。

用来解析查询语句的特定SQL变种语言可以通过spark.sql.dialect选项来选择。这个参数可以通过两种方式改变，一种方式是通过setConf方法设定，另一种方式是在SQL命令中通过SET key=value来设定。对于SQLContext，唯一可用的方言是“sql”，它是Spark SQL提供的一个简单的SQL解析器。在HiveContext中，虽然也支持"sql"，但默认的方言是“hiveql”。这是因为HiveQL解析器更完整。在很多用例中推荐使用“hiveql”。

阅读全文

以上是鳄鱼CMS为你收集整理的sparksql启动命令 Spark SQL开始全部内容。

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系本站删除。

spark 算法 Spark GraphX算法

2023-05-12 Spark编程指南

Spark GraphX图算法GraphX包括一组图算法来简化分析任务。这些算法包含在org.apache.spark.graphx.lib包中，可以被直接访问。Pag...
spark streaming调优 Spark Streaming性能调优

2023-04-14 Spark编程指南

Spark Streaming性能调优集群中的Spark Streaming应用程序获得最好的性能需要一些调整。这章将介绍几个参数和配置，提高Spark St...
storm拓扑 Storm 拓扑

2023-04-20 Storm入门教程

拓扑在这一章，你将学到如何在同一个 Storm 拓扑结构内的不同组件之间传递元组，以及如何向一个运行中的 Storm 集群发布一个拓扑...
eugmp附录 Storm 附录 C

2023-04-27 Storm入门教程

附录 C安装实际的例子译者注：有些软件的最新版本已有变化，译文不会完全按照原文翻译，而是列出当前最新版本的软件。首先，从下...
neo4j环境配置 Neo4j - 环境设置

2023-06-03 neo4j教程

我们可以获得Neo4j服务器软件在两种格式 - 安装程序或EXE文件格式 Zip格式文件我们将讨论在Windows平台上的格式安装过程。在本章...