手册简介
Spark SQL是应用于Spark的一个组件,至于它的具体用途,会在本教程当中为诸位进行讲解。
手册说明
Apache Spark是一种快速计算的快速集群计算。 它建立在Hadoop MapReduce之上,它扩展了MapReduce模型,以有效地使用更多类型的计算,包括交互式查询和流处理。 这是一个简短的教程,解释Spark SQL编程的基础。
适用人群
本教程是为期望使用Spark Framework学习大数据分析基础知识并成为Spark开发人员的专业人士准备的。 此外,它对于Google Analytics专业人员和ETL开发人员也很有用。
学习前提
在开始执行本教程之前,我们假设您先前已经学习了Scala编程,数据库概念和任意Linux操作系统风格。
相关手册
Scala教程:http://www.w3cschool.cn/Scala/
SQL教程:http://www.w3cschool.cn/sql/
Linux教程:http://www.w3cschool.cn/linux/
JAVA教程:http://www.w3cschool.cn/java/
拓展阅读
Spark SQL官方文档:http://spark.apache.org/docs/latest/sql-programming-guide.html
Spark SQL下载地址:http://spark.apache.org/downloads.html
Spark SQL实例介绍:http://spark.apache.org/examples.html
更新记录
-
Spark 安装 12-26 09:46
-
Spark SQL 数据源 12-20 17:32
-
Spark SQL - Parquet文件 12-20 17:17
-
Spark SQL - Hive表 12-20 16:55
-
Spark SQL - JSON数据集 12-20 16:37
-
Spark SQL 数据帧 12-20 15:49
-
Spark SQL 以编程方式指定模式 12-20 15:40
-
Spark SQL 使用反射推断模式 12-20 15:03
-
Spark SQL简介 12-20 13:50
-
Spark RDD 12-20 10:08