暂无商品咨询信息 [发表商品咨询]
本书内容基于Spark新版本展开,符合企业目前开发需要。本书面讲解Spark SQL相关知识和实战应用,各章均提供较为丰富的案例及其详细的操作步骤,并配套示例源码、数据集、PPT课件和教学大纲。
本书共10章。第1~3章为Spark SQL的基础准备部分,内容包括Spark SQL的发展和简介、Spark的典型数据容器及关系、Spark概述与环境搭建、Spark典型数据结构RDD;第4~7章为Spark SQL的基础应用部分,内容包括Spark SQL入门实战(包括Scala编程基础)、SQL基础语法、操作多数据源、Spark SQL性能调优等;第8~10章分别通过影评数据分析、商品统计数据分析、咖啡销售数据分析等3个实战项目进行巩固提升。
本书内容翔实、示例丰富,既可作为Spark初学者、大数据分析人员、大数据应用开发人员的自学手册,也可作为高等院校或高职高专院校计算机、软件工程、数据科学与大数据技术、智能科学与技术、人工智能等专业大数据课程的教材。
迟殿委,计算机软件与理论专业硕士,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE、大数据技术培训经验,熟练掌握JavaEE与大数据全栈技术框架,擅长JavaEE系统架构设计、大数据分析与挖掘。著有图书《Hive入门与大数据分析实战》《Hadoop大数据分析技术》《Hadoop+Spark大数据分析实战》《Spring Boot企业级开发实战(视频教学版)》《深入浅出Java编程》《Spring Boot+Spring Cloud微服务开发》。
第1章 Spark SQL概述
1.1 Spark SQL简介
1.1.1 什么是Spark SQL
1.1.2 Spark SQL的特点
1.2 Spark数据容器
1.2.1 什么是DataFrame
1.2.2 什么是DataSet
1.2.3 Spark SQL与DataFrame
1.2.4 DataFrame与RDD的差异
第2章 Spark概述及环境搭建
2.1 Spark概述
2.1.1 关于Spark
2.1.2 Spark的基本概念
2.1.3 Spark集群相关知识
2.2 Linux环境搭建
2.2.1 VirtualBox虚拟机的安装
2.2.2 安装Linux操作系统
……
基本信息 | |
---|---|
出版社 | 清华大学出版社 |
ISBN | 9787302674863 |
条码 | 9787302674863 |
编者 | 迟殿委,王泽慧,黄茵茵 著 |
译者 | -- |
出版年月 | 2024-11-01 00:00:00.0 |
开本 | 16开 |
装帧 | 平装 |
页数 | 228 |
字数 | 385000 |
版次 | 1 |
印次 | 1 |
纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]