Spark 大数据技术与应用

2025-9-23 112 9/23

Spark 大数据技术与应用

作者:王小洁,陈炯

页数:224

出版社:电子工业出版社

出版日期:2023

ISBN:9787121454486

高清校对版pdf(带目录)

前往页尾底部查看PDF电子书

内容简介

本书以大数据分析应用岗位职业能力递进为主线,较为全面地介绍了Spark大数据技术的相关知识。全书共7章,内容包括Spark生态圈中的Spark Core、Spark SQL、Spark Streaming、GraphX、MLlib等组件,以及海量离线数据的处理、基于历史数据的交互式查询、基于实时数据流的大数据处理、图计算、机器学习等知识点循序渐进地展开介绍。本书以Spark Core、Spark SQL、Spark Streaming相关知识为重点,GraphX、MLlib等组件作为扩展性知识来介绍,书结合岗位胜任能力配套多个企业级实战案例与课后习题,帮助学习者更好地理解和巩固所学知识,熟练应用相关技术,提升专业能力和综合能力,为学习者技术提升和职业发展打下良好基础。本书可以作为高等职业院校大数据技术、人工智能技术应用、软件技术等相关专业教材,也可以作为从事大数据处理与分析相关技术人员的参考用书。

作者简介

王小洁,女,副教授,山西职业技术学院,山西职业技术学院大数据技术专业是 “双高”建设专业群的龙头专业,与华为、新华三、中软 等知名企业开展校企合作,在人才培养模式创新、课程教学资源建设、教材与教法改革、教师教学创新团队等方面均进行改革创新。大数据技术专业每年招生200余人,具有一定 的专业规模。

目录

第1章 专业认知能力培养:走进Spark 1
新手上路1.1:认知Spark 2
1.1.1 Spark的发展历程 2
1.1.2 Spark的特点 3
1.1.3 Spark技术栈 4
1.1.4 Spark术语 5
1.1.5 Spark的应用场景 6
循序渐进1.2:了解Spark的运行架构与运行模式 7
1.2.1 Spark的运行架构 7
1.2.2 Spark的运行模式及运行流程 8
1.2.3 Spark核心概念RDD 12
渐入佳境1.3:掌握Spark在不同模式下的环境搭建 13
1.3.1 Spark本地单机模式环境搭建 13
1.3.2 Spark单机伪分布模式环境搭建 14
实战演练1.4 企业级项目环境搭建 18
Spark完全分布模式环境搭建 18
归纳总结 20
勤学苦练 20
第2章 专业规范能力培养:立足Scala 23
新手上路2.1:认知Scala 24
2.1.1 Scala简介 24
2.1.2 Scala特性 24
2.1.3 Scala环境配置及安装 24
2.1.4 Scala环境的运行 26
新手上路2.2:变量和数据类型 26
2.2.1 注释 26
2.2.2 常量和变量 27
2.2.3 标识符和关键字 27
2.2.4 数据类型 29
2.2.5 数据类型转换 32
2.2.6 Scala输出 34
新手上路2.3:运算符和流程控制 35
2.3.1 算术运算符 35
2.3.2 关系运算符 36
2.3.3 逻辑运算符 37
2.3.4 赋值运算符 37
2.3.5 位运算符 38
2.3.6 运算符优先级 38
2.3.7 流程控制 38
循序渐进2.4:函数式编程 43
2.4.1 函数的定义 43
2.4.2 函数基本语法 43
2.4.3 函数和方法的区别 45
2.4.4 函数至简原则 46
2.4.5 匿名函数 47
2.4.6 高阶函数 47
2.4.7 函数柯里化 48
循序渐进2.5:面向对象编程 49
2.5.1 包 49
2.5.2 类和对象 50
2.5.3 封装 51
2.5.4 继承 52
2.5.5 抽象类 53
2.5.6 伴生对象 53
2.5.7 特质 54
循序渐进2.6:数据集合与
PDF更新中
- THE END -

非特殊说明,本博所有文章均为博主原创。