ISBN/价格: | 978-7-302-61363-3:CNY59.00 |
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Hadoop与Spark入门/.覃雄派, 陈跃国编著 |
出版发行项: | 北京:,清华大学出版社:,2022 |
载体形态项: | xiv, 233页:;+图:;+26cm |
丛编项: | 面向新工科专业建设计算机系列教材.数据科学与大数据技术 |
一般附注: | 国家级一流本科专业配套教材 |
提要文摘: | 本书包含13章:第1、2章介绍如何为深入学习Hadoop和Spark做环境准备,包括VMware虚拟机的创建和CentOS操作系统安装。第3-6章介绍Hadoop大数据平台的基本原理,包括HDFS、MapReduce计算模型、HBase数据库,以及Hive数据仓库的原理、部署方法和开发技术。第7-11章介绍Spark大数据平台的基本原理,包括弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、有向无环图表达的作业及其处理过程等,并且介绍了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和开发技术。最后两章介绍了Flume(第12章)和Kafka(第13章)两个工具。 |
题名主题: | 数据处理软件 高等学校 教材 |
索书号: | TP274-43/Q22 |
中图分类: | TP274-43 |
个人名称等同: | 覃雄派 编著 |
---|
个人名称等同: | 陈跃国 编著 |
记录来源: | CN 浙江省新华书店集团公司 20221228 |