Spark大数据分析实战在线阅读
会员

Spark大数据分析实战

张伟洋
开会员,本书免费读 >

计算机网络数据库10.5万字

更新时间:2021-03-26 22:19:13 最新章节:9.5 案例分析:使用GraphX计算社交网络中粉丝的平均年龄

立即阅读
加书架
下载
听书

书籍简介

本书作为Spark的入门书,从Spark核心编程语言Scala讲起,涵盖当前Spark主流的开发组件。以实操为主,深入讲解每一个操作步骤,包括SparkRDD离线数据处理、SparkSQL快速结构化数据处理、SparkStreaming实时数据处理,同时包括案例讲解、源码剖析、常用Shell命令和JavaAPI详解。即使没有任何Spark基础的读者也可以对照书中的步骤成功搭建属于自己的Spark集群,是一本真正的实操指南书籍。本书可作为大数据开发人员的随身手册,也可作为Spark新手入门的指导书籍,以及大数据从业者的参考用书。
品牌:清华大学
上架时间:2020-06-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

张伟洋
主页

同类热门书

最新上架

  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,
    赵明渊 唐明伟主编计算机12万字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 会员
    MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8
    张文亮编著计算机9.7万字

同类书籍最近更新

  • 会员
    本书以一个开发案例贯穿全书,从软件工程的角度出发,按照项目开发的阶段流程组织数据库设计原理和应用系统实现的相关内容,引导读者在数据库应用系统开发的每个阶段都实现从理论到实践的探索。在我国软件国产化的大背景下,本书采用国产的华为openGauss作为数据库技术实验环境,以帮助读者更好地了解国产数据库产品的使用方法。
    林育蓓 汤德佑 汤娜编著数据库19.2万字
  • 会员
    本书涉及云数据中心网络很多块的内容,主要包括传统技术、商用SDN方案、开源SDN方案以及相关的学术论文,覆盖了目前绝大部分的主流技术以及一些其他较为新颖的技术,是目前市面上少数能够切入SDN某一个具体行业应用场景,并对相关技术和产品进行系统性介绍的书籍之一。
    张晨数据库33.6万字
  • 会员
    数据中心UPS系统运维在介绍UPS基本知识的基础上,着重介绍了当前数据中心主要使用的双变换在线式UPS的电路组成和工作原理,重点讨论了蓄电池配置的计算方法和UPS针对不同负载的选型计算方法,尤其对数据中心UPS配电系统供电方案、UPS的操作方法以及UPS主机和蓄电池组的巡检及维护方法进行了重点介绍。数据中心UPS系统运维力求理论和实践相结合,书中所列UPS供电方案及运维保养方法普遍适用于当前主流的
    陶亚雄等主编数据库17.2万字
  • 会员
    本书系统地讲解了TableauPrepBuilder和TableauDesktop的原理与实践应用。全书以可视化分析、Tableau计算为重点,详细介绍了如何理解数据的层次、如何使用TableauPrepBuilder整理和准备数据、如何使用TableauDesktop开展敏捷数据分析、Tableau高级互动,特别是深入介绍了Tableau的各种计算,从而以有限的数据实现无限的业务场景
    喜乐君数据库21.3万字
  • 会员
    在这本书里读者将会跟随作者一同对Oracle数据库的相关知识进行梳理,然后共同提炼出必须最先掌握的那部分知识,无论你是数据库开发、管理、优化、设计人员,还是从事Java、C的开发人员。接下来作者再将这部分知识中最实用的内容进一步提炼,浓缩出精华的部分,分享给大家。这是二八现象的一次经典应用。这部分知识就是Oracle的物理体系结构、逻辑体系结构、表、索引以及表连接五大部分。通过阅读这些章节,
    梁敬彬 梁敬弘数据库17.8万字
  • 会员
    R是一种适用于统计分析计算和图像处理的语言,受S语言和Scheme语言影响发展而来。早期R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不做任何修改地在R环境下运行。R的语法来自Scheme,作为一款诞生于20世纪90年代的语言,R已经成为S统计编程语言的一类实现方式。本书从实际应用出发,结合实例及应用场景,深入浅出地介绍了R语言应用的相关知识:R语言的
    张良均等数据库9.2万字