
会员
Python数据挖掘:入门、进阶与实用案例分析
更新时间:2023-11-13 15:05:37 最新章节:封底
书籍简介
这是一本以项目实战案例为驱动的数据挖掘著作,它能帮助完全没有Python编程基础和数据挖掘基础的读者快速掌握Python数据挖掘的技术、流程与方法。在写作方式上,本书与传统的“理论与实践结合”的入门书不同,它以数据挖掘领域的知名赛事“泰迪杯”数据挖掘挑战赛(已举办10届)和“泰迪杯”数据分析技能赛(已举办5届)(累计1500余所高校的10余万师生参赛)为依托,精选了11个经典赛题,将Python编程知识、数据挖掘知识和行业知识三者融合,让读者在实践中快速掌握电商、教育、交通、传媒、电力、旅游、制造等7大行业的数据挖掘方法。本书不仅适用于零基础的读者自学,还适用于教师教学。
品牌:机械工业出版社
上架时间:2023-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
卢滔 张良均等
最新上架
- 会员高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证计算机11.7万字
- 会员《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。计算机16.8万字
- 会员这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字
- 会员《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字
- 会员本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。计算机29.9万字
- 会员本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需计算机12万字
- 会员本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现计算机7.1万字
- 会员《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢计算机14万字
同类书籍最近更新
- 会员《工业大数据分析算法实践》以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制,使具有工科背景读者建立起数据思维,灵活利用数据分析算法进行实际问题的建模,并实现分析项目高效迭代与落地。具体主题覆盖了工业大数据分析工程思维和软件栈,工业数据的数据探索,预处理方法和常用机器学习算法,故障诊断、质量优化、流程优化的分析算法,专家规则驱动方法,以及工业数据分析工程等内容。《工业大数据分析算数据库21.7万字
- 会员本书立足于计算机视觉特征检测这一基础技术问题,介绍了特征点、线和区域的检测方法,并给出具体的检测应用实例,旨在为相关技术人员提供特征检测及应用方面的新研究进展,促进特征检测技术在社会经济生活领域的应用和发展。本书内容分为两部分:特征检测方法和特征检测技术应用。在特征检测方法方面,第2章介绍特征点检测方法,第3~5章介绍特征线检测方法,第6章介绍斑状区域检测方法,第7~9章介绍规则形状(如多边形、三数据库10.6万字
- 会员这是一本能为数字化转型企业的数据治理提供指导的著作,由用友集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评。它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可作为数据治理的纲领性指南,又可作为数据治理的实操手册。从数据治理的战略数据库29.5万字
- 会员普及医疗大数据挖掘与可视化技术,对提升医疗行业数据的质量与处理效率、实现数据价值的优化、推动精准医疗深入应用有着重要的作用。本书内容立足于医疗大数据的挖掘与可视化,分为总体篇、数据挖掘篇、可视化篇、应用篇等5部分,共10章,包含医疗大数据及其平台的发展概况,医疗大数据的采集、清洗、融合,医疗大数据挖掘概述、工具与方法,医疗大数据可视化概述、工具与方法,以及用实例展示医疗大数据分析平台的设计与使用方数据库11.7万字
- 会员本书基于VisualFoxPro9.0,根据教育部高等学校文科计算机基础教学指导委员会发布的《大学计算机教学基本要求》和计算机等级考试二级(VisualFoxPro)的要求编写而成,包括13章的内容:数据库基本原理,VisualFoxPro9.0概述,VisualFoxPro操作基础,程序设计基础,数据库及表的操作,索引及记录的操作,查询与视图的操作,结构化查询语言(SQL),表单设计,常数据库13.9万字
- 会员本书提供了通过GitOps使用Kubernetes的实用教程,内容涵盖GitOps的实践、技术和工具,它们可以简化Kubernetes来更快地交付企业级软件,而不影响安全性。通过阅读本书,你将了解GitOps在灵活的配置管理、监控、健壮性、多环境支持和安全性等方面的好处,并掌握以独特的GitOps方式进行管理的技巧。学完本书,你将能够实现和管理一个可伸缩的持续交付管道,这使得跟踪更改、回滚错误以及数据库12.7万字