Python中文网

Python数据分析与应用

cnpython23

Python数据分析与应用,由人民邮电出版社在2018-04-01月出版发行,本书编译以及作者信息为: 黄红梅,张良均 著,这是第1次发行, 国际标准书号为:9787115373045,品牌为人民邮电出版社, 这本书采用平装开本为16开,纸张采为胶版纸,全书共有294页,字数万字,值得推荐。

此书内容摘要

本书以任务为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全书共9章,* 1章介绍了数据分析的基本概念等相关知识;* 2~6章介绍了Python数据分析的常用库及其应用,涵盖NumPy数值计算、Matplotlib数据可视化、pandas统计分析、使用pandas进行数据预处理、使用scikit-learn构建模型,较为全面地阐述了Python数据分析方法;第7~9章结合之前所学的数据分析技术,进行企业综合案例数据分析。除* 1章外,本书各章都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
本书可作为高校大数据技术类专业的教材,也可以作为大数据技术爱好者的自学用书。

关于此书作者


张良均,高 级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。


编辑们的推荐

本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,* 后落实在任务实现环节。
全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。
书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。

Python数据分析与应用图书的目录

第1章Python数据分析概述1

任务1.1认识数据分析1

1.1.1掌握数据分析的概念2

1.1.2掌握数据分析的流程2

1.1.3了解数据分析应用场景4

任务1.2熟悉Python数据分析的工具5

1.2.1了解数据分析常用工具6

1.2.2了解Python数据分析的优势7

1.2.3了解Python数据分析常用类库7

任务1.3安装Python的Anaconda发行版9

1.3.1了解Python的Anaconda发行版9

1.3.2在Windows系统中安装Anaconda9

1.3.3在Linux系统中安装Anaconda12

任务1.4掌握Jupyter Notebook常用功能14

1.4.1掌握Jupyter Notebook的基本功能14

1.4.2掌握Jupyter Notebook的高 级功能16

小结19

课后习题19

* 2章NumPy数值计算基础21

任务2.1掌握NumPy数组对象ndarray21

2.1.1创建数组对象21

2.1.2生成随机数27

2.1.3通过索引访问数组29

2.1.4变换数组的形态31

任务2.2掌握NumPy矩阵与通用函数34

2.2.1创建NumPy矩阵34

2.2.2掌握ufunc函数37

任务2.3利用NumPy进行统计分析41

2.3.1读/写文件41

2.3.2使用函数进行简单的统计分析44

2.3.3任务实现48

小结50

实训50

实训1创建数组并进行运算50

实训2创建一个国际象棋的棋盘50

课后习题51

第3章Matplotlib数据可视化基础52

任务3.1掌握绘图基础语法与常用参数52

3.1.1掌握pyplot基础语法53

3.1.2设置pyplot的动态rc参数56

任务3.2分析特征间的关系59

3.2.1绘制散点图59

3.2.2绘制折线图62

3.2.3任务实现65

任务3.3分析特征内部数据分布与分散状况68

3.3.1绘制直方图68

3.3.2绘制饼图70

3.3.3绘制箱线图71

3.3.4任务实现73

小结77

实训78

实训1分析1996~2015年人口数据特征间的关系78

实训2分析1996~2015年人口数据各个特征的分布与分散状况78

课后习题79

第4章pandas统计分析基础80

任务4.1读/写不同数据源的数据80

4.1.1读/写数据库数据80

4.1.2读/写文本文件83

4.1.3读/写Excel文件87

4.1.4任务实现88

任务4.2掌握DataFrame的常用操作89

4.2.1查看DataFrame的常用属性89

4.2.2查改增删DataFrame数据91

4.2.3描述分析DataFrame数据101

4.2.4任务实现104

任务4.3转换与处理时间序列数据107

4.3.1转换字符串时间为标准时间107

4.3.2提取时间序列数据信息109

4.3.3加减时间数据110

4.3.4任务实现111

任务4.4使用分组聚合进行组内计算113

4.4.1使用groupby方法拆分数据114

4.4.2使用agg方法聚合数据116

4.4.3使用apply方法聚合数据119

4.4.4使用transform方法聚合数据121

4.4.5任务实现121

任务4.5创建透视表与交叉表123

4.5.1使用pivot_table函数创建透视表123

4.5.2使用crosstab函数创建交叉表127

4.5.3任务实现128

小结130

实训130

实训1读取并查看P2P网络贷款数据主表的基本信息130

实训2提取用户信息更新表和登录信息表的时间信息130

实训3使用分组聚合方法进一步分析用户信息更新表和登录信息表131

实训4对用户信息更新表和登录信息表进行长宽表转换131

课后习题131

第5章使用pandas进行数据预处理133

任务5.1合并数据133

5.1.1堆叠合并数据133

5.1.2主键合并数据136

5.1.3重叠合并数据139

5.1.4任务实现140

任务5.2清洗数据141

5.2.1检测与处理重复值141

5.2.2检测与处理缺失值146

5.2.3检测与处理异常值149

5.2.4任务实现152

任务5.3标准化数据154

5.3.1离差标准化数据154

5.3.2标准差标准化数据155

5.3.3小数定标标准化数据156

5.3.4任务实现157

任务5.4转换数据158

5.4.1哑变量处理类别型数据158

5.4.2离散化连续型数据160

5.4.3任务实现162

小结163

实训164

实训1插补用户用电量数据缺失值164

实训2合并线损、用电量趋势与线路告警数据164

实训3标准化建模专家样本数据164

课后习题165

第6章使用scikit-learn构建模型167

任务6.1使用sklearn转换器处理数据167

6.1.1加载datasets模块中的数据集167

6.1.2将数据集划分为训练集和测试集170

6.1.3使用sklearn转换器进行数据预处理与降维172

6.1.4任务实现174

任务6.2构建并评价聚类模型176

6.2.1使用sklearn估计器构建聚类模型176

6.2.2评价聚类模型179

6.2.3任务实现182

任务6.3构建并评价分类模型183

6.3.1使用sklearn估计器构建分类模型183

6.3.2评价分类模型186

6.3.3任务实现188

任务6.4构建并评价回归模型190

6.4.1使用sklearn估计器构建线性回归模型190

6.4.2评价回归模型193

6.4.3任务实现194

小结196

实训196

实训1使用sklearn处理wine和wine_quality数据集196

实训2构建基于wine数据集的K-Means聚类模型196

实训3构建基于wine数据集的SVM分类模型197

实训4构建基于wine_quality数据集的回归模型197

课后习题198

第7章航空公司客户价值分析199

任务7.1了解航空公司现状与客户价值分析199

7.1.1了解航空公司现状200

7.1.2认识客户价值分析201

7.1.3熟悉航空客户价值分析的步骤与流程201

任务7.2预处理航空客户数据202

7.2.1处理数据缺失值与异常值202

7.2.2构建航空客户价值分析关键特征202

7.2.3标准化LRFMC模型的5个特征206

7.2.4任务实现207

任务7.3使用K-Means算法进行客户分群209

7.3.1了解K-Means聚类算法209

7.3.2分析聚类结果210

7.3.3模型应用213

7.3.4任务实现214

小结215

实训215

实训1处理信用卡数据异常值215

实训2构造信用卡客户风险评价关键特征217

实训3构建K-Means聚类模型218

课后习题218

第8章财政收入预测分析220

任务8.1了解财政收入预测的背景与方法220

8.1.1分析财政收入预测背景220

8.1.2了解财政收入预测的方法222

8.1.3熟悉财政收入预测的步骤与流程223

任务8.2分析财政收入数据特征的相关性223

8.2.1了解相关性分析223

8.2.2分析计算结果224

8.2.3任务实现225

任务8.3使用Lasso回归选取财政收入预测的关键特征225

8.3.1了解Lasso回归方法226

8.3.2分析Lasso回归结果227

8.3.3任务实现227

任务8.4使用灰色预测和SVR构建财政收入预测模型228

8.4.1了解灰色预测算法228

8.4.2了解SVR算法229

8.4.3分析预测结果232

8.4.4任务实现234

小结236

实训236

实训1求取企业所得税各特征间的相关系数236

实训2选取企业所得税预测关键特征237

实训3构建企业所得税预测模型237

课后习题237

第9章家用热水器用户行为分析与事件识别239

任务9.1了解家用热水器用户行为分析的背景与步骤239

9.1.1分析家用热水器行业现状240

9.1.2了解热水器采集数据基本情况240

9.1.3熟悉家用热水器用户行为分析的步骤与流程241

任务9.2预处理热水器用户用水数据242

9.2.1删除冗余特征242

9.2.2划分用水事件243

9.2.3确定单次用水事件时长阈值244

9.2.4任务实现246

任务9.3构建用水行为特征并筛选用水事件247

9.3.1构建用水时长与频率特征248

9.3.2构建用水量与波动特征249

9.3.3筛选候选洗浴事件250

9.3.4任务实现251

任务9.4构建行为事件分析的BP神经网络模型255

9.4.1了解BP神经网络算法原理255

9.4.2构建模型259

9.4.3评估模型260

9.4.4任务实现260

小结263

实训263

实训1清洗运营商客户数据263

实训2筛选客户运营商数据264

实训3构建神经网络预测模型265

课后习题265

附录A267

附录B270

参考文献295

部分内容试读

暂无.

关于此书评价

暂无.

书摘内容

暂无.

Python数据分析与应用最新最全的试读、书评、目录、简介信息由Python中文网整理提供。