Python中文网

scikit-learn机器学习(第2版)

cnpython1152

推荐编程书籍:scikit-learn机器学习(第2版),由人民邮电出版社2019-02-01月出版发行,本书编译以及作者信息 为:[美] 加文·海克(Gavin Hackeling) 著,张浩然 译,此次为第2次发行, 国际标准书号为:9787115503404,品牌为异步图书, 这本书采用平装开本为16开,纸张采为胶版纸,全书共有199页字数万字,是本Python 编程相关非常不错的书。

此书内容摘要

近年来,Python语言成为了广受欢迎的编程语言,而它在机器学习领域也有很好的表现。scikit-learn是一个用Python语言编写的机器学习算法库,它可以实现一系列常用的机器学习算法,是一个好工具。
本书通过14章内容,详细地介绍了一系列机器学习模型和scikit-learn的使用技巧。本书从机器学习的基础理论讲起,涵盖了简单线性回归、K-近邻算法、特征提取、多元线性回归、逻辑回归、朴素贝叶斯、非线性分类、决策树回归、随机森林、感知机、支持向量机、人工神经网络、K-均值算法、主成分分析等重要话题。
本书适合机器学习领域的工程师学习,也适合想要了解scikit-learn的数据科学家阅读。通过阅读本书,读者将有效提升自己在机器学习模型的构建和评估方面的能力,并能够高效地解决机器学习难题。

关于此书作者

Gavin Hackeling 是一名数据科学家和作家。他研究过各种各样的机器学习问题,包括自动语音识别、文档分类、目标识别、以及语义切分。Gavin Hackeling 毕业于北卡罗来纳大学和纽约大学,目前和他的妻子和猫生活在布鲁克林。

编辑们的推荐

机器学习是一个非常热门的技术,本书内容涵盖多种机器学习模型,包括流行的机器学习算法,例如K近邻算法、逻辑回归、朴素贝叶斯、K 均值算法、决策树以及人工神经网络。与此同时,还讨论了数据预处理、超参数优化和集成方法等主题。
阅读完本书之后,读者将学会构建用于文档分类、图像识别、广告检测等任务的系统,还将学到如何使用scikit-learn类库的API从类别变量、文本和图像中提取特征,如何评估模型的性能,并对如何提升模型的性能建立直觉。除此之外,还将掌握在实践中运用scikit-learn构建高效模型所需的技能,并能够通过实用的策略完成高级任务。

scikit-learn机器学习(第2版)图书的目录

第 1章机器学习基础1
1.1定义机器学习1
1.2从经验中学习2
1.3机器学习任务3
1.4训练数据、测试数据和验证数据4
1.5偏差和方差6
1.6scikit-learn简介8
1.7安装scikit-learn8
1.7.1使用pip安装9
1.7.2在Windows系统下安装9
1.7.3在Ubuntu 16.04系统下安装10
1.7.4在Mac OS系统下安装10
1.7.5安装Anaconda10
1.7.6验证安装10
1.8安装pandas、Pillow、NLTK和matplotlib11
1.9小结11
第 2章简单线性回归12
2.1简单线性回归12
2.1.1用代价函数评价模型的拟合性15
2.1.2求解简单线性回归的OLS17
2.2评价模型19
2.3小结21
第3章用K-近邻算法分类和回归22
3.1K-近邻模型22
3.2惰性学习和非参数模型23
3.3KNN模型分类23
3.4KNN模型回归31
3.5小结36
第4章特征提取37
4.1从类别变量中提取特征37
4.2特征标准化38
4.3从文本中提取特征39
4.3.1词袋模型39
4.3.2停用词过滤42
4.3.3词干提取和词形还原43
4.3.4tf-idf权重扩展词包45
4.3.5空间有效特征向量化与哈希技巧48
4.3.6词向量49
4.4从图像中提取特征52
4.4.1从像素强度中提取特征53
4.4.2使用卷积神经网络激活项作为特征54
4.5小结56
第5章从简单线性回归到多元线性回归58
5.1多元线性回归58
5.2多项式回归62
5.3正则化66
5.4应用线性回归67
5.4.1探索数据67
5.4.2拟合和评估模型69
5.5梯度下降法72
5.6小结76
第6章从线性回归到逻辑回归77
6.1使用逻辑回归进行二元分类77
6.2垃圾邮件过滤79
6.2.1二元分类性能指标81
6.2.2准确率82
6.2.3精准率和召回率83
6.2.4计算F1值84
6.2.5ROC AUC84
6.3使用网格搜索微调模型86
6.4多类别分类88
6.5多标签分类和问题转换93
6.6小结97
第7章朴素贝叶斯98
7.1贝叶斯定理98
7.2生成模型和判别模型100
7.3朴素贝叶斯100
7.4在scikit-learn中使用朴素贝叶斯102
7.5小结106
第8章非线性分类和决策树回归107
8.1决策树107
8.2训练决策树108
8.2.1选择问题109
8.2.2基尼不纯度116
8.3使用scikit-learn类库创建决策树117
8.4小结120
第9章集成方法:从决策树到随机森林121
9.1套袋法121
9.2推进法124
9.3堆叠法126
9.4小结128
第 10章感知机129
10.1感知机129
10.1.1激活函数130
10.1.2感知机学习算法131
10.1.3使用感知机进行二元分类132
10.1.4使用感知机进行文档分类138
10.2感知机的局限性139
10.3小结140
第 11章从感知机到支持向量机141
11.1核与核技巧141
11.2最大间隔分类和支持向量145
11.3用scikit-learn分类字符147
11.3.1手写数字分类147
11.3.2自然图片字符分类150
11.4小结152
第 12章从感知机到人工神经网络153
12.1非线性决策边界154
12.2前馈人工神经网络和反馈人工神经网络155
12.3多层感知机155
12.4训练多层感知机157
12.4.1反向传播158
12.4.2训练一个多层感知机逼近XOR函数162
12.4.3训练一个多层感知机分类手写数字164
12.5小结165
第 13章K-均值算法166
13.1聚类166
13.2K-均值算法168
13.2.1局部最优值172
13.2.2用肘部法选择K值173
13.3评估聚类176
13.4图像量化178
13.5通过聚类学习特征180
13.6小结184
第 14章使用主成分分析降维185
14.1主成分分析185
14.1.1方差、协方差和协方差矩阵188
14.1.2特征向量和特征值190
14.1.3进行主成分分析192
14.2使用PCA对高维数据可视化194
14.3使用PCA进行面部识别196
14.4小结199

部分内容试读

暂无.

关于此书评价

暂无.

书摘内容

暂无.

scikit-learn机器学习(第2版)最新最全的试读、书评、目录、简介信息由Python中文网整理提供。