机器学习系统设计：Python语言实现

cnpython2024-05-20 05:14:41 621

编程书籍推荐：机器学习系统设计：Python语言实现，由机械工业出版社2017-06-01月出版，本书发行作者信息： [美] 戴维·朱利安（David Julian）著，李洋译此次为第1次发行，国际标准书号为：9787111569459，品牌为机工出版, 这本书采用平装开本为16开，附件信息：未知，纸张采为胶版纸，全书共有190页字数万字，值得推荐的Python Book。

此书内容摘要

机器学习模型不能给出准确结果的原因有很多。从设计的角度来审视这些系统，我们能够深入理解其底层算法和可用的优化方法。本书为我们提供了机器学习设计过程的坚实基础，能够使我们为特定问题建立起定制的机器学习模型。我们可能已经了解或使用过一些为解决常见问题的商用机器学习模型，例如垃圾邮件检测或电影分级，但是要着手于解决更为复杂的问题，则其重点是让这些模型适用于我们自己特定的需求。

关于此书作者

暂无.

编辑们的推荐

暂无.

机器学习系统设计：Python语言实现图书的目录

译者序
前言
第1章机器学习的思维1
1.1人机界面1
1.2设计原理4
1.2.1问题的类型6
1.2.2问题是否正确7
1.2.3任务8
1.2.4统一建模语言27
1.3总结31
第2章工具和技术32
2.1Python与机器学习33
2.2IPython控制台33
2.3安装SciPy栈34
2.4NumPy35
2.4.1构造和变换数组38
2.4.2数学运算39
2.5Matplotlib41
2.6Pandas45
2.7SciPy47
2.8Scikit-learn50
2.9总结57
第3章将数据变为信息58
3.1什么是数据58
3.2大数据59
3.2.1大数据的挑战60
3.2.2数据模型62
3.2.3数据分布63
3.2.4来自数据库的数据67
3.2.5来自互联网的数据68
3.2.6来自自然语言的数据70
3.2.7来自图像的数据72
3.2.8来自应用编程接口的数据72
3.3信号74
3.4数据清洗76
3.5数据可视化78
3.6总结80
第4章模型—从信息中学习81
4.1逻辑模型81
4.1.1一般性排序83
4.1.2解释空间84
4.1.3覆盖空间86
4.1.4PAC学习和计算复杂性87
4.2树状模型88
4.3规则模型92
4.3.1有序列表方法94
4.3.2基于集合的规则模型95
4.4总结98
第5章线性模型100
5.1最小二乘法101
5.1.1梯度下降102
5.1.2正规方程法107
5.2logistic回归109
5.3多分类113
5.4正则化115
5.5总结117
第6章神经网络119
6.1神经网络入门119
6.2logistic单元121
6.3代价函数126
6.4神经网络的实现128
6.5梯度检验133
6.6其他神经网络架构134
6.7总结135
第7章特征—算法眼中的世界136
7.1特征的类型137
7.1.1定量特征137
7.1.2有序特征138
7.1.3分类特征138
7.2运算和统计139
7.3结构化特征141
7.4特征变换141
7.4.1离散化143
7.4.2归一化144
7.4.3校准145
7.5主成分分析149
7.6总结151
第8章集成学习152
8.1集成学习的类型152
8.2Bagging方法153
8.2.1随机森林154
8.2.2极端随机树155
8.3Boosting方法159
8.3.1AdaBoost161
8.3.2梯度Boosting163
8.4集成学习的策略165
8.5总结168
第9章设计策略和案例研究169
9.1评价模型的表现169
9.2模型的选择174
9.3学习曲线176
9.4现实世界中的案例研究178
9.4.1建立一个推荐系统178
9.4.2温室虫害探测185
9.5机器学习一瞥188
9.6总结190

部分内容试读

机器学习是计算世界所见的最大趋势之一。机器学习系统具有意义深远且令人兴奋的能力，能够在各种应用领域为人们提供重要的洞察力，从具有开创性的挽救生命的医学研究到宇宙基础物理方面的发现，从为我们提供更健康、更清洁的食物到互联网分析和建立经济模型，等等。事实上，就某种意义而言，这项技术在我们的生活中已经无所不在。要想进入机器学习的领域，并且对其具有充分的认知，就必须能够理解和设计服务于某一项目需要的机器学习系统。

本书的主要内容

第1章从机器学习的基础知识开始，帮助你用机器学习的范式进行思考。你将学到机器学习的设计原理和相关模型。

第2章讲解了Python中众多针对机器学习任务的程序包。本章会让你初步了解一些大型库，包括NumPy、SciPy、Matplotlib和Scilit-learn等。

第3章讲解了原始数据可能有多种不同格式，其数量和质量也可能各不相同。有时，我们会被数据淹没；而有时，我们希望从数据中榨取最后一滴信息。数据要成为信息，需要有意义的结构。本章我们介绍了一些宽泛的主题，如大数据、数据属性、数据源、数据处理和分析等。

第4章在逻辑模型中探索了逻辑语言，并创建了假设空间映射；在树状模型中，我们发现其具有广泛作用域并易于描述和理解；在规则模型中，我们讨论了基于有序规则列表和无序规则集的模型。

第5章介绍了线性模型，它是使用最广泛的模型之一。线性模型是众多高级非线性技术的基础，例如，支持向量机（SVM）和神经网络。本章还研究了机器学习最常用的技术，创建线性回归和logistic回归的假设语句。

第6章介绍了机器学习最强大的人工神经网络算法。我们将看到这些网络如何成为大脑神经元的简化模型。

第7章讨论了特征的不同类型，即定量特征、有序特征和分类特征。我们还将详细学习如何结构化和变换特征。

第8章解释了集成机器学习背后的动机和成因，其来源于清晰的直觉并具有丰富的理论历史基础。集成机器学习的类型在于模型本身，以及围绕着三个主要问题（如何划分数据、如何选择模型、如何组合其结果）的考量。

第9章着眼于一些设计策略，以确保你的机器学习系统最优。我们将学习模型选择和参数调优技术，并将所学知识应用于一些案例研究之中。

阅读前的准备工作

你需要有学习机器学习的意愿，并需要下载安装Python3。Python3的下载地址是：https://www.python.org/downloads/。

本书的读者对象

本书的读者包括数据学家、科学家，或任何好奇的人。你需要具备一些线性代数和Python编程的基础，对机器学习的概念有基本了解。

关于此书评价

暂无.

书摘内容

《机器学习系统设计：Python语言实现》：
机器学习模型对不同数据类型的处理方法也大不相同。例如，决策树在分类特征上的分裂，所产生子节点的数量与特征值的数量一样多。而对于有序特征和定量特征，决策树是二分裂，每一父节点根据阈值指挥产生两个子节点。因此，树状模型会将定量特征视为有序特征，而忽略其尺度。对于诸如贝叶斯分类器（Bayes classifier）等概率模型，我们可以看到，这些模型实际上会将有序特征作为分类特征来处理，而其能够处理定量特征的唯独方式就是，将定量特征变换为有限数量的离散值，也就是将其转换为分类数据。
一般而言，几何模型要求特征是定量的。例如，线性模型采用欧氏实例空间，视特征为笛卡儿坐标，特征值之间被认为具有标量关系。使用诸如K近邻等基于距离的模型来处理分类特征时，对相等的值，可设距离为0；对不等的值，可设距离为1。同理，使用基于距离的模型来处理有序特征时，可以将两个值之间的值的个数设为其距离，这时，如果我们将特征值编码为整数，则距离就是数值的差。通过选取合理的距离度量标准，用基于距离的模型来处理有序特征和分类特征是可行的。
……

机器学习系统设计：Python语言实现最新最全的试读、书评、目录、简介信息由Python中文网整理提供。

本文地址：https://www.cnpython.com/book/620

新手QQ群：979659372，欢迎加入。