大小:40.51M
更新时间:23-08-30
系统:Pc
机器学习与R语言是一本涵盖机器学习核心算法手册,由美国程序员布雷特·兰茨编著。本书内容丰富翔实,通过丰富的实际案例来探索如何应用r来进行现实世界问题的机器学习,如何从数据中获取可以付诸行动的洞察力。通过阅读本书,你将学到:用r准备用于机器学习的数据,用r进行数据探索和数据可视化,用k近领方法进行数据分类,用线性回归预测数值型数据等等,非常适合对机器学习和R语言感兴趣的用户下载阅读。
推荐序
译者序
前言
关于审稿人
第1章 机器学习简介1
1.1 机器学习的起源1
1.2 机器学习的使用与滥用3
1.2.1 机器学习的成功使用3
1.2.2 机器学习的限制4
1.2.3 机器学习的伦理方面5
1.3 机器如何学习6
1.3.1 数据存储7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 评估10
1.4 实践中的机器学习11
1.4.1 输入数据的类型11
1.4.2 机器学习算法的类型12
1.4.3 为输入数据匹配算法14
1.5 使用R进行机器学习15
1.5.1 安装R添加包15
1.5.2 载入和卸载R添加包16
1.6 总结16
第2章 数据的管理和理解18
2.1 R数据结构18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 数据框23
2.1.5 矩阵和数组25
2.2 用R管理数据27
2.2.1 保存、载入和移除R数据结构27
2.2.2 用CSV文件导入和保存数据28
2.3 探索和理解数据29
2.3.1 探索数据的结构29
2.3.2 探索数值变量30
2.3.3 探索分类变量38
2.3.4 探索变量之间的关系40
2.4 总结43
第3章 懒惰学习—使用近邻分类44
3.1 理解近邻分类44
3.1.1 kNN算法45
3.1.2 为什么kNN算法是懒惰的50
3.2 例子—用kNN算法诊断乳腺癌51
3.2.1 第1步—收集数据51
3.2.2 第2步—探索和准备数据52
3.2.3 第3步—基于数据训练模型55
3.2.4 第4步—评估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 总结59
第4章 概率学习—朴素贝叶斯分类60
4.1 理解朴素贝叶斯60
4.1.1 贝叶斯方法的基本概念61
4.1.2 朴素贝叶斯算法65
4.2 例子—基于贝叶斯算法的手机垃圾短信过滤69
4.2.1 第1步—收集数据69
4.2.2 第2步—探索和准备数据70
4.2.3 第3步—基于数据训练模型81
4.2.4 第4步—评估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 总结84
第5章 分而治之—应用决策树和规则进行分类85
5.1 理解决策树85
5.1.1 分而治之86
5.1.2 C5.0决策树算法89
5.2 例子—使用C5.0决策树识别高风险银行贷款91
5.2.1 第1步—收集数据92
5.2.2 第2步—探索和准备数据92
5.2.3 第3步—基于数据训练模型94
5.2.4 第4步—评估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分类规则101
5.3.1 独立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 来自决策树的规则105
5.3.5 什么使决策树和规则贪婪106
5.4 例子—应用规则学习算法识别有毒的蘑菇108
5.4.1 第1步—收集数据108
5.4.2 第2步—探索和准备数据108
5.4.3 第3步—基于数据训练模型109
5.4.4 第4步—评估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 总结114
第6章 预测数值型数据—回归方法115
6.1 理解回归115
6.1.1 简单线性回归117
6.1.2 普通最小二乘估计119
6.1.3 相关性120
6.1.4 多元线性回归121
6.2 例子—应用线性回归预测医疗费用124
6.2.1 第1步—收集数据124
6.2.2 第2步—探索和准备数据125
6.2.3 第3步—基于数据训练模型129
6.2.4 第4步—评估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回归树和模型树134
6.4 例子—用回归树和模型树估计葡萄酒的质量136
6.4.1 第1步—收集数据137
6.4.2 第2步—探索和准备数据137
6.4.3 第3步—基于数据训练模型139
6.4.4 第4步—评估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 总结145
第7章 黑箱方法—神经网络和支持向量机147
7.1理解神经网络147
7.1.1从生物神经元到人工神经元148
7.1.2激活函数149
7.1.3网络拓扑151
7.1.4用后向传播训练神经网络154
7.2例子—用人工神经网络对混凝土的强度进行建模155
7.2.1第1步—收集数据155
7.2.2第2步—探索和准备数据156
7.2.3第3步—基于数据训练模型157
7.2.4第4步—评估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量机161
7.3.1用超平面分类161
7.3.2对非线性空间使用核函数164
7.4例子—用支持向量机进行光学字符识别166
7.4.1第1步—收集数据166
7.4.2第2步—探索和准备数据167
7.4.3第3步—基于数据训练模型168
7.4.4第4步—评估模型的性能170
7.4.5第5步—提高模型的性能171
7.5总结172
第8章 探寻模式—基于关联规则的购物篮分析173
8.1理解关联规则173
8.1.1用于关联规则学习的Apriori算法174
8.1.2度量规则兴趣度—支持度和置信度175
8.1.3用Apriori原则建立规则176
8.2例子—用关联规则确定经常一起购买的食品杂货177
8.2.1第1步—收集数据177
8.2.2第2步—探索和准备数据178
8.2.3第3步—基于数据训练模型183
8.2.4第4步—评估模型的性能185
8.2.5第5步—提高模型的性能187
8.3总结190
第9章 寻找数据的分组—k均值聚类191
9.1理解聚类191
9.1.1聚类—一种机器学习任务192
9.1.2k均值聚类算法193
9.2例子—用k均值聚类探寻青少年市场细分198
9.2.1第1步—收集数据199
9.2.2第2步—探索和准备数据199
9.2.3第3步—基于数据训练模型203
9.2.4第4步—评估模型的性能205
9.2.5第5步—提高模型的性能207
9.3总结208
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
应用信息
同类热门
类似软件
r语言与网站分析 完整版43.3M182人在用 r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学
查看
r语言数据分析与挖掘实战41.88M394人在用 r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程
查看热门标签
网友评论0人参与,0条评论
最新排行
标准韩国语第一册 PDF版24.26M 标准韩国语是由北京大学、复旦大学、对外经济贸易大学、延边大学等25所大学共同编写的一本韩语学习书籍,全书共有三册,是国内应用非常广泛的一套韩语学习书籍。 多多小编为大家推荐的是标准韩国语第一册 PDF版下载。学习语言的第一步是学习语音,
查看
版式设计从入门到精通44.69M高清全彩版 版式设计从入门到精通是一本广告版式设计入门书籍,由ArtTone视觉研究中心编著。本书内容共三篇设计篇、色彩篇、主题篇,集中探讨了版式设计的基础和关键问题。透过对各设计方向的版式设计作品的详细分析,希望能让读者更快掌握版式设计的基础技巧与更高的表现
查看
opengl超级宝典第五版111.39Mpdf高清扫描版 opengl超级宝典第五版是由Richard.Wright,Jr.Nicholas Haemel和Graham Sellers Benjamin Lipchak所编著的一本OpenGL及3D图形编程最好的入门指南书籍,涵盖了使用最新版本的OpenG
查看
nosql数据库技术实战65.98M皮雄军 pdf扫描版 nosql数据库技术实战是一本NoSQL数据库技术实战书籍手册,本书是腾讯公司前资深后台工程师皮雄军呕心沥血之作,全书介绍NoSQL从基本操作到高级技术和核心原理,再到项目开发的所有重点知识,书中详细讲解了NoSQL的兴起原因、CAP理论、副本之间
查看
php与mysql程序设计(第3版)134.16M吉尔摩pdf扫描版php与mysql程序设计(第3版)是一本PHP、MySQL程序设计指导手册,由美国前端工程师吉尔摩编著。全书主题的选取和组织从实用出发,在讲述知识之外还加入了作者多年积累的宝贵实战经验,并提供了500多个可以直接用于实际项目的代码示例,充分体现了作者深
查看
PHP核心技术与最佳实践166.94M列旭松pdf扫描版 PHP核心技术与最佳实践是一本致力于为希望成为中高级PHP程序员的读者提供高效而有针对性指导的经典著作,由程序员列旭松和陈文共同编著。本书内容丰富,翔实,系统的归纳和深刻解读了PHP开发中的编程思想、底层原理、核心技术、开发技巧、编码规范和实践,力
查看
零基础学HTML+CSS(第3版)82.93M张熠pdf扫描版 零基础学HTML+CSS(第3版)是一本html+css的全面学习教材,书中详细的介绍了html+css的知识点,先从简单的html语法下手,让读者对网页的信息展现有一个初步的了解,接着又引入了div+css的相关知识,让读者明白网页元素是如何布局
查看
visual c++2010入门经典第5版96.63M霍顿 pdf扫描版visual c++2010入门经典第5版是一本C++代码入门经典,由霍顿(Ivor Horton)编著,苏正,李文娟共同翻译。本书使用了visual C++ 2010支持的两种C++语言技术来讲述C++编程的基础知识,讨论了每一个windows应用程序
查看
编写高质量代码改善c#程序的157个建议6.67M陆敏技pdf扫描版 编写高质量代码改善c#程序的157个建议是一本关于如何编写高质量C#代码的工具书,由陆敏技编著。本书从语法、程序架构和设计,编码习惯和编程规范3个层面深入探讨,编写高质理c#代码的技巧、禁忌和最佳实践,为C#程序员如何编写更高质量的C#代码提供了1
查看
Java核心技术卷一:基础知识(原书第10版)128.62Mpdf扫描版Java核心技术卷一:基础知识(原书第10版)是java领域最有影响力和价值的著作之一,由美国圣何塞州立大学计算机科学系教授凯.霍斯特曼编著。本书内容翔实、客观准确,不拖泥带水,根据Java SE 8全面更新,同时修正了第9版中的不足,系统全面讲解了Ja
查看
新一代SDN VMware NSX 网络原理与实践pdf61.07M范恂毅pdf扫描版 新一代SDN VMware NSX 网络原理与实践是一本全面剖析VMware NSX网络原理与实践的详细指南,由范恂毅和张晓和两人共同编著。本书内容丰富翔实,全面介绍了VMware NSX的相关知识,还从自身的经验和体会出发,阐述了NSX与其他技术
查看
sql server 2005安装图解5.26Mpdf高清版 SQL Server 2005是目前网络上使用率最高的数据库,虽然高版本的sql能够带给用户带多新功能,但迁移数据库以及熟练操作也需要一段时间,故此SQL Server 2005还是非常有市场的,本站在这里提供sql server 2005安装图解
查看
汇编语言的编程艺术第2版pdf187.05M高清电子书汇编语言的编程艺术第2版是目前讲解汇编语言最经典的图书,作者海德(Randall Hyde),马跃,包战翻译,它详细的介绍了编辑、编译和运行HLA程序,声明和使用常量、标量变量、指针、数组、结构、联合和命名空间,转换算术表达式,转换高级控制结构等内容。同
查看