大小:44.42M
更新时间:23-08-28
系统:Pc
数据挖掘:R语言实战pdf是一本R语言的实战手册,由黄文和王正林两人共同编著。本书侧重使用R进行数据挖掘,重点讲述了R的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R软件进行深入潜出和全面的介绍,以便读者能深刻理解R的精髓并能快速、高效和灵活地掌握使用R进行数据挖掘的技巧。通过阅读数据挖掘r语言实战,读者不仅能掌握使用R及相关的算法包来快速解决实际问题的方法,而且能得到从实际问题分析入手,到利用R进行求解,以及对挖掘结果进行分析的全面训练。
R是一个免费的开源软件,它提供了首屈一指的统计计算和绘图功能,尤其是大量的数据挖掘方面的算法包,使得它成为一款优秀的、不可多得的数据挖掘工具软件。本书的主要目的是向读者介绍如何用R进行数据挖掘,通过大量的精选实例,循序渐进、全面系统地讲述R在数据挖掘领域的应用。
数据挖掘r语言实战以数据预处理、基本算法及应用和高级算法及应用这三篇展开。
(1)上篇:数据预处理’
由第1—5章组成,首先简要介绍数据挖掘流程、算法和工具,然后介绍R中的数据分类和数据集,以及使用R获取数据的多种灵活的方法。最后讲述对数据进行探索性分析和预处理的方法。这些内容是使用R进行数据挖掘的最基础内容。
(2)中篇:基本算法及应用
由第6—9章组成,主要讲述数据挖掘的基本算法及应用,包括关联分析、聚类分析、判别分析和决策树,这些算法也是数据挖掘使用最多最普遍的算法。R中提供了丰富的、功能强大的算法包和实现函数,数据挖掘的初级和中级用户务必掌握。
(3)下篇:高级算法及应用
由第10—14章组成,主要讲述数据挖掘的高级算法及应用,包括集成学习、随机森林、支持向量机和神经网络,以及使用R中的工具对数据挖掘的模型进行评估与选择。对于中高级的用户,可以深入学习一下本篇的内容。
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
第0章 致敬,R!
致敬,肩膀!
致敬,时代!
致敬,人才!
致敬,R 瑟!
上篇 数据预处理
第1章 数据挖掘导引
1.1 数据挖掘概述
1.1.1 数据挖掘的过程
1.1.2 数据挖掘的对象
1.1.3 数据挖掘的方法
1.1.4 数据挖掘的应用
1.2 数据挖掘的算法
1.3 数据挖掘的工具
1.3.1 工具的分类
1.3.2 工具的选择
1.3.3 商用的工具
1.3.4 开源的工具
1.4 R 在数据挖掘中的优势
数据挖掘:R 语言实战
VI
第2章 数据概览
2.1 n×m 数据集
2.2 数据的分类
2.2.1 一般的数据分类
2.2.2 R 的数据分类
2.2.3 用R 简单处理数据
2.3 数据抽样及R 实现
2.3.1 简单随机抽样
2.3.2 分层抽样
2.3.3 整群抽样
2.4 训练集与测试集
2.5 本章汇总
第3章 用R 获取数据
3.1 获取内置数据集
3.1.1 datasets 数据集
3.1.2 包的数据集
3.2 获取其他格式的数据
3.2.1 CSV 与TXT 格式
3.2.2 从Excel 直接获取数据
3.2.3 从其他统计软件中获取数据
3.3 获取数据库数据
3.4 获取网页数据
3.5 本章汇总
第4章 探索性数据分析
4.1 数据集
4.2 数字化探索
4.2.1 变量概况
4.2.2 变量详情
4.2.3 分布指标
4.2.4 稀疏性
4.2.5 缺失值
4.2.6 相关性
4.3 可视化探索
4.3.1 直方图
目 录
VII
4.3.2 累积分布图
4.3.3 箱形图
4.3.4 条形图
4.3.5 点阵图
4.3.6 饼图
4.5 本章汇总
第5章 数据预处理
5.1 数据集加载
5.2 数据清理
5.2.1 缺失值处理
5.2.2 噪声数据处理
5.2.3 数据不一致的处理
5.3 数据集成
5.4 数据变换
5.5 数据归约
5.6 本章汇总
中篇 基本算法及应用
第6章 关联分析
6.1 概述
6.2 R 中的实现
6.2.1 相关软件包
6.2.2 核心函数
6.2.3 数据集
6.3 应用案例
6.3.1 数据初探
6.3.2 对生成规则进行强度控制
6.3.3 一个实际应用
6.3.4 改变输出结果形式
6.3.5 关联规则的可视化
6.4 本章汇总
第7章 聚类分析
7.1 概述
7.1.1 K-均值聚类
数据挖掘:R 语言实战
VIII
7.1.2 K-中心点聚类
7.1.3 系谱聚类
7.1.4 密度聚类
7.1.5 期望最大化聚类
7.2 R 中的实现
7.2.1 相关软件包
7.2.2 核心函数
7.2.3 数据集
7.3 应用案例
7.3.1 K-均值聚类
7.3.2 K-中心点聚类
7.3.3 系谱聚类
7.3.4密度聚类
7.3.5 期望最大化聚类
7.4 本章汇总
第8章 判别分析
8.1 概述
8.1.1 费希尔判别
8.1.2贝叶斯判别
8.1.3 距离判别
8.2 R 中的实现
8.2.1 相关软件包
8.2.2 核心函数
8.2.3 数据集
8.3 应用案例
8.3.1 线性判别分析
8.3.2 朴素贝叶斯分类
8.3.3 K 最近邻
8.3.4 有权重的K 最近邻算法
8.4 推荐系统综合实例
8.4.1 kNN 与推荐
8.4.2 MovieLens 数据集说明
8.4.3 综合运用
8.5 本章汇总
目 录
IX
第9章 决策树
9.1 概述
9.1.1 树形结构
9.1.2 树的构建
9.1.3 常用算法
9.2 R 中的实现
9.2.1 相关软件包
9.2.2 核心函数
9.2.3 数据集
9.3 应用案例
9.3.1 CART 应用
9.3.2 C4.5 应用
9.4 本章汇总
下篇 高级算法及应用
第10章 集成学习
10.1 概述
10.1.1 一个概率论小计算
10.1.2 Bagging 算法
10.1.3 AdaBoost 算法
10.2 R 中的实现
10.2.1 相关软件包
10.2.2 核心函数
10.2.3 数据集
10.3 应用案例
10.3.1 Bagging 算法
10.3.2 Adaboost 算法
10.4 本章汇总
第11章 随机森林
11.1 概述
11.1.1 基本原理
11.1.2 重要参数
11.2 R 中的实现
11.2.1 相关软件包
数据挖掘:R 语言实战
X
11.2.2 核心函数
11.2.3 可视化分析
11.3 应用案例
11.3.1 数据处理
11.3.2 建立模型
11.3.3 结果分析
11.3.4 自变量的重要程度
11.3.5 优化建模
11.4 本章汇总
第12章 支持向量机
12.1 概述
12.1.1 结构风险最小原理
12.1.2 函数间隔与几何间隔
12.1.3 核函数
12.2 R 中的实现
12.2.1 相关软件包
12.2.2 核心函数
12.2.3 数据集
12.3 应用案例
12.3.1 数据初探
12.3.2 建立模型
12.3.3 结果分析
12.3.4 预测判别
12.3.5 综合建模
12.3.6 可视化分析
12.3.7 优化建模
12.4 本章汇总
第13章 神经网络
13.1 概述
13.2 R 中的实现
13.2.1 相关软件包
13.2.2 核心函数
13.3 应用案例
13.3.1 数据初探
目 录
XI
13.3.2 数据处理
13.3.3 建立模型
13.3.4 结果分析
13.3.5 预测判别
13.3.6 模型差异分析
13.3.7 优化建模
13.4 本章汇总第14章 模型评估与选择
14.1 评估过程概述
14.2 安装Rattle 包
14.3 Rattle 功能简介
14.3.1 Data――选取数据
14.3.2 Explore――数据探究
14.3.3 Test――数据相关检验
14.3.4 Transform――数据预处理
14.3.5 Cluster――数据聚类
14.3.6 Model――模型评估
14.3.7 Evaluate――模型评估
14.3.8 Log――模型评估记录
14.4 模型评估相关概念
14.4.1 误判率
14.4.2 正确/错误的肯定判断、正确/错误的否定判断
14.4.3 精确度、敏感度及特异性
14.5 Rattle 在模型评估中的应用
14.5.1 混淆矩阵
14.5.2 风险图
14.5.3 ROC 图及相关图表
14.5.4 模型得分数据集
14.6 综合实例
14.6.1 数据介绍
14.6.2 模型建立
14.6.3 模型结果分析
数据挖掘:R 语言实战
同类热门
类似软件
inventor2021简体中文语言包64位50.1M363人在用inventor2021简体中文语言包是针对inventor professional 2021软件而开发的简体中文补丁包,是从autodesk公司官方下载的,能够将英文的软件更换成简体中文,从而帮助中国用户更好的使用软件,再配合软件包中的破解补丁一起使
查看数据挖掘技术与工程实践25.09M157人在用 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看r语言数据分析与挖掘实战41.88M323人在用r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程和数据
查看r语言与网站分析 完整版43.3M165人在用r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学原理,
查看热门标签
网友评论0人参与,0条评论
最新排行
wireshark使用教程(超详细)2.28Mpdf高清版 wireshark使用教程pdf是专为wireshark软件而编制的实用使用说明书,pdf高清格式,教程详细的介绍了什么是Wireshark、如何编译/安装Wireshark、Wireshark用户界面、如何实时捕捉数据包、如何处理已经捕捉的包、文
查看精通spring 4.x企业应用开发实战178.94M陈雄华pdf扫描版精通spring 4.x企业应用开发实战是一本Spring技术开发实战手册,由Spring专家陈雄华编著。本书内容丰富,深入浅出,作者对Spring的源码进行了彻底分析,深刻揭示了Spring框架的技术内幕,让读者知其然,更知其所以然。Spring中的许
查看c++入门经典 第9版261.87Mpdf扫描版 c++入门经典 第9版是一本C++语言入门指导书,由美国程序员Walter Savitch编著。本书内容丰富,风格清晰,每一章都是C++的重要知识点,越往后将越加深奥与困难,不过不用太担心,请认真阅读书中章开头的小节总览和随处可见的小结框,它们可以
查看Oracle PL/SQL专家指南:高级PL/SQL解决方案的设计与开发37.16M哈德门pdf扫描版Oracle PL/SQL专家指南:高级PL/SQL解决方案的设计与开发是一本Oracle数据库操作指南,由美国程序员哈德门和麦克罗林共同编著。全书内容丰富翔实,主要讲解了统计表收集、PL/SQL优化器、SQL Trace、DBMS STATS及TKPR
查看活出最乐观的自己pdf14.37M扫描版活出最乐观的自己是由美国著名心理学家马丁.塞利格曼先生编著的一本积极心理学研究著作。该书将深奥的心理学研究与大众的日常生活融合在一起,能够独立帮助读者解决心理学上遇到的各种基础难题,高效、实用!活出最乐观的自己主要提供了悲观者与乐观者的画像、悲观者眼中的
查看sql server 2012深入解析与性能优化(第3版)265.39M波尔顿pdf扫描版 sql server 2012深入解析与性能优化(第3版)是一本SQL Server 2012使用指南,由美国程序员波尔顿Christian Ballton、Justin Langford、Glenn Berry、Gavin Payne、Amit
查看erlang程序设计第2版13.57MJoe Armstrong pdf扫描版erlang程序设计第2版是一本Erlang程序设计书籍,由Erlang最初的设计者和实现者Joe Armstrong编著,牛化成翻译。本书是erlang程序设计的第二个版本。作者在第2版中做了重要更新,不但涵盖核心语言和框架的基本内容,还涉及rebar
查看Android从入门到精通781KPDF中文版随着Android手机平台的水涨船高,各种Android开发资料也成为热门的教程。今天小编给大家带来了Android从入门到精通下载,它是一个PDF中文版教程,努力学习,你会发现Android的魅力无限,它能够让你体验到Android的精彩世界。小编一并
查看linux高级程序设计36.39M陈健 pdf扫描版linux高级程序设计是一本适合Linux初学者的指南,由美国Linux内核工程师美斯特和布卢两人共同编著,陈健等人翻译。本书涉及面非常广,从基本工具和技术的使用到lamp技术的介绍,从系统底层内核的剖析到网络、数据库编程,从gnome桌面环境到图形、音
查看艺用人体解剖学pdf24.66M历晓东扫描版艺用人体解剖学pdf是由上海人民美术出版社的历晓东老师推出的一般人体艺术解析著作。该著作充分吸收了国内外艺术家的探索及经验,打破了传统思维的桎梏,以超人的智慧创造了全新的人体形象。能够独立解决用户对人体构造遇到的瓶颈,高效、实用!艺用人体解剖学也是依据高
查看循序渐进oracle数据库管理优化与备份恢复72.28M盖国强pdf扫描版 循序渐进oracle,全称叫做循序渐进oracle数据库管理优化与备份恢复,是一本Oracle数据库入门书籍,由Oracle数据库专家盖国强编著,全书内容丰富翔实,继续贯彻了作者“由浅入深、由点到线再及面”的学习方法,作者在写作过程中一直遵循了这个
查看C高级编程:基于模块化设计思想的C语言开发57.86M吉星pdf扫描版C高级编程:基于模块化设计思想的C语言开发是一本C语言高级编程书籍,由吉星编著。本书将模块化系统设计的个人总结与C语言的讨论融合。作者在写作的过程中,使用了个人工程代码库中的原型,并尽可能保证这些代码有一定的应用价值。为了在有限的章节尽可能给出一个较为完
查看spss其实很简单pdf36.66M高清扫描版spss其实很简单是由美国加利福尼亚大学教授罗纳德·D·约克奇所编著的一本专注于spss统计分析的指导用书。适用的领域非常的广泛,现在经济、财政、金融、营销、会计、管理及人文社会科学等领域都需要处理大量的信息。统计学能有效地处理各种信息问题,统计软件SP
查看