大小:27.78M
更新时间:23-08-28
系统:Pc
数据挖掘:概念模型方法和算法(第2版)是一本数据挖掘原理讲解书籍,由[美]坎塔尔季奇Mehmed Kantardzic著,王晓海,吴志刚共同翻译。全书讲解了DBSCAN、BIRCH和分布式DBSCAN的聚类算法,介绍了贝叶斯网络,并讨论了图形中的Betweeness和Centrality参数测量算法,分析在建立决策树时使用的cart算法和基尼指数,讨论relief以及pagerank算法,更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容等等,能够适用于在校生,毕业生,研究人员阅读。
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念模型方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。
本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
第1章 数据挖掘的概念
1.1 概述
1.2 数据挖掘的起源
1.3 数据挖掘过程
1.4 大型数据集
1.5 数据仓库
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败
1.7 本书结构安排
1.8 复习题
1.9 参考书
第2章 数据准备
2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标准化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.6 异常点分析
2.7 复习题
2.8 参考书目
第3章 数据归约
3.1 大型数据集的维度
3.2 特征归约
3.2.1 特征选择
3 .2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量
3.5 主成分分析
3.6 值归约
3.7 特征离散化ChiMerge技术
3.8 案例归约
3.9 复习题
3.10 参考书目
第4章 从数据中学习
4.1 学习机器
4.2 统计学习原理
4.3 学习方法的类型
4.4 常见的学习任务
4.5 支持向量机
4.6 kNN:最近邻分类器
4.7 模型选择与泛化
4.8 模型的评估
4.9 90%准确的情形
4.9.1 保险欺诈检测
4.9.2 改进心脏护理
4.10 复习题
4.11 参考书目
第5章 统计方法
5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.4 预测回归
5.5 方差分析
5.6 对数回归
5.7 对数-线性模型
5.8 线性判别分析
5.9 复习题
5.10 参考书目
第6章 决策树和决策规则
6.1 决策树
6.2 C4.5算法:生成决策树
6.3 未知属性值
6.4 修剪决策树
6.5 C4.5算法:生成决策规则
6.6 CART算法和Gini指标
6.7 决策树和决策规则的局限性
6.8 复习题
6.9 参考书目
第7章 人工神经网络
7.1 人工神经元的模型
7.2 人工神经网络的结构
7.3 学习过程
7.4 使用ANN完成的学习任务
7.4.1 模式联想
7.4.2 模式识别
7.5 多层感知机
7.6 竞争网络和竞争学习
7.7 SoM
7.8 复习题
7.9 参考书目
第8章 集成学习
8.1 集成学习方法论
8.2 多学习器组合方案
8.3 bagging和boosting
8.4 AdaBoost算法
8.5 复习题
8.6 参考书目
第9章 聚类分析
9.1 聚类的概念
9.2 相似度的度量
9.3 凝聚层次聚类
9.4 分区聚类
9.5 增量聚类
9.6 DBSCAN箅法
9.7 BIRCH算法
9.8 聚类验证
9.9 复习题
9.10 参考书目
第10章 关联规则
10.1 购物篮分析
10.2 Apriori算法
10.3 从频繁项集中得到关联规则
10.4 提高Apriori算法的效率
10.5 FP增长方法
10.6 关联分类方法
10.7 多维关联规则挖掘
10.8 复习题
10.9 参考书目
第11章 Web挖掘和文本挖掘
11.1Web挖掘
11.2 Web内容、结构与使用挖掘
11.3 HITS和LOGSOM算法
11.4 挖掘路径遍历模式
11.5 PageRank算法
11.6 文本挖掘
11.7 潜在语义分析
11.8 复习题
11.9 参考书目
第12章 数据挖掘高级技术
12.1 图挖掘
第13章 遗传算法
第14章 模糊集和模糊逻辑
第15章 可视化方法
附录A 数据挖掘工具
附录B 数据挖掘应用
同类热门
类似软件
写给程序员的数据挖掘实践指南35.98M241人在用写给程序员的数据挖掘实践指南是一本数据挖掘技术指导手册,由软件开发工程师Ron Zacharski编著,知名技术译者王斌老师译作。本书作者采用在实践中学的方式,提供了大量Python的代码和案例,同时还详细的介绍了如何应用数据挖掘技术。通过阅读本书,可以
查看数据挖掘技术与工程实践25.09M159人在用 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看热门标签
网友评论1人参与,1条评论
最新排行
高质量c++编程指南pdf260K 高质量c++编程指南pdf是一本讲述c语言编程技巧的电子书,作者:林锐博士。这是它的pdf版本,详细介绍了c++和c语言的文件结构,程序的版式,命名规则,表达式,基本语句,常量等参数,能够帮助网友更好的学习好c语言编程。
查看水力学第4版上册下册9.46Mpdf高清完整版水力学第4版上册下册是一本学习水力学的主要理论及其应用的教材,由吴持恭编写,高教育出版社出版,此版本在第3版基础上,保持了原书 “循序渐进、加强基础、理论联系实际、利于教学”的特点,采用了由浅人深的方式,讲述了水静力学、水动力学基础、液流型态和水头损失、
查看apache kylin权威指南15.22Mpdf高清版 Apache Kylin是个由中国人主导的Apache项目,apache kylin权威指南则是国内一本由该团队开发的原创图书,全书总共12章,介绍了Apache Kylin的历史、技术原理和产品定位,同时详细解读了Apache Kylin的核心概
查看OraclePL/SQL实例精解(原书第4版)71.86M罗森维格pdf扫描版 OraclePL/SQL实例精解(原书第4版)是一本OraclePL和MYSQL数据库实例精解书籍,由美国程序员罗森维格编著。本书是一本集中式的解决方案范例教程,使用真实场景的试验,大量范例,练习来介绍所需的所有Oracle PL/SQL技能。全书
查看循序渐进oracle数据库管理优化与备份恢复72.28M盖国强pdf扫描版 循序渐进oracle,全称叫做循序渐进oracle数据库管理优化与备份恢复,是一本Oracle数据库入门书籍,由Oracle数据库专家盖国强编著,全书内容丰富翔实,继续贯彻了作者“由浅入深、由点到线再及面”的学习方法,作者在写作过程中一直遵循了这个
查看数据结构与算法分析c语言描述pdf高清版9.85M原书第二版数据结构与算法分析c语言描述(原书第二版)是一本是国外数据结构与算法分析方在的标准教材,由美国佛罗里达国际大学计算机学院教授MarkAllenWeiss编著。本书介绍了数据结构(大量数据的组织方法)以及算法分析(算法运行时间的估算),讨论数据结构和算法分
查看spss其实很简单pdf36.66M高清扫描版spss其实很简单是由美国加利福尼亚大学教授罗纳德·D·约克奇所编著的一本专注于spss统计分析的指导用书。适用的领域非常的广泛,现在经济、财政、金融、营销、会计、管理及人文社会科学等领域都需要处理大量的信息。统计学能有效地处理各种信息问题,统计软件SP
查看python项目开发实战 第2版13.23Mpdf扫描版 python项目开发实战 第2版是一本Python项目开发流程实战手册,由日本BePROUD股份有限公司编著。本书的内容全部基于python开发事实,全部都是BeProud员工实际尝试、实践过的,可以给读者提供一些能实际应用且行之有效的知识,读过本
查看
第1楼 河南省新乡市移动 网友