大小:27.78M
更新时间:23-08-28
系统:Pc
数据挖掘:概念模型方法和算法(第2版)是一本数据挖掘原理讲解书籍,由[美]坎塔尔季奇Mehmed Kantardzic著,王晓海,吴志刚共同翻译。全书讲解了DBSCAN、BIRCH和分布式DBSCAN的聚类算法,介绍了贝叶斯网络,并讨论了图形中的Betweeness和Centrality参数测量算法,分析在建立决策树时使用的cart算法和基尼指数,讨论relief以及pagerank算法,更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容等等,能够适用于在校生,毕业生,研究人员阅读。
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念模型方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。
本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
第1章 数据挖掘的概念
1.1 概述
1.2 数据挖掘的起源
1.3 数据挖掘过程
1.4 大型数据集
1.5 数据仓库
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败
1.7 本书结构安排
1.8 复习题
1.9 参考书
第2章 数据准备
2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标准化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.6 异常点分析
2.7 复习题
2.8 参考书目
第3章 数据归约
3.1 大型数据集的维度
3.2 特征归约
3.2.1 特征选择
3 .2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量
3.5 主成分分析
3.6 值归约
3.7 特征离散化ChiMerge技术
3.8 案例归约
3.9 复习题
3.10 参考书目
第4章 从数据中学习
4.1 学习机器
4.2 统计学习原理
4.3 学习方法的类型
4.4 常见的学习任务
4.5 支持向量机
4.6 kNN:最近邻分类器
4.7 模型选择与泛化
4.8 模型的评估
4.9 90%准确的情形
4.9.1 保险欺诈检测
4.9.2 改进心脏护理
4.10 复习题
4.11 参考书目
第5章 统计方法
5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.4 预测回归
5.5 方差分析
5.6 对数回归
5.7 对数-线性模型
5.8 线性判别分析
5.9 复习题
5.10 参考书目
第6章 决策树和决策规则
6.1 决策树
6.2 C4.5算法:生成决策树
6.3 未知属性值
6.4 修剪决策树
6.5 C4.5算法:生成决策规则
6.6 CART算法和Gini指标
6.7 决策树和决策规则的局限性
6.8 复习题
6.9 参考书目
第7章 人工神经网络
7.1 人工神经元的模型
7.2 人工神经网络的结构
7.3 学习过程
7.4 使用ANN完成的学习任务
7.4.1 模式联想
7.4.2 模式识别
7.5 多层感知机
7.6 竞争网络和竞争学习
7.7 SoM
7.8 复习题
7.9 参考书目
第8章 集成学习
8.1 集成学习方法论
8.2 多学习器组合方案
8.3 bagging和boosting
8.4 AdaBoost算法
8.5 复习题
8.6 参考书目
第9章 聚类分析
9.1 聚类的概念
9.2 相似度的度量
9.3 凝聚层次聚类
9.4 分区聚类
9.5 增量聚类
9.6 DBSCAN箅法
9.7 BIRCH算法
9.8 聚类验证
9.9 复习题
9.10 参考书目
第10章 关联规则
10.1 购物篮分析
10.2 Apriori算法
10.3 从频繁项集中得到关联规则
10.4 提高Apriori算法的效率
10.5 FP增长方法
10.6 关联分类方法
10.7 多维关联规则挖掘
10.8 复习题
10.9 参考书目
第11章 Web挖掘和文本挖掘
11.1Web挖掘
11.2 Web内容、结构与使用挖掘
11.3 HITS和LOGSOM算法
11.4 挖掘路径遍历模式
11.5 PageRank算法
11.6 文本挖掘
11.7 潜在语义分析
11.8 复习题
11.9 参考书目
第12章 数据挖掘高级技术
12.1 图挖掘
第13章 遗传算法
第14章 模糊集和模糊逻辑
第15章 可视化方法
附录A 数据挖掘工具
附录B 数据挖掘应用
应用信息
同类热门
类似软件
数据挖掘技术与工程实践25.09M193人在用 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看
SPSS Modeler 181.78G5289人在用 SPSS Modeler 18是一款数据挖掘和文本分析软件,可用于构建预测模型和进行高级数据分析。在这次版本中,带来了大量实用功能,内置性能更加强大的大数据算法,支持的平台更加广泛(包括Windows10)。 除此之外,SPSS Mod
查看热门标签
网友评论1人参与,1条评论
最新排行
shell脚本学习指南pdf版26.88M shell脚本学习指南,英文名称classic shell scripting,是一本关习如何学习和掌握shell脚本的图书,由(美)罗宾(Robbins.A.)、(美)比博(Beebe,N.H.F.)编著,O'Reilly Taiwan公司编译,
查看
ugnx10从入门到精通pdf4.52M高清扫描版 ugnx10从入门到精通是文鼎教育集团重新编辑整理的一个ug10.0学习教材,总共包括五个章节,第一章概述,第二章ug10.0应用体验,第三章ug nx 10工作环境和基本操作,第四章曲线造型,第五章草图,内容从简到繁,从浅到深,让读者可以更好的轻
查看
百姓自制蔬菜食谱1000例58.08Mpdf高清版百姓自制蔬菜食谱1000例是一本pdf高清版的电子书,详细的介绍了各种蔬菜的不同做法,包括白菜、菠菜、韭菜、圆白菜、青菜、雪菜、茭白、芦笋、萝卜、山药、土豆、藕等多种蔬菜。同时该蔬菜菜谱还介绍了做菜的一些小常识、小窍门,让百姓了解从选料、制作到食用的一系
查看
sql基础教程 第二版11.08MMICK pdf扫描版sql基础教程 第二版是一本SQL的新手入门书籍,由日本资深数据库专家MICK编著,孙淼,罗勇共同翻译。第2版基于新版本RDBMS全面升级,并新增一章介绍从应用程序执行SQL语句的方法。全书从数据库、表的结构到查询、更新表的语法,常用的函数,表的联结等,
查看
尼康l810使用说明书11.68M 尼康l810是一款性价比较高的长焦相机,具备1614万有效像素,搭载26倍光学变焦带22.5mm广角镜头,尼康L810配置3.0英寸LCD显示屏,支持19种优化场景模式,全高清立体声短片录制。可是这么一款强大的相机不会操作可如何是好呢?今天小编就带
查看
数据挖掘实用机器学习工具与技术(原书第3版)131.09M威滕高清扫描版 数据挖掘实用机器学习工具与技术(原书第3版)是一本数据挖掘方面的技术书籍,由新西兰程序员威滕(Witten,I.H)编著。本书对上一版内容进行了全面更新,其内容包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。作者
查看
网络爬虫全解析:技术原理与实践399.57M罗刚 pdf扫描版 网络爬虫全解析:技术原理与实践,简称为网络爬虫全解析,是由猎兔搜索创始人罗刚编写的,作者将多年以来的开发经验进行总结,可以帮助读者全面快速的掌握网络爬虫开发方法。全书从开发网络爬虫所需要的Java语法开始讲解,然后介绍基本的爬虫原理。通过介绍优先级
查看
web前端开发精品课:html与css基础教程44.88M莫振杰pdf扫描版web前端开发精品课:html与css基础教程是一本介绍html与css基础的入门教材,由人民邮电出版社出版,莫振杰编著。全书分为两大部分,第一部分是html入门,主要介绍了网页结构基础知识,而第二部分主要讲的是css的入门,介绍了网页样式方面的基础知识
查看
深度探索linux操作系统pdf125.28M扫描版 深度探索linux操作系统pdf是一本深度阐释Linux操作系统原理的里程碑之作,由资深linux专家王柏生编著。本书以从零开始构建一个完整的Linux操作系统的过程为依托,宏观上全面厘清了构成Linux操作系统的各个组件以及它们之间的关系,微观上
查看
图像处理分析与机器视觉第四版pdf256.11M扫描版 图像处理分析与机器视觉第四版是一本图像处理分析书籍,由桑卡Milan Sonka,Vaclav Hlavac和Roger Boyle三人编著,兴军亮,艾海舟共同翻译。 本书涵盖的领域十分广泛,其中包括人工智能、信号处理、人工神经网络、模
查看
服务设计模式:SOAP/WSDL与RESTful Web服务设计解决方案55.57M戴尼奥pdf扫描版 服务设计模式:SOAP/WSDL与RESTful Web服务设计解决方案是Web服务设计领域的经典著作,由美国程序员Robert Daigneau编著。本书是利用SOAP/WSDL或者遵循REST架构风格的Web服务设计解决方案的纵览,将基本的We
查看
spring源码深度解析94.36M郝佳 pdf扫描版spring源码深度解析是一本spring框架揭秘实战指南,由郝佳编著。本书从核心实现和企业应用两个方面,由浅入深、由易到难地对Spring源码展开了系统的讲解,包括Spring的设计理念和整体架构、容器的基本实现、默认标签的解析、自定义标签的解析、be
查看
C高级编程:基于模块化设计思想的C语言开发57.86M吉星pdf扫描版 C高级编程:基于模块化设计思想的C语言开发是一本C语言高级编程书籍,由吉星编著。本书将模块化系统设计的个人总结与C语言的讨论融合。作者在写作的过程中,使用了个人工程代码库中的原型,并尽可能保证这些代码有一定的应用价值。为了在有限的章节尽可能给出一个
查看
Delphi2010语法手册3.57Mpdf+txt中文版Delphi 2010语法手册,为用户提供delphi基础常用教程,还有专业的教程详解,让用户学习中能够掌握更多的专业语法,从基础开始,学习delphi编程更安心,给还在做delphi开发的童鞋们,资料虽然比较老,但是实用的,这里给您提供的是Delphi
查看
机器学习实践指南pdf58.57M第2版 机器学习实践指南:案例应用解析(第2版)是一本机器学习实践指南,由麦好编著。全书分为准备篇、基础篇、 统计分析实战篇和机器学习实战篇。机器学习算法建立在复杂的计算理论基础之上,并涉及多门数学学科。 作者在全收介绍机器学习的发展及应用前景
查看
第1楼 河南省新乡市移动 网友