大小:43.3M
更新时间:23-08-28
系统:Pc
r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学原理,力争做到对读者授之以“渔”,而非简单地授之以“鱼”。
《R语言与网站分析》从互联网应用角度对R语言如何实现数据挖掘和指标分析等问题做了阐述。通过诸多真实应用案例的分析,作者试图为读者建立起一座沟通数学原理和互联网实际业务应用的桥梁。同时本书给出了案例中的完整代码以及分析过程,力图帮助读者充分理解R语言是如何实现算法的。
《R语言与网站分析》是目前为止国内唯一一本阐述如何使用R语言来分析和挖掘互联网数据的应用性书籍。书中使用大量的实际案例,把数学原理同R语言实现方案有机结合起来。力图通过案例分析达到举一反三的效果,进而指导读者在日后的实际工作中进行应用。同时书中也阐述众多常用的数据分析和挖掘的方法和原理,对于非互联网的从业人员也很有指导意义。
前言 第1章 统计思维与网站分析 1.1 不确定与确定 1.2 统计分析方法 1.2.1 细分分析 1.2.2 对比分析 1.2.3 趋势分析 1.3 网站分析概要 1.3.1 解决用户需求 1.3.2 寻找新的用户需求 第2章 R语言数据操作基础 2.1 R简介 2.2 了解R软件 2.2.1 软件安装 2.2.2 R软件界面 2.2.3 工作目录 2.2.4 命令行交互 2.2.5 命令脚本文件 2.2.6 工作空间数据 2.2.7 帮助 2.2.8 R语言入门 2.2.9 扩展算法包 2.3 R语言的数据类型 2.4 对象及其属性 2.4.1 固有属性:模式和长度 2.4.2 读取和设置属性值 2.4.3 对象的搜索和删除 2.5 向量 2.5.1 创建向量 2.5.2 向量索引 2.5.3 向量编辑 2.5.4 向量排序 2.5.5 向量去重 2.5.6 缺失值处理 2.5.7 向量间操作 2.6 矩阵和数组 2.6.1 创建矩阵 2.6.2 矩阵索引 2.6.3 矩阵编辑 2.6.4 矩阵的运算 2.6.5 数组 2.6.6 apply函数应用 2.7 列表和数据框 2.7.1 列表的创建和索引 2.7.2 列表编辑 2.7.3 数据框的创建和名称 2.7.4 数据框索引 2.7.5 数据框编辑 2.7.6 缺失值处理 2.8 因子 2.8.1 无序和有序因子 2.8.2 连续数据的离散化 2.9 字符串操作 2.9.1 字符串长度nchar 2.9.2 字符串合并和分割 2.9.3 字符串内部字符的读取和替换 2.9.4 正则表达式 2.10 常用数据的创建 2.10.1 因子序列的创建 2.10.2 等差序列的创建 2.10.3 随机抽样sample 2.10.4 重复序列rep 2.10.5 概率分布 2.11 控制流 2.11.1 分支语句 2.11.2 循环语句 2.12 运算符、函数和过程 2.12.1 常用运算符 2.12.2 函数 2.12.3 过程 2.13 数据的读写等操作 2.13.1 读取数据 2.13.2 输出数据 第3章 R语言的绘图基础 3.1 概述 3.2 颜色以及文字/点/线参数的设置 3.2.1 颜色 3.2.2 文字元素相关参数设置 3.2.3 点元素相关参数设置 3.2.4 线元素相关参数设置 3.3 低级绘图函数 3.3.1 引例 3.3.2 标题 3.3.3 图例 3.3.4 坐标轴 3.3.5 边框 3.3.6 网格线 3.3.7 点 3.3.8 线 3.3.9 文字 3.3.10 多边形 3.4 高级绘图函数以及常用绘图应用 3.4.1 图形类型的选择 3.4.2 散点图 3.4.3 气泡图 3.4.4 曲线图 3.4.5 柱状图 3.4.6 条形图 3.4.7 饼图 3.4.8 面积堆积图 3.4.9 直方图和密度曲线图 3.5 绘图窗口操作函数 3.5.1 单一窗口中的子绘图区域布局 3.5.2 绘图窗口操作 第4章 单指标分析 4.1 指标描述 4.1.1 平均值和集中趋势 4.1.2 正态分布 4.1.3 频数分析 4.1.4 描述性分析指标 4.2 异常点监控 4.2.1 概述 4.2.2 P控制图:监控转化率型指标 4.2.3 单值-均值控制图 4.2.4 单值-移动极差控制图 4.3 连续型指标的对比 4.3.1 数据变换 4.3.2 假设检验 4.3.3 相同指标内的两组数对比:T检验 4.3.4 相同指标内的多组数据对比:单因素方差分析 4.3.5 单因素协方差分析 4.4 分类型指标的对比 4.4.1 列联表分析 4.4.2 卡方独立性检验 第5章 时间序列分析 5.1 时间序列 5.2 增长率 5.2.1 环比增长率 5.2.2 同比增长率 5.3 移动平均 5.3.1 数学原理概述 5.3.2 filter函数 5.3.3 R语言实现 5.4 指数平滑 5.4.1 一次指数平滑 5.4.2 二次指数平滑 5.4.3 三次指数平滑 5.5 ARIMA模型 5.5.1 自相关性 5.5.2 平稳性和白噪声 5.5.3 MA滑动平均过程 5.5.4 AR自回归过程 5.5.5 ARMA自回归滑动平均混合过程 5.5.6 检验模型质量 5.5.7 非平稳时间序列的ARIMA过程 第6章 连续指标建模:回归分析 6.1 一元线性回归分析 6.1.1 引例 6.1.2 一元线性回归分析的原理及R语言实现 6.2 多元回归分析 6.2.1 引例 6.2.2 多元线性回归分析建模 6.2.3 模型修正函数update() 6.2.4 逐步回归分析函数step() 6.2.5 自变量中包含分类型数据的回归分析 6.3 Logic回归分析 6.3.1 引例及数据 6.3.2 logic分析的原理 6.3.3 R语言实现 6.4 回归树CART 6.4.1 rpart函数 6.4.2 预测及模型性能衡量 6.4.3 过度拟合和剪枝 第7章 分类指标建模:分类分析 7.1 决策树分类分析 7.1.1 概述 7.1.2 C4.5算法 7.1.3 CART算法 7.1.4 条件推理决策树算法 7.1.5 随机森林算法 7.2 贝叶斯分类 7.2.1 贝叶斯定理 7.2.2 朴素贝叶斯分类器 7.3 支持向量机SVM 7.3.1 原理 7.3.2 在R语言中实现非线性SVM分析 7.4 人工神经网络 7.4.1 神经元 7.4.2 两层网络 7.4.3 反向传播算法 7.4.4 R语言实现 7.4.5 隐藏层中神经单元数目的确定 7.5 分类器的性能评估 7.5.1 混淆矩阵 7.5.2 ROC曲线和AUC 7.5.3 提升度和提升曲线 7.5.4 洛伦兹曲线 第8章 样本细分 8.1 数据降维 8.1.1 问题引入 8.1.2 因子分析概述 8.1.3 factanal函数 8.1.4 实例:问卷调查的因子分析 8.2 聚类分析 8.2.1 距离 8.2.2 层次聚类 8.2.3 kmeans聚类 8.3 样本判别 8.3.1 knn(k最近邻分类)算法 8.3.2 实例:基于knn算法的商品推荐系统 第9章 样本间的关系 9.1 关联分析 9.1.1 关联分析的原理 9.1.2 Apriori算法的R语言实现 9.2 序列模式关联分析 9.2.1 序列模式关联分析的原理 9.2.2 序列模式关联分析的R语言实现 9.2.3 实例:用户点击页面的行为分析 9.3 关系网络分析 9.3.1 网络关系分析的基本概念 9.3.2 中心度 9.3.3 中心势 9.3.4 社群发现 9.3.5 实例:分析微博的传播特性 9.3.6 实例:购物车商品分类分析 第10章 文本分析 10.1 数据处理 10.1.1 数据引例 10.1.2 分词和词条 10.1.3 语料库和文档 10.1.4 词条-文档关系矩阵 10.2 实例:QQ群消息历史分析 10.2.1 数据集 10.2.2 数据集格式转化 10.2.3 留言文本的分词操作 10.2.4 分析常用话题词汇 10.2.5 建立用户-词条间的网络关系图 10.2.6 绘制重点词条和用户的网络图 10.3 XML包爬取网页数据 10.3.1 htmlParse函数 10.3.2 getNodeSet函数 10.3.3 xmlValue函数 10.3.4 xmlGetAttr函数 10.3.5 实例:爬取某电商网站衬衫类目商品的部分信息 第11章 网站指标监控系统的搭建 11.1 gWidgets包基础 11.1.1 环境搭建 11.1.2 引例 11.1.3 常用控件 11.2 实例:商品搜索算法参数配置监控GUI系统 11.2.1 商品搜索算法概述 11.2.2 原始商品信息 11.2.3 系统概述 11.2.4 模块布局 11.2.5 计算除关键字匹配以外的指标得分 11.2.6 模拟一次搜索行为数据 11.2.7 模拟多次搜索行为数据 11.2.8 绘图 第12章 基于RFM模型的客户价值系统 12.1 马尔科夫链 12.1.1 引例 12.1.2 概念 12.1.3 预测实例 12.2 RFM模型 12.2.1 RFM的概念 12.2.2 数据集 12.2.3 购买行为随机模型 12.3 结合马尔科夫链的RFM模型 12.3.1 购买状态转移矩阵 12.3.2 预测用户购买状态
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
同类热门
类似软件
inventor2021简体中文语言包64位50.1M370人在用inventor2021简体中文语言包是针对inventor professional 2021软件而开发的简体中文补丁包,是从autodesk公司官方下载的,能够将英文的软件更换成简体中文,从而帮助中国用户更好的使用软件,再配合软件包中的破解补丁一起使
查看r语言数据分析与挖掘实战41.88M341人在用r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程和数据
查看热门标签
网友评论0人参与,0条评论
最新排行
民法典正式全文电子版966K 《中华人民共和国民法典》它被称为「社会生活的百科全书」,这是新中国成立以来第一部以“法典”命名的法律,并将于2021年1月1日正式实施,但很多网友都不知道在哪里学习。为此今天小编给大家带来了民法典正式全文电子版,这是专为广大网友而提供的一款方便阅读
查看塞尔达传说荒野之息大师之书pdf60.32M《<塞尔达传说:旷野之息>大师之书》是一本非常有诚意的任天堂官方设定集。它是任天堂为了纪念《塞尔达传说》系列诞生30周年而出版的设定书,这本书中的内容更专注于《旷野之息》这不近年来最为国内玩家所熟知的作品,本书中文版由读库.御宅学引进,全书一
查看C#2012数据库编程入门经典(第5版)87.4Mpdf扫描版C#2012数据库编程入门经典(第5版)是一本C#数据库编程入门书籍,由[美]阿加瓦尔Vidya,Vrat Agarwal著,沈刚,谭明红共同翻译。全书就是一本帮助具有C#语言基础的程序员快速掌握数据库编程知识的指南,包括了使用SQL Server 20
查看C#项目开发实战密码146.78M扶松柏pdf扫描版 C#项目开发实战密码是一本C#语言的实战指导学习书籍,由扶松柏编著。本书内容十分丰富,每一章都采用了一个实例,并用这些实例的具体实现流程来教学。在具体讲解每个实例时,都遵循项目的进度来展开,从接到项目到具体开发,直到最后的调试和发布。内容循序渐进,
查看android ui基础教程 中文版73.87M奥斯特兰德 pdf扫描版 android ui基础教程是一本android UI入门教程,由美国移动软件开发者奥斯特兰德jason Ostrander编著。本书详细介绍了android ui的知识点,拥有丰富的图示说明,以及清晰实用的示例。作者以Android编程专家的身份
查看矛与盾黑客攻防命令大曝光71.82Mpdf扫描版 矛与盾黑客攻防命令大曝光是一本详细讲述了黑客攻防命令的学习书籍,全书采用通俗易懂的图文解说,即使你是一个电脑新手也依然可以通读全书,其任务驱动式的黑客软件讲解,揭秘每一种黑客攻击的手法,盘点最新的黑客技术,让你轻松学会攻防护渗的防御方法,全面的保证
查看实战SEO实用技法与案例剖析69.23M藏锋者扫描版实战SEO:实用技法与案例剖析是一本搜索引擎优化技术指导手册,由藏锋者、崔旭、郝永清三人共同编著。本书脉络清晰,由浅到深,从网站策划、准备、运维、分析的全方面讲解了网站优化的流程和技巧,手把手教你如何去选择网站类型、建站、优化网站,即使你是一个seo小白
查看深入react技术栈pdf9.18M陈屹高清扫描版React就目前前端工程化最前沿的技术,如何才能更好的学习React呢?小编这里推荐用户阅读深入React技术栈,这是一本全面深入讲述React技术栈的原创图书,由阿里巴巴前端架构师陈屹编著。本书深入全面的讲述了React技术栈的发展历程和使用方法,知识
查看iPhone游戏开发实践指南36.52M戴利pdf扫描版 iPhone游戏开发实践指南是一本iphone游戏开发实践手册,由美国iphone开发程序员戴利编著。本书是新手的完美入门手册。作者将带领你走过开发iPhone热门二维游戏的每个细节。在本书中,你将学习如何构建二维贴图地图游戏Sir Lamorak
查看SEO实战指导知识策略案例42.68M扫描版 seo又叫做搜索引擎优化,由搜索引擎和优化两个部分组成,其中搜索引擎是平台,而优化是动作。如何更好的学习seo呢?这里小编带来了SEO实战指导知识策略案例,这是一本搜索引擎优化(SEO)百科全书,由藏锋者、郝永清编著。本书采用案例引导加实际操作详细
查看