图书介绍

R语言数据分析PDF|Epub|txt|kindle电子书版本网盘下载

R语言数据分析
  • (美)盖尔盖伊·道罗齐(Gergely Daroczi)著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111547952
  • 出版时间:2016
  • 标注页数:280页
  • 文件大小:73MB
  • 文件页数:294页
  • 主题词:程序语言-程序设计;数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

R语言数据分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 你好,数据!1

1.1 导入一个大小合适的文本文件2

1.2 文本文件编译测试平台5

1.3 导入文本文件的子集6

1.4 从数据库中导入数据8

1.4.1 搭建测试环境9

1.4.2 MySQL和MariaDB11

1.4.3 PostgreSQL15

1.4.4 Oracle数据库17

1.4.5 访问ODBC数据库22

1.4.6 使用图形化用户面连接数据库23

1.4.7 其他数据库后台24

1.5 从其他统计系统导入数据25

1.6 导入Excel电子表格26

1.7 小结26

第2章 从Web获取数据28

2.1 从Internet导入数据集29

2.2 其他流行的在线数据格式32

2.3 从HTML表中读取数据37

2.4 从其他在线来源获取数据39

2.5 使用R包与数据源API交互42

2.5.1 Socrata的开源数据API43

2.5.2 金融API44

2.5.3 使用Quandl获取时序数据45

2.5.4 Google文档和统计数据46

2.5.5 在线搜索的发展趋势47

2.5.6 天气历史数据48

2.5.7 其他在线数据源49

2.6 小结49

第3章 数据筛选和汇总50

3.1 去掉多余的数据50

3.1.1 快速去掉多余数据52

3.1.2 快速去掉多余数据的其他方法53

3.2 聚集54

3.2.1 使用基础的R命令实现快速聚集55

3.2.2 方便的辅助函数56

3.2.3 高性能的辅助函数57

3.2.4 使用data.table完成聚集59

3.3 测试59

3.4 汇总函数62

3.5 小结64

第4章 数据重构65

4.1 矩阵转置65

4.2 基于字符串匹配实现数据筛选66

4.3 数据重排序67

4.4 dplyr包和data.table包的比较70

4.5 创建新变量70

4.5.1 内存使用分析71

4.5.2 同时创建多个变量72

4.5.3 采用dplyr包生成新变量73

4.6 数据集合并74

4.7 灵活地实现数据整形76

4.7.1 将宽表转换为长表77

4.7.2 将长表转换为宽表78

4.7.3 性能调整80

4.8 reshape包的演变80

4.9 小结81

第5章 建模82

5.1 多元模型的由来83

5.2 线性回归及连续预测变量83

5.2.1 模型解释83

5.2.2 多元预测85

5.3 模型假定87

5.4 回归线的拟合效果90

5.5 离散预测变量92

5.6 小结95

第6章 线性趋势直线外的知识96

6.1 工作流建模96

6.2 逻辑回归97

6.2.1 数据思考100

6.2.2 模型拟合的好处101

6.2.3 模型比较102

6.3 计数模型102

6.3.1 泊松回归103

6.3.2 负二项回归107

6.3.3 多元非线性模型107

6.4 小结115

第7章 非结构化数据116

7.1 导入语料库116

7.2 清洗语料库118

7.3 展示语料库的高频词121

7.4 深度清洗121

7.4.1 词干提取122

7.4.2 词形还原124

7.5 词条关联说明124

7.6 其他一些度量125

7.7 文档分段126

7.8 小结128

第8章 数据平滑129

8.1 缺失值的类型和来源129

8.2 确定缺失值130

8.3 忽略缺失值131

8.4 去掉缺失值134

8.5 在分析前或分析中筛选缺失值136

8.6 填补缺失值136

8.6.1 缺失值建模138

8.6.2 不同填补方法的比较140

8.6.3 不处理缺失值141

8.6.4 多重填补141

8.7 异常值和孤立点141

8.8 使用模糊方法144

8.9 小结146

第9章 从大数据到小数据147

9.1 充分性测试148

9.1.1 正态性148

9.1.2 多元变量正态性149

9.1.3 变量间的依赖关系152

9.1.4 KMO和Barlett检验154

9.2 主成分分析157

9.2.1 PCA算法158

9.2.2 确定成分数159

9.2.3 成分解释161

9.2.4 旋转方法164

9.2.5 使用PCA检测孤立点167

9.3 因子分析170

9.4 主成分分析和因子分析172

9.5 多维尺度分析173

9.6 小结176

第10章 分类和聚类177

10.1 聚类分析178

10.1.1 层次聚类178

10.1.2 确定簇的理想个数181

10.1.3 k均值聚类183

10.1.4 可视化聚类185

10.2 潜类别模型186

10.2.1 潜类别分析187

10.2.2 LCR模型189

10.3 判别分析189

10.4 逻辑回归192

10.5 机器学习算法194

10.5.1 k近邻算法195

10.5.2 分类树197

10.5.3 随机森林200

10.5.4 其他算法201

10.6 小结203

第11章 基于R的社会网络分析204

11.1 装载网络数据204

11.2 网络中心性度量206

11.3 网络数据的展现207

11.3.1 交互网络图210

11.3.2 绘制层次图211

11.3.3 使用R包来解释包的依赖关系212

11.4 更多网络分析资源212

11.5 小结213

第12章 时序数据分析214

12.1 创建时序对象214

12.2 展现时序数据215

12.3 季节性分解217

12.4 Holt-Winters筛选218

12.5 自回归积分滑动平均模型220

12.6 孤立点检测221

12.7 更复杂的时序对象224

12.8 高级时序数据分析225

12.9 小结225

第13章 我们身边的数据226

13.1 地理编码226

13.2 在空间中展示数据点228

13.3 找出数据点的多边形重叠区域230

13.4 绘制主题图232

13.5 围绕数据点绘制多边形233

13.5.1 等高线234

13.5.2 冯洛诺伊图236

13.6 卫星图237

13.7 交互图238

13.7.1 查询Google地图238

13.7.2 Java脚本地图库240

13.8 其他绘图方法242

13.9 空间数据分析244

13.10 小结246

第14章 分析R社区247

14.1 R创始团队的成员247

14.2 R开发包的维护入员249

14.3 R-help邮件列表253

14.3.1 R-help邮件列表的规模256

14.3.2 预测未来的邮件规模258

14.4 分析用户列表的重叠部分260

14.5 社交媒体内的R用户数262

14.6 社交媒体中与R相关的贴子263

14.7 小结266

附录267

热门推荐