图书介绍
高等院校研究生用书 复杂数据统计方法 基于R的应用PDF|Epub|txt|kindle电子书版本网盘下载
![高等院校研究生用书 复杂数据统计方法 基于R的应用](https://www.shukui.net/cover/29/30923246.jpg)
- 吴喜之编著 著
- 出版社: 北京:中国人民大学出版社
- ISBN:9787300215945
- 出版时间:2015
- 标注页数:315页
- 文件大小:48MB
- 文件页数:332页
- 主题词:统计分析-应用软件-研究生-教材
PDF下载
下载说明
高等院校研究生用书 复杂数据统计方法 基于R的应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 引言1
1.1作为科学的统计1
1.2数据分析的实践3
1.3数据的形式以及可能用到的模型4
1.3.1横截面数据:因变量为实轴上的数量变量5
1.3.2横截面数据:因变量为分类变量、频数或定序变量5
1.3.3纵向数据、多水平数据、面板数据、重复观测数据5
1.3.4多元数据各变量之间的关系:多元分析6
1.3.5抽样调查数据中垃圾比例的计算6
1.3.6路径模型/结构方程模型6
1.3.7贝叶斯网络7
1.3.8多元时间序列数据7
1.4 R软件入门7
1.4.1简介7
1.4.2安装和运行小贴士8
1.4.3动手9
1.5国内统计教学(课本)的若干误区10
1.5.1假设检验的误区:不能拒绝就接受10
1.5.2假设检验的误区:p值小于0.05就显著11
1.5.3置信区间的误区12
1.5.4最小二乘线性回归中的误区12
1.5.5样本量是多少才算大样本15
1.5.6用31个省、直辖市、自治区数据能做什么16
1.5.7汇总数据(比如部分均值)和原始观测值的区别16
第二章 横截面数据回归:经典方法18
2.1简单回归回顾18
2.1.1对例2.1数据的简单拟合19
2.1.2对例2.1数据的进一步分析20
2.1.3对简单线性回归的一些讨论23
2.1.4损失函数及分位数回归简介24
2.2简单线性模型中的指数变换27
2.3生存分析数据的Cox回归模型31
2.4数据出现多重共线性情况:岭回归、lasso回归、适应性lasso回归、偏最小二乘回归34
2.4.1岭回归35
2.4.2 lasso回归36
2.4.3适应性lasso回归38
2.4.4偏最小二乘回归39
第三章 横截面数据回归:机器学习方法41
3.1没有任何先验假定的数据:机器学习回归方法41
3.2决策树回归(回归树)43
3.2.1拟合全部数据43
3.2.2交叉验证45
3.3 boosting回归46
3.4 bagging回归47
3.5随机森林回归48
3.6支持向量机回归49
3.6.1 SVM49
3.6.2 SVR49
3.6.3交叉验证50
3.7人工神经网络回归51
3.7.1确定合适的隐藏层节点数目52
3.7.2交叉验证53
3.8 10折交叉验证结果汇总及方法稳定性讨论54
第四章 横截面数据分类:经典方法57
4.1 logistic回归和probit回归57
4.1.1广义线性模型简单回顾57
4.1.2脊柱数据例子58
4.1.3 logistic回归59
4.1.4 probit回归63
4.2经典判别分析64
4.2.1关于例4.1 column.2C.csv数据的两分类判别65
4.2.2例4.1 column.2C.csv数据两分类判别诸方法的10折交叉验证结果66
4.2.3关于例4.1 column.3C.csv数据的三分类判别68
4.2.4关于例4.1 column.3C.csv数据的三分类判别的三种方法的10折交叉验证结果70
第五章 横截面数据分类:机器学习方法72
5.1对变量没有任何限制:机器学习分类方法72
5.1.1概论和例子72
5.1.2产生交叉验证数据集72
5.2决策树分类(分类树)74
5.2.1拟合全部数据74
5.2.2交叉验证76
5.3 adaboost分类76
5.3.1拟合全部数据77
5.3.2交叉验证79
5.4 bagging分类80
5.4.1拟合全部数据80
5.4.2交叉验证81
5.5随机森林分类82
5.5.1拟合全部数据82
5.5.2交叉验证85
5.6支持向量机分类85
5.6.1拟合全部数据85
5.6.2交叉验证86
5.7最近邻方法分类87
5.8神经网络分类88
5.8.1拟合88
5.8.2神经网络对于不同参数的拟合效果分析89
5.9分类方法10折交叉验证结果汇总90
第六章 横截面数据:计数或有序因变量92
6.1概要和例子92
6.2经典的Poisson对数线性模型回顾93
6.3使用Poisson对数线性模型时的散布问题95
6.4零膨胀时的Poisson回归98
6.5用机器学习的算法模型拟合计数因变量数据101
6.5.1随机森林拟合例6.1数据的10折交叉验证101
6.5.2决策树(回归树)拟合例6.1数据的10折交叉验证101
6.5.3支持向量机拟合例6.1数据的10折交叉验证102
6.5.4各种方法拟合例6.1数据的10折交叉验证结果比较和一些讨论102
6.6多项logit模型及多项分布对数线性模型回顾104
6.6.1多项logit模型回顾104
6.6.2多项分布对数线性模型回顾107
6.7有序变量的比例优势模型110
第七章纵 向数据(多水平模型、面板数据)119
7.1线性随机效应混合模型121
7.2广义线性随机效应混合模型125
7.3决策树及随机效应模型127
7.4纵向生存数据分析130
7.4.1 Cox随机效应混合模型130
7.4.2分步联合建模134
7.5计量经济学家的视角:面板数据141
第八章 多元分析147
8.1实数轴上的数据:经典多元分析内容回顾147
8.1.1主成分分析及因子分析147
8.1.2分层聚类及k均值聚类156
8.1.3典型相关分析164
8.1.4对应分析168
8.2非经典多元数据分析:可视化171
8.2.1主成分分析173
8.2.2对应分析174
8.2.3多重对应分析175
8.2.4多重因子分析176
8.2.5分层多重因子分析178
8.2.6基于主成分分析的分层聚类179
第九章 多元数据的关联规则分析181
9.1问题的提出181
9.2数据的初步处理182
9.3一些基本概念183
9.4频数和规则185
第十章调查数据中垃圾比例的计算188
10.1动机188
10.2我们的着眼点在于数据本身189
10.3解剖一个数据190
10.4计算例10.1Income2000.csv数据中各种比例及置信区间193
10.4.1一些计算准备工作193
10.4.2主要函数194
10.4.3更多的计算196
10.5通过一个简单人造数值例子解释本章代码的意义201
第十一章 路径建模(结构方程建模)数据的PLS分析207
11.1路径模型概述207
11.1.1路径模型207
11.1.2路径模型的两种主要方法208
11.2 PLS方法:顾客满意度的例子210
11.3协方差方法简介215
11.4结构方程模型的一些问题222
第十二章贝叶斯网络224
12.1引言224
12.2贝叶斯网络涉及的一些基本概念227
12.2.1贝叶斯网络227
12.2.2贝叶斯网络中的条件独立性概念227
12.3通过贝叶斯网络做推断229
12.4学习贝叶斯网络231
12.4.1网络学习算法的种类231
12.4.2几种可能面对的问题232
12.5贝叶斯网络的数值例子及计算236
12.5.1全部变量是离散变量的情况236
12.5.2全部变量是连续变量的情况240
12.5.3连续变量和离散变量混合的情况241
第十三章 多元时间序列数据245
13.1时间序列的基本概念及单变量时间序列方法的回顾245
13.1.1时间序列的一些定义和基本概念245
13.1.2常用的一元时间序列方法252
13.2单位根检验、协整检验及Granger因果检验262
13.2.1概述262
13.2.2单位根检验264
13.2.3协整检验266
13.2.4 Granger因果检验272
13.3 VAR模型、VARX模型与状态空间模型273
13.3.1 VAR模型的拟合与预测273
13.3.2 VARX模型的拟合与预测276
13.3.3状态空间模型的拟合与预测278
13.3.4模型的比较280
13.4非线性时间序列283
13.4.1引言283
13.4.2线性AR模型285
13.4.3自门限自回归模型286
13.4.4 Logistic平滑过渡自回归模型290
13.4.5神经网络模型293
13.4.6可加AR模型294
13.4.7模型的比较294
13.4.8门限协整295
附录练习:熟练使用R软件300
参考文献309