图书介绍
拥抱大数据 新常态下的数据分析典型案例PDF|Epub|txt|kindle电子书版本网盘下载
- 李倩青,王震著 著
- 出版社: 广州:广东经济出版社
- ISBN:9787545441178
- 出版时间:2015
- 标注页数:192页
- 文件大小:80MB
- 文件页数:206页
- 主题词:数据处理
PDF下载
下载说明
拥抱大数据 新常态下的数据分析典型案例PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 为什么市场需要数据分析师1
1.1 大数据的前世今生2
1.2 大数据的具体定义4
1.3 数据分析行业现状及巨大缺口6
第二章 什么是数据分析师9
2.1 明确两个概念10
2.2 从四份招聘简历说起11
2.2.1 第一份招聘简历要求11
2.2.2 第二份招聘简历要求12
2.2.3 第三份招聘简历要求12
2.2.4 第四份招聘简历要求13
2.3 数据分析师常见专业出身14
2.3.1 数学与应用数学、统计学专业14
2.3.2 经济管理类专业16
2.3.3 计算机理论类专业18
2.3.4 计算机应用类专业20
2.3.5 其他专业21
2.4 数据分析师可从事行业22
2.4.1 互联网行业22
2.4.2 制造行业23
2.4.3 投资分析行业23
2.4.4 咨询行业24
2.4.5 其他类公司综述24
第三章 如何成为数据分析师25
3.1 数据分析师基础知识储备26
3.1.1 基础统计知识26
3.1.2 基础的数据库知识27
3.1.3 Office办公软件和专业数据分析工具27
3.1.4 基础算法编程知识28
3.1.5 业务知识29
3.1.6 一些数据分析经验29
3.1.7 小结30
3.2 数据分析师常用工具盘点31
3.2.1 Excel31
3.2.2 SPSS32
3.2.3 STATA32
3.2.4 Eviews33
3.2.5 SAS33
3.2.6 Matlab33
3.2.7 R34
3.2.8 小结34
3.3 数据分析师应该学习的网络课程35
3.3.1 MOOC类课程35
3.3.2 网上学习平台37
3.3.3 现场培训班38
第四章 描述性统计分析39
4.1 频数分布分析:用统计图解决伦敦霍乱40
4.1.1 可怕的英国霍乱40
4.1.2 约翰医生的实地调查41
4.1.3 对伦敦霍乱平息过程的分析43
4.1.4 频数分布分析总结44
4.2 关注数据代表性:统计学家改良轰炸机45
4.2.1 “二战”盟国轰炸德国伤亡惨重45
4.2.2 轰炸机的返航率得到提高46
4.2.3 对轰炸机改进过程的分析48
4.2.4 数据代表性总结49
4.3 异常值分析:1号店提升营销精准率50
4.3.1 1号店的数据分析案例50
4.3.2 1号店数据分析过程51
4.3.3 异常值分析总结54
4.4 对比分析:刻画豆瓣变现具体压力55
4.4.1 豆瓣变现的难题55
4.4.2 豆瓣变现的具体压力56
4.4.3 对比分析总结59
4.5 描述性统计分析概述:淘宝箱店类目分析60
4.5.1 淘宝箱店类目背景60
4.5.2 箱店类目分析实解61
4.5.3 描述性统计分析小结63
第五章 相关分析与回归分析65
5.1 相关分析与回归分析基础66
5.2 矩阵分解:价值百万美元的Netfilx推荐系统67
5.2.1 Netfilx为推荐系统悬赏百万美元68
5.2.2 构建一个推荐系统69
5.2.3 矩阵分解小结71
5.3 一元线性回归:引发金融危机的风险价值模型72
5.3.1 广受欢迎的风险价值模型72
5.3.2 评估一个理财产品的风险74
5.3.3 一元线性回归小结77
5.4 评分系统:星巴克选址借力大数据77
5.4.1 越来越难以选择的快餐店地址78
5.4.2 多元线性回归与评分系统79
5.4.3 评分系统小结81
5.5 相关分析与回归分析概述:奥巴马使用大数据赢得大选82
5.5.1 神奇的Survey Manager系统82
5.5.2 美国大选详细解读84
5.5.3 相关分析与回归分析总结87
第六章 关联分析与聚类分析89
6.1 关联分析与聚类分析基础90
6.2 购物篮分析:啤酒与尿布的经典案例92
6.2.1 沃尔玛超市里的啤酒与尿布92
6.2.2 购物篮分析案例实解93
6.2.3 购物篮分析小结96
6.3 序列模式挖掘:Web访问模式帮助电商优化网站97
6.3.1 我们为什么需要序列模式挖掘97
6.3.2 Web访问模式与优化网站98
6.3.3 序列模式挖掘小结101
6.4 快速聚类:大数据捧火《纸牌屋》102
6.4.1 大数据助Netfilx赌赢《纸牌屋》103
6.4.2 透视《纸牌屋》背后的大数据算法104
6.4.3 快速聚类小结107
6.5 层次聚类:人人网好友推荐的奥秘108
6.5.1 无处不在的好友推荐108
6.5.2 朴素的人人网好友推荐算法109
6.5.3 层次聚类与好友推荐小结112
6.6 关联分析与聚类分析综述:加州极客的聚类分析把妹法113
6.6.1 使用大数据寻找另一半113
6.6.2 分成七类的潜在女朋友115
6.6.3 关联分析与聚类分析小结118
第七章 决策树与模式识别119
7.1 C4.5 算法:电信客户流失预测120
7.1.1 电信客户的流失与预测120
7.1.2 使用信息熵建立决策树模型121
7.1.3 为一个决策树剪枝并解释其规则123
7.1.4 决策树小结125
7.2 RBF神经网络:“房价网”的二手房价格评估126
7.2.1 二手房价格评估的局限性127
7.2.2 RBF神经网络的构建与解释127
7.2.3 RBF神经网络小结131
7.3 贝叶斯分析:神奇的谷歌智能翻译132
7.3.1 世界第一的谷歌翻译133
7.3.2 贝叶斯分析和智能翻译应用134
7.3.3 贝叶斯分析小结137
7.4 支持向量机:应用广泛的手写识别与语音识别138
7.4.1 从阿里巴巴说起的模式识别138
7.4.2 解决了高维诅咒的支持向量机139
7.4.3 支持向量机小结142
7.5 判别分析:肯德基通过客户分类大幅提高营业额144
7.5.1 难以复制的肯德基APP营销模式144
7.5.2 用于分类的线性判别分析145
7.5.3 判别分析小结149
7.6 模式识别综述:日趋成熟的信用评分模型150
7.6.1 美国为限制信用评分模型立法150
7.6.2 用多种算法实现信用评分模型151
7.6.3 模式识别小结154
第八章 更多的数据挖掘算法157
8.1 核密度估计法:警务大数据预测犯罪158
8.1.1 《少数派报告》的现实版158
8.1.2 核密度估计法和圣克鲁兹市的犯罪地图159
8.1.3 核密度估计法小结162
8.2 Flu Trends:谷歌流感趋势算法帮助控制疫情164
8.2.1 谷歌流感趋势算法的成与败164
8.2.2 谷歌流感趋势算法与流感关联词165
8.2.3 以F1u Trends为代表的预测算法小结169
8.3 Aprori算法:透视美国国会投票模式170
8.3.1 以立法者自居的美国国会议员170
8.3.2 Apriori算法和关联分析171
8.3.3 国会投票模式小结175
8.4 SVD简化数据:IBM软件自动生成新菜谱176
8.4.1 IBM推出可生成无限食谱的APP176
8.4.2 SVD简化数据与综合计算177
8.4.3 创新菜谱软件小结180
8.5 大数据预测算法盘点:百度预测世界杯成功率81.8 %181
8.5.1 群英荟萃的绿茵场182
8.5.2 大数据预测算法模型大盘点183
8.5.3 大数据预测算法小结186
8.6 网络理论分析:西班牙球队的控球哲学187
8.6.1 独树一帜的西班牙球队控球哲学187
8.6.2 以网络理论分析为基础的聚类分析188
8.6.3 网络理论分析小结192