图书介绍
数据仓库与数据挖掘PDF|Epub|txt|kindle电子书版本网盘下载
![数据仓库与数据挖掘](https://www.shukui.net/cover/2/33168421.jpg)
- 安淑芝等编著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302106886
- 出版时间:2005
- 标注页数:207页
- 文件大小:23MB
- 文件页数:220页
- 主题词:数据库系统-高等学校-教材;数据采集-高等学校-教材
PDF下载
下载说明
数据仓库与数据挖掘PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1 初识数据挖掘1
1.1.1 数据挖掘的产生1
1.1.2 数据挖掘的应用价值1
目录1
1.2 初识数据仓库2
1.2.1 数据仓库的产生2
1.1.4 数据挖掘的定义2
1.1.3 数据挖掘的发展过程2
1.2.2 数据仓库的应用价值3
1.2.3 数据仓库的发展过程4
1.2.4 数据仓库的定义4
1.2.5 数据仓库与数据挖掘的关系4
1.3 进一步理解数据挖掘5
1.3.1 数据挖掘的功能5
1.3.2 数据挖掘常用技术6
1.3.3 数据挖掘的过程10
1.4.1 应用领域11
1.4 数据挖掘应用实例11
1.4.2 典型案例13
1.5 数据挖掘的发展趋势16
1.5.1 数据挖掘研究方向16
1.5.2 数据挖掘应用的热点16
小结17
习题17
第2章 数据仓库18
2.1 进一步深入理解数据仓库的定义18
2.1.1 数据仓库的数据是面向主题的19
2.1.2 数据仓库的数据是集成的22
2.1.3 数据仓库的数据是不可更新的22
2.1.4 数据仓库的数据是随时间不断变化的22
2.2 数据仓库的结构23
2.2.1 元数据23
2.2.2 粒度的概念26
2.2.3 分割问题27
2.2.4 数据仓库中的数据组织形式28
2.4 数据仓库的清理30
2.3 数据仓库的说明——标准手册30
2.5 数据仓库系统的设计31
2.5.1 数据仓库系统设计方法31
2.5.2 数据仓库设计的三级数据模型33
2.5.3 提高数据仓库的性能36
2.5.4 数据仓库设计步骤38
2.6 数据仓库数据的访问45
2.6.1 数据仓库数据的直接访问46
2.6.2 数据仓库数据的间接访问46
2.7 数据仓库的应用48
2.7.1 数据仓库的主要应用领域49
2.7.2 数据仓库应用实例49
小结52
习题52
3.1 数据预处理的目的53
3.1.1 原始数据中存在的问题53
第3章 数据预处理53
3.1.2 数据预处理的方法和功能54
3.2 数据清理54
3.2.1 处理空缺值55
3.2.2 噪声数据的处理56
3.3 数据集成和变换59
3.3.1 数据集成59
3.3.2 数据变换62
3.4.2 数据立方体聚集64
3.4.1 数据归约的方法64
3.4 数据归约64
3.4.3 维归约65
3.4.4 数据压缩67
3.4.5 数值归约67
3.4.6 离散化与概念分层生成70
小结75
习题76
4.1.2 广义知识的发现方法78
4.1.1 广义知识的概念78
4.1 广义知识78
第4章 数据挖掘发现知识的类型78
4.2 关联知识80
4.2.1 关联知识的概念80
4.2.2 关联知识的发现方法80
4.2.3 关联规则应用实例81
4.3 分类知识82
4.3.1 分类知识的概念82
4.3.2 分类知识的发现方法82
4.3.3 分类知识应用实例83
4.4 预测型知识84
4.4.1 预测型知识的概念84
4.4.2 预测型知识的发现方法84
4.4.3 预测型知识应用实例85
4.5 偏差型知识86
4.5.1 偏差型知识的概念86
4.5.2 偏差型知识的发现方法86
习题89
小结89
第5章 数据挖掘中常用算法90
5.1 神经网络算法90
5.1.1 神经网络的概念90
5.1.2 神经网络的计算机模型93
5.1.3 定义神经网络拓扑98
5.1.4 基于神经网络的算法99
5.2 使用候选项集找频繁项集(Apriori)算法101
5.2.1 关联规则的分类101
5.2.2 Apriori算法102
5.2.3 从频繁项集产生关联规则104
5.3 决策树算法104
5.3.1 信息论的基本原理104
5.3.2 ID3算法107
5.3.3 树剪枝111
5.3.4 由决策树提取分类规则112
5.4.1 聚类分析的概念113
5.4 聚类分析113
5.4.2 聚类分析中的数据类型115
5.4.3 几种主要的聚类分析方法120
5.4.4 聚类分析算法122
小结124
习题125
第6章 数据挖掘的工具及其应用126
6.1 SQL Server 2000数据挖掘工具应用126
6.1.1 安装要求126
6.1.2 安装过程127
6.1.3 Analysis Services功能介绍129
6.1.4 Analysis Services的优点129
6.1.5 创建数据挖掘模型130
6.1.6 查看和分析挖掘结果143
6.1.7 聚类模型149
6.2.1 安装SPSS Clementine151
6.2.2 SPSS Clementine 8.0工作环境介绍151
6.2 SPSS数据挖掘工具应用151
6.2.3 Clementine应用的结构152
6.2.4 Clementine的使用162
6.2.5 挖掘模型的建立和执行164
小结177
习题177
第7章 数据挖掘应用实例178
7.1 实例背景178
7.2.2 决策树的概念179
7.2.1 数据挖掘中的分类算法179
7.2 决策树算法179
7.3 实例开发181
7.3.1 实例开发前的准备181
7.3.2 实例的系统结构183
7.3.3 决策树算法模块184
7.3.4 算法的程序实现186
7.4 核心源程序192
小结206
参考文献207