图书介绍
中文信息处理教程PDF|Epub|txt|kindle电子书版本网盘下载
![中文信息处理教程](https://www.shukui.net/cover/4/30797286.jpg)
- 宋继华,王强军,杨尔弘编著 著
- 出版社: 北京:高等教育出版社
- ISBN:7040318968
- 出版时间:2011
- 标注页数:283页
- 文件大小:33MB
- 文件页数:294页
- 主题词:
PDF下载
下载说明
中文信息处理教程PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 导论1
本章概览1
知识结构图1
1.1 基本概念1
1.1.1 学科由来1
1.1.2 学科定位2
1.2 研究内容3
1.3 难点分析4
1.3.1 歧义4
1.3.2 语法5
1.4 研究路线6
1.5 习题7
第2章 汉字的信息处理9
本章概览9
知识结构图9
2.1 基础知识10
2.1.1 汉字的形、音、义10
2.1.2 汉字的字频和字量11
2.1.3 汉字的编码12
2.2 交换码和内码13
2.2.1 ASCII13
2.2.2 编码框架:ISO/IEC 202214
2.2.3 GB231217
2.2.4 BIG519
2.2.5 ISO/IEC10646和Unicode21
2.2.6 GBK24
2.2.7 GB1803025
2.2.8 编程务实27
2.3 汉字的输入34
2.3.1 键盘输入35
2.3.2 字形识别37
2.3.3 语音识别40
2.4 汉字的输出41
2.5 中文编码的前沿课题44
2.5.1 古籍数字化44
2.5.2 《通用规范汉字表》45
2.5.3 少数民族文字46
2.6 习题47
第3章 词的信息处理48
本章概览48
知识结构图48
3.1 基础知识49
3.1.1 概率论基础49
3.1.2 信息论基础50
3.1.3 n元语法模型55
3.1.4 语法模型的性能评价56
3.2 自动分词57
3.2.1 汉语词的界定57
3.2.2 自动分词方法59
3.2.3 未登录词的识别67
3.3 词性标注76
3.3.1 词性标注概述76
3.3.2 基于统计的词性标注方法77
3.3.3 基于规则的词性标注方法81
3.4 命名实体识别84
3.4.1 命名实体识别介绍84
3.4.2 中文命名实体的定义和标准86
3.4.3 中文命名实体识别方法88
3.5 习题92
第4章 句子的信息处理93
本章概览93
知识结构图93
4.1 形式语言基础94
4.1.1 形式语言理论94
4.1.2 自动机理论97
4.2 短语结构语法100
4.2.1 汉语短语结构语法101
4.2.2 分析算法101
4.2.3 实用策略119
4.3 依存语法122
4.3.1 依存句法理论122
4.3.2 分析算法124
4.4 句法理论探索130
4.4.1 Chomsky语法理论130
4.4.2 广义短语结构语法134
4.4.3 链语法136
4.4.4 范畴语法137
4.5 习题139
第5章 句子语义表达与分析140
本章概览140
知识结构图140
5.1 格语法140
5.1.1 基本思想141
5.1.2 格的分类143
5.1.3 格的判断145
5.1.4 用格语法生成句子147
5.1.5 汉语格语法148
5.2 概念依存理论151
5.2.1 基本模型151
5.2.2 语义推理155
5.2.3 脚本法156
5.3 概念层次网络(HNC)159
5.4 语义本体162
5.5 习题166
第6章 中文信息处理的基础资源168
本章概览168
知识结构图168
6.1 语料库概述169
6.1.1 语料库发展历史170
6.1.2 语料库属性176
6.2 典型中文语科库介绍178
6.2.1 北京大学计算语言学研究所《人民日报》标注语料库178
6.2.2 清华大学汉语树库179
6.2.3 哈尔滨工业大学汉语依存树库183
6.2.4 中国台湾“中央研究院”语料库185
6.2.5 国家语言文字工作委员会语料库189
6.2.6 山西大学语料库190
6.3 典型中文语言知识库资源介绍192
6.3.1 北京大学计算语言学研究所综合型语言知识库192
6.3.2 知网200
6.3.3 中国台湾“中央研究院”中文词汇网络204
6.3.4 概念层次网络207
6.3.5 汉语框架网知识库208
6.4 中文语言资源联盟211
6.5 习题212
第7章 文本分析与处理213
本章概览213
知识结构图213
7.1 文本分类214
7.1.1 文本表示214
7.1.2 文本分类算法220
7.2 信息检索225
7.2.1 常用的检索模型226
7.2.2 搜索引擎227
7.3 问答系统233
7.3.1 问答系统概述233
7.3.2 系统构成234
7.3.3 典型问答系统介绍236
7.4 信息抽取238
7.4.1 信息抽取概述238
7.4.2 系统的基本构成及关键技术239
7.5 自动文摘241
7.5.1 自动文摘概述241
7.5.2 基于统计的机械文摘242
7.5.3 基于意义的理解文摘243
7.6 习题243
第8章 中文信息处理评测245
本章概览245
知识结构图245
8.1 评测概述246
8.1.1 评测的意义246
8.1.2 评测的过程246
8.2 系列评测介绍247
8.2.1 NIST系列评测247
8.2.2 ACL-SIGHAN系列评测249
8.2.3 863技术测评249
8.2.4 中文信息学会评测250
8.3 各领域技术评测介绍250
8.3.1 中文分词和词性标注评测250
8.3.2 词义消歧评测255
8.3.3 句法分析评测260
8.3.4 文本分类器性能评估262
8.3.5 信息检索系统的评测263
8.3.6 问答系统评测265
8.3.7 信息抽取评测267
8.3.8 自动文摘评测270
8.4 习题271
部分习题参考答案272
参考文献281