
作者:黄水清,王东波著
页数:470页
出版社:南京大学出版社
出版日期:2023
ISBN:9787305271489
高清校对版pdf(带目录)
前往页尾底部查看PDF电子书
内容简介
本书共分十一章,主要内容包括:绪论;语料库研究及国内语料库的建设与发展;NEPD语料库构建及测评;NEPD语料句长与词汇分布;面向NEPD语料的分词歧义分析;面向NEPD语料的深度学习分词模型构建等。
作者简介
黄水清,南京农业大学信息管理学院二级教授、博导,江苏省“333高层次人才培养工程”第二层次培养对象。主持国家社科基金重大和重点项目。获教育部、江苏省科技进步二等奖、江苏省哲社优秀成果一等奖。研究方向为文本信息计量等。
王东波,南京农业大学教授,博导。主持国家自然科学基金、国家社科基金重大项目。江苏省“333高层次人才培养工程”第三层次培养对象。研究方向为知识管理与知识发现。
目录
1.1国内语料库研究的定量分析
1.1.1发文量和发文时间
1.2语料库的研究内容
1.3国内代表性的语料库介绍
1.4结语
第2章新时代人民日报语料库构建及测评
2.1汉语分词语料及分词模型现状
2.2语料获取及预处理
2.3语料标注及规范
2.4新时代人民日报分词语料分词实验及性能测评
2.5结语
第3章新时代人民日报语料句长与词汇分布
3.1句长与词汇分布相关研究
3.2字维度上的句长分布
3.3词维度上的句长分布
3.4词分布上的齐普夫定律验证
3.5结语
第4章面向新时代人民日报语料的中文分词歧义分析
4.1中文分词歧义研究现状
4.2分词结果统计分析
4.3结语
第5章面向新时代人民日报语料的深度学习分词模型构建
5.1深度学习汉语自动分词研究现状
5.2自动分词深度学习模型介绍
5.3深度学习分词模型性能分析
5.4结语
第6章面向新时代人民日报语料的关键词抽取及分析
6.1关键词抽取研究现状
6.2关键词抽取算法对比介绍
6.3实验流程与语料信息
6.4实验结果分析
6.5结语
第7章面向新时代人民日报语料的新闻自动摘要生成
7.1文本自动摘要相关研究
7.2算法模型介绍
7.3面向人民日报语料的新闻自动摘要生成实验
7.4实验结果评价与分析
7.5结语
第8章面向新时代人民日报语料的长文本自动分类研究
8.1中文新闻文本自动分类相关研究
8.2语料与模型介绍
8.3实验环境与过程
8.4实验结果对比分析
8.5结语
参考文献
附录
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.xiazainiu.com/Wd1qk_5_20727.html