
0人評分過此書
本书主要以《孟子》及《孟子注疏》《孟子集注》《孟子正义》等《孟子》相关注疏文献为资源,对比《论语》《左传》等先秦文献的研究,对《孟子》进行了较深层次的加工和处理,尝试探索出一条基于注疏文献的《孟子》自动分词、词性标注等信息处理的新方法、新思路,研究了《孟子》及其注疏文献的句子对齐和词语对齐,《孟子》的自动分词、词性标注、词义消歧,《孟子》及其注疏的文本特征和语言风格统计,《孟子》中的排比句自动识别等问题。
- 封面
- 版权
- 序
- 目录
-
引言
-
一、《孟子》及其注疏信息处理研究现状
-
(一)传统的《孟子》及其注疏的研究
-
(二)句子对齐技术研究
-
(三)自动分词研究
-
(四)词性标注研究
-
(五)词义消歧研究
-
(六)风格计算研究
-
(七)修辞格的识别
-
(八)余论
-
-
二、研究思路和研究内容
-
(一)研究思路
-
(二)研究内容
-
-
三、本书的结构安排
-
-
第一章 注疏对齐
-
一、注疏结构和注疏文献的作用
-
(一)注疏结构
-
(二)注疏文献的作用
-
-
二、注疏文献的平行对齐
-
(一)原文与引文句子对齐
-
(二)原文与引文注释对齐
-
-
三、本章小结
-
-
第二章 自动分词
-
一、先秦汉语分词规范
-
二、基于规则的自动分词方法
-
(一)最大匹配法简介
-
(二)词表介绍
-
(三)实验结果
-
-
三、基于统计模型的自动分词方法
-
(一)条件随机场模型
-
(二)CRFs分词原理
-
(三)基于CRFs的分词实验
-
-
四、利用注疏文献的自动分词方法
-
(一)利用注疏文献自动分词方法概述
-
(二)利用注疏文献自动分词实验
-
-
五、本章小结
-
-
第三章 词性标注
-
一、词性标记集的构建
-
(一)名词作状语
-
(二)其他词类活用作动词
-
(三)使动用法
-
(四)意动用法
-
(五)为动用法
-
-
二、基于条件随机场模型的词性标注
-
(一)CRFs自动词性标注原理
-
(二)基于CRFs的词性标注实验
-
(三)标注错误分析
-
-
三、利用注疏信息自动校正词性
-
(一)注疏文献中的词性提示信息
-
(二)利用去声信息的词性自动校正方法
-
(三)实验和分析
-
-
四、本章小结
-
-
第四章 词义消歧
-
一、词义消歧的概念和难点
-
(一)词义消歧的概念
-
(二)词义消歧的难点
-
-
二、词义消歧树算法消歧
-
(一)义项的划分
-
(二)上下文的有效范围
-
(三)消歧方法的设计
-
-
三、CRFs模型词义消歧
-
(一)特征的选择提取
-
(二)特征模板的构造
-
-
四、实验结果与分析
-
(一)实验的语料
-
(二)实验环境与测评指标
-
(三)两种消歧算法比较
-
-
五、本章小结
-
-
第五章 风格计算
-
一、文本特征及语言风格分析
-
(一)基于字的文本特征及语言风格统计
-
(二)基于词的文本特征及语言风格统计
-
(三)基于句子的文本特征及语言风格统计
-
-
二、排比句的自动识别
-
(一)排比句自动识别的算法设计
-
(二)实验及结果分析
-
-
三、本章小结
-
-
结 语
-
一、本研究的主要工作
-
二、进一步的研究计划
-
-
附 录
-
附录A:注疏文献中抽取出的去声字表
-
附录B:注疏文献中抽取出的反切字表
-
附录C:人工标注的《孟子》排比句
-
附录D:人工标注的《论语》排比句
-
- 参考文献
- 后记
- 出版地 : 中國大陸
- 語言 : 簡體中文
評分與評論
請登入後再留言與評分