0 引言
1 相关研究工作
2 汉语学习者依存句法树库构建
2.1 标注规范
2.2 数据选取
2.3 标注流程
2.3.1 语料预处理
2.3.2 语料标注
2.4 标注平台
1) 修改句子的分词错误和词性标签。
2) 标注依存弧及标签。
3) 对比多人标注结果。
3 标注数据分析
3.1 依存标签分布情况分析
1) 主干成分占比高。
2) 复句较多。
3.2 语法偏误对标注的影响
3.3 语法偏误对依存句法分析的影响
4 总结与展望
文章摘要:汉语学习者依存句法树库为非母语者语料提供依存句法分析,对第二语言教学与研究,以及面向第二语言的句法分析、语法改错等相关研究有重要意义。然而,现有的汉语学习者依存句法树库数量较少,且在标注方面仍存在一些问题。为此,该文提出一个依存句法标注规范,搭建在线标注平台,并开展汉语学习者依存句法标注。该文重点介绍了数据选取、标注流程等问题,并对标注结果进行质量分析,以探索二语偏误对标注质量与句法分析的影响。
文章关键词: