军事语料库研究内容

2019-08-05  本文已影响0人  刘焕勇_北语

军事语料库的研究内容,个人理解,可以从以下几个方面去着手考虑。

1、紧缺性军事语料库构建。结合目前军事项目,军事决策过程中缺乏什么必备的军事文本资源,以此页点。做紧缺性的语料收集工作,以满足军事需求。这个可以做紧缺性的军事语料收集,解决的是类型语料的不足和紧缺性问题。

2,深加工的军事情报语料库。这里所说的深加工,是针对当前军事语料加工程度低,无法直接利用或用的更好(可用信息不足,不够细致)的问题提出的。可以做的是对语料进行知识加工,加工的类型有,对文本进行打标签,对文本进行实体标注,事件标注,情报标注。概念标注等,这个标注的结果一方面可用于检索或其他知识挖掘用,另一方面也可提升语料库使用的信息化检索程度,再者标注出来的信息可以进一步作为评测集为学术界做贡献。

3,军事语料库的体系构建问题

体系问题是语料库另一方面的工作,不同来源源,不同形式的语料库混在一起,很有可能会带来规范不统一的结果,这种结果不利于语料之间的利用和管理。此时,可能需要从语料库的体系出发,针对这些问题,建立一个利于共享和管理的统一规范体系。

4,基于军事语料库的知识挖掘

这个研究内容是对第二个研究内容的延伸,基于加工的语料库,进行知识挖掘,即知识的结构化,建成可用的军事事理图谱,军事知识图谱,并用于作战建模型等后续应用。这也是可以研究的一个方向。

三、军事语料库中的关键技术

这个部分的内容单独说有点虚,关键技术还是要落到研究内容上去。以上述的几个研究内容来看,包括一些领域语料的采集技术,领域的深加工技术(军事语料的标签分类技术,实体标注技术,事件标注技术等),体系构建上,具体又可分为规范体系的构建技术等;知识挖掘上所涉及到的技术可能多一些,具体包括知识抽取技术,事理抽取技术等信息抽取技术手段。

总的来说,围绕军事需求开展军事领域语料库的研究是有意义且有必要的。时间仓促再加上对军事领域的真实情况掌握的不够,有些地方说的可能太简单,也可能不对,请戴老师批评指正!

祝戴老师工作顺利!

上一篇下一篇

猜你喜欢

热点阅读