意图识别预处理一

2017-09-22  本文已影响58人  brandon_wang

在上一章里面,我讲的是一个意图识别的思路或者说流程,但是并没有给出具体实现方案。

在本章,我们给出一些细节信息。

考虑一种情况:

1.数学辅导班主要讲什么?

2.语文辅导班主要讲什么?

3.英语辅导班主要讲什么?

通过人为分析,我们可以把它界定为一类,也就是问答类。我们可以把它归结为

C主要讲的什么?C可以理解为课程。

来看另外一类问题:

1.语文课上一个月多少钱?

2.语文课上半年多少钱?

3.语文课上一年多少钱?

对于这类类问题,我们可以把它归为:语文课上T多少钱? T代表时间。

同时我们根据一开始的分析,可以把语文课替换为C。

也就是说,我们可以把它理解为:C上T多少钱?

如此,我们就可以归类用户输入的一些问题。

于是我们可以用,C主要讲的什么?C上T多少钱?

来代替一系列同类问题,它的优点就是可以更加抽象用户输入。降低认为构造训练集的时间。

具体实现,源码地址如下:https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list

CRF++安装还是比较简单的

1../configure

2. make

3. su

4. make install

同时如果有需要,还可以安装py包。在源码目录的python文件夹中。

CRF的具体使用方式,后面将会详细介绍。

上一篇 下一篇

猜你喜欢

热点阅读