使用CRF++进行模型训练

2021-11-25  本文已影响0人  JackMeGo

使用CRF++进行模型训练

本机训练:

使用以下命令:

nohup ./CRF++-0.58/crf_learn -f 10 -H 10 -e 0.0005 -m 300 data/template/template data/output/training_data_new.txt data/model/out_model -t > nohup.out 2>&1 &

预测

使用人工标注的数据data.test进行预测
./CRF++-0.58/crf_test -m data/model/model35 data/test_data/data.test.with_features.txt > data/test_data/data.test.out 2>&1
./CRF++-0.58/crf_test -m data/model/out_model data/test_data/data.test.correct.single_char_single_line_with_rulemodel_feature.txt > data/test_data/data.test_new.out 2>&1

内容:该工程源码源于官方CRF++-0.58版本,官方原始的CRF++在训练模型的时候会将第一列为 \0 或 空格 或 \t 的行忽略掉,但我们需要第一列支持空格,所以修改了CRF++两处源码(feature_index.cpp 168行左右、tagger.cpp 368行左右),重新编译了CRF++,这样训练模型的时候支持第一列是空格。

上一篇 下一篇

猜你喜欢

热点阅读