信息提取的一般方法

2020-07-13  本文已影响0人  Peng_001

方法一

完整解析信息标记形式,再提取关键信息。

使用标记解析器,如bs4库的标签树遍历。
优点:信息解析准确。
缺点:提取过程繁琐,速度慢。

方法二

无视标记形式,直接搜索关键信息。

直接通过搜索,对信息的文本利用查找函数查找。
优点:提取过程简单便捷。
缺点:提取结果的准确性与信息内容直接相关。

方法三

融合方法,结合形式解析与搜索,提取关键信息。

上一篇 下一篇

猜你喜欢

热点阅读