面向取证产品智能客服问答系统的命名实体识别模块

2020-10-16  本文已影响0人  yousa_

介绍一下项目(不同于通常的时间、地点、组织机构命名实体识别,我们这个项目是有难度的,比如盗窃手段,采用方案等等偏语义层面)

对于这个项目,传统的方法是怎么样的?

attention怎么做的?

遇到的难点?你这个模型的优点在哪?

命名实体识别的痛点是什么?

你提到了多任务学习,能讲讲吗?

你在这个项目中遇到的印象最深刻的问题是什么?

你知道隐马尔可夫模型吗,大概介绍下?

特比算法其实是一种动态规划算法,动态规划算法通常用来解决什么问题,在HMM里是怎么使用的?

介绍一下CRF

https://zhuanlan.zhihu.com/p/44042528
B站up主视频讲解,超赞!必看!

log_likelihood, transition_params = tf.contrib.crf.crf_log_likelihood(inputs=crf.logits,
                              tag_indicies=self.labels, sequence_lengths = self.sequence_lengths)
self.loss = -tf.reduce_mean(log_likelihood)

HMM和CRF有什么区别?

lstm,画了lstm的结构图,以及写了所有的公式,讲了下lstm的流程

为什么RNN会出现梯度消失和梯度爆炸?

LSTM为什么能解决梯度消失呢?

lstm面对特别长的文本,有什么解决办法呢?

LSTM的复杂度

我的职责:模型选型,对比,为什么要用LSTM ,为什么不用纯CRF(CRF更多是偏向于统计学,引入字向量的LSTM能学习到语义,如果出现一些错别字或者未登录词等情况,只使用CRF就不太行)

LSTM中tanh的作用

LSTM中sigmoid的作用

LSTM中c和h的区别

项目总结与思考

LSTM深度思考

梯度消失及其解决方案

梯度爆炸及其解决方案

LSTM:LSTM之所以缓解(不是彻底解决)梯度爆炸是因为他的一半路程梯度更新道路太崎岖了(某一部分),sigmoid函数加了一个tanh函数,sigmoid函数导数小于等于0.25,所以梯度爆炸不太可能发生。(但是另一半路仍然可能发生梯度爆炸,但是因为是sigmoid,所以也缓解了)

上一篇下一篇

猜你喜欢

热点阅读