sentence embedding相关

2022-01-19 本文已影响0人来到了没有知识的荒原

（苏剑林）无监督语义相似度哪家强？我们做了个比较全面的评测
一堆实验对比bert-flow，bert-whitening，sentence-bert，simbert等等，还调了各种参数对比实验结果。
还对比了几种pooling方式：

P1：把encoder的最后一层的[CLS]向量拿出来；
P2：把Pooler（BERT用来做NSP任务）对应的向量拿出来，跟P1的区别是多了个线性变换；
P3：把encoder的最后一层的所有向量取平均；
P4：把encoder的第一层与最后一层的所有向量取平均。

对pooling后的向量作PCA

两次dropout得到正样本，其他为负样本
（苏剑林）中文任务还是SOTA吗？我们给SimCSE补充了一些实验
在中文数据集上的实验测试，效果很好

孪生BERT，实际两个是共享参数的，也就是同一个模型。
（刘聪NLP）Sentence-Bert论文笔记

在UniLM的基础上修改，同时学习CLS向量用于判断是否相似，还学习相似句生成任务，两个loss加在一起。