大模型面试题:目前大模型中的位置编码有哪些?

2024-11-04  本文已影响0人  bd7e4a65be2b

获取更多面试真题的集合,请移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02c34ca8c334870b3bcd_720w.webp?source=d16d100b

目前大模型中的位置编码有哪些?

在大模型中,位置编码主要分为两大派:绝对位置编码和相对位置编码。主流的几种脍炙人口的位置编码如下所示:

优点:实现简单,效率高,易用性好,有一定的理论支撑
缺点:绝对位置编码带来的灵活性差;外推性较差,难以对超出预训练长度的文本进行很好的外推或者说性能下降;难以表示有效的相对位置间的关系,也即难以表示前后方向,只能表示距离。

优点:能保证相对位置关系;良好的外推性;可以和线性注意力机制兼容.
缺点:实现上稍微复制;外推到超长序列也存在性能下降问题

可以参考 https://zhuanlan.zhihu.com/p/647109286 进行学习,十分钟就精通了

上一篇 下一篇

猜你喜欢

热点阅读