2024-03-05 dify二次开发记录

2024-03-04  本文已影响0人  felix_feng
  1. 文档内容增加-文件名称在切分段内容中。
  2. word文档按格式切分,无格式按语义切分。
  3. 文档中表格优化,按json格式保存,保证内容完整连贯。
  4. pdf文档按语义切分。
  5. 文档构建QA对结构优化,保证对模型无压力。
  6. 文档构建时创建摘要索引,保证召回率。
  7. 区分RAG回答与大模型兜底。
  8. 增加问答效果评分。召回评分。
  9. 去掉dify版本校验逻辑,保证本地部署时访问不卡顿。
  10. 在自然段因超长被切断时,块上下文增加标识,在召回某块时增加上下块合并召回。
  11. 增加召回时图片的联代召回。
  12. 多知识库时利用bert模型实现路由加速器,快速指定到特定知识库召回。提升召回速度10倍。
上一篇 下一篇

猜你喜欢

热点阅读