2024-03-05 dify二次开发记录
2024-03-04 本文已影响0人
felix_feng
- 文档内容增加-文件名称在切分段内容中。
- word文档按格式切分,无格式按语义切分。
- 文档中表格优化,按json格式保存,保证内容完整连贯。
- pdf文档按语义切分。
- 文档构建QA对结构优化,保证对模型无压力。
- 文档构建时创建摘要索引,保证召回率。
- 区分RAG回答与大模型兜底。
- 增加问答效果评分。召回评分。
- 去掉dify版本校验逻辑,保证本地部署时访问不卡顿。
- 在自然段因超长被切断时,块上下文增加标识,在召回某块时增加上下块合并召回。
- 增加召回时图片的联代召回。
- 多知识库时利用bert模型实现路由加速器,快速指定到特定知识库召回。提升召回速度10倍。