全栈开发

[Whoosh 搜索引擎之 二 ] Whoosh 简介

2023-02-15  本文已影响0人  luohuayong

Whoosh 简介

关于 Whoosh

Whoosh 由 Matt Chaput 创建。 它最初是一个快速而杂乱 (dirty) 的搜索服务器,用于搜索 Houdini 3D 动画软件包的在线文档。 Side Effects Software 慷慨地允许 Matt 开源代码,以防它可能对需要非常灵活或纯 Python 搜索引擎(或两者!)的任何其他人有用。

Whoosh 是什么?

Whoosh 是一个快速、纯 Python 的搜索引擎库。

Whoosh 的主要设计动力是它是纯 Python。 您应该能够在任何可以使用 Python 的地方使用 Whoosh,不需要编译器或 Java。

与其祖先之一 Lucene 一样,Whoosh 并不是一个真正的搜索引擎,它是一个用于创建搜索引擎的程序员库 [1]。

实际上,Whoosh 的任何重要行为都不是硬编码的。 文本索引、每个字段中每个术语存储的信息级别、搜索查询的解析、允许的查询类型、评分算法等都是可定制的、可替换的和可扩展的。

[1] 当然可以在 Whoosh 之上构建交钥匙搜索引擎,就像 Nutch 和 Solr 使用 Lucene 一样。

Whoosh 能为您做什么?

Whoosh 让您可以索引自由格式或结构化文本,然后根据简单或复杂的搜索条件快速找到匹配的文档。

获得有关 Whoosh 的帮助

您可以在 Whoosh Bitbucket 页面上查看未解决的问题,并在 Whoosh 邮件列表上获得帮助。

上一篇 下一篇

猜你喜欢

热点阅读