123
Whoosh

Whoosh

Whoosh是一个用于索引文本然后搜索索引的类和函数的库。它使您可以为内容开发自定义搜索引擎。
Whoosh是使用纯Python实现的快速,功能强大的全文索引和搜索库。程序员可以使用它轻松地将搜索功能添加到他们的应用程序和网站。Whoosh工作原理的每个部分都可以扩展或替换,以完全满足您的需求。Whoosh的一些功能包括:Pythonic API。纯Python。无需编译或二进制包,没有神秘的崩溃。现场索引和搜索。快速索引和检索-比我所知道的任何其他纯Python搜索解决方案都要快。请参阅基准。可插拔评分算法(包括BM25F),文本分析,存储,发布格式等。强大的查询语言。生产质量的纯Python拼写检查器(据我所知,只有一个)。在以下情况下,whoosh可能会很有用:在需要使用纯Python解决方案的任何地方,都可以避免构建/编译本机库(或强制用户构建/编译本机库)。作为研究平台(至少对于发现Python比Java更易于阅读和使用的程序员而言;)对于您而言,易于使用的Pythonic接口比原始速度更重要。如果您的应用程序可以充分利用一种深度集成的搜索/查找解决方案,那么您可以依靠它而不必依靠两种不同的搜索解决方案(简单/慢速/本地开发的一种集成,索引/快速/外部二进制依赖关系作为一种选项)。Whoosh由Matt Chaput创建并维护。它最初是为在Side Effects软件的3D动画软件Houdini的在线帮助系统中使用而创建的。Side Effects Software Inc.慷慨地同意开源代码。

具有开源许可证的Instagram版Whoosh的替代方案