文档相似性服务器

simserver的Python项目详细描述


索引纯文本文档并查询语义相关文档的索引。

simserver在内部使用事务来提供一个健壮且可伸缩的相似性服务器。

安装

simserver构建在 主题建模。

安装simserver的简单方法是使用:

sudo easy_install -U simserver

或者,如果您下载并解压缩了source tar.gz包, 您需要运行:

python setup.py test
sudo python setup.py install

这个版本已经在Python2.5和2.7下测试过,但是应该在任何2.5<;=Python<;3.0上运行。

文档

http://radimrehurek.com/gensim/simserver.html。很快就会有更多。

许可

simserver在GNU Affero GPL license v3下发布。

这意味着您可以在应用程序(甚至是商业应用程序)中自由使用simserver。我是说, 但是您必须在agpl兼容许可证下打开应用程序的源代码

agpl许可证确保即使在您提出申请时也适用 仅远程可用(例如通过网络)。

tl;dr:simserver是开源的,但您必须与我联系以获得任何专有用途。

历史记录

0.1.4:
  • 分片的性能改进
  • 更改为线程模型–取消了对每个线程会话访问的限制
  • 在index optmize()中修复错误
0.1.3:
  • 很少培训文档的行为改变:使用更简单的日志熵模型,而不是潜在的语义分析
  • 修复了泄漏sqlite文件描述符的错误

版权所有(c)2011 Radim Rehurek

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JPA。Eclipselink没有为mySQL提供密码,但它应该提供   我的Servlet和@FormDataParam存在java问题   java将什么作为上下文参数传递到文件I/O方法中?   如果两个值相同,java无法找到其中一个单选按钮   java在变量和方法名中使用下划线   JavaSpringMVC单线程安全?   klazz类的java Arraylist(反射Api)   java如何在数字字符串中查找最频繁的数字?   JavaAPI设计:使数据更易于阅读与强制更多API调用   JavaHadoopMapReduceforGoogleWebGraph   java无法启动gauge API:Runner意外退出   java如何在bluemix上使用ibm工作负载调度器?   拉取一年中某一周特定日期的所有日期   java为什么是我的角节点。js应用程序将图像上传到S3� 邮递员正确上传时的符号?   在不使用任何第三方jar的情况下将文件从本地传输到linux系统(java代码)   java将现有文件夹复制到Eclipse工作区中新创建的项目中   Java中的regex RegExp帮助   当使用“系统”外观时,Java组合框setSelectedItem会出现故障   JavaASM:在类的方法中获取局部变量名和值