Python包中的BlankSort关键字提取算法。
blanksort的Python项目详细描述
BlankSort
Python包中的BlankSort关键字提取算法。在
安装
使用以下命令从TestPyPI安装:
pip install --upgrade blanksort
使用
BlankSort可以像任何其他Python包一样导入:
^{pr2}$导入后,您可以创建一个BlankSort
对象。在
algo=blanksort.BlankSort()
或者,您可以使用以下代码来创建BlankSort
对象。在
fromBlankSortimport*algo=BlankSort()
BlankSort
构造函数接受以下参数:
binary_path
[可选]- 包含
blanksort.database
和stopwords-en.txt
的二进制文件夹的路径。如果未指定,将下载默认的二进制文件。在
- 包含
preloadVectors
[可选关键字参数]- 一个布尔值(默认值为
False
),指定是否应将字向量预加载到内存中。在
- 一个布尔值(默认值为
saveGeneratedVectors
[可选关键字参数]- 一个布尔值(默认值为
False
),指定是否应将动态生成的词向量保存到blanksort.database
。在
- 一个布尔值(默认值为
示例
importblanksortalgo=blanksort.BlankSort()keywords=algo.rank("[input text]")
二进制文件
BlankSort包需要几个文件,统称为“二进制文件”。
|文件名|说明|
|:---------------------|:---------------------------------------------------|
|blanksort.database
使用SQLiteDict创建的数据库文件。数据库包含从FastText导入的单词向量和n个单词。
|stopwords-en.txt
|一个文本文件,包含用于预处理的停止字列表。每行应该包含一个单词。|在
如果在binary_path
中找不到这些文件,包将从附加到某个版本的最新版本的binaries.zip
下载默认的二进制文件夹。在
- 项目
标签: