Terrier IR Python API
python-terrier的Python项目详细描述
小猎犬
Terrier Python API
安装
pip安装python terrier
Windows
Linux
Colab笔记本电脑
索引
索引TREC格式的集合
index_path = "/home/alex/Documents/index"
path = "/home/alex/Downloads/books/doc-text.trec"
index_path = createTRECIndex(index_path, path)
索引文本文件
为熊猫数据帧编制索引
首先,让我们创建一个示例数据帧
^{pr2}$然后,有许多选项可以用来索引数据帧:
index = createDFIndex(index_path, df["text"])
index = createDFIndex(index_path, df["text"], df["docno"])
index = createDFIndex(index_path, df["text"], df["docno"], df["url"])
index = createDFIndex(index_path, df["text"], df)
index = createDFIndex(index_path, df["text"], docno=["1","2","3"])
meta_fields={"docno":["1","2","3"],"url":["url1", "url2", "url3"]}
index = createDFIndex(index_path, df["text"], **meta_fields)
检索
评价
- 项目
标签: