Elasticsearch HTTP API或python API

2024-05-29 02:24:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我是实时分布式搜索引擎elasticsearch的新手,但我想问一个技术问题。在

我已经编写了一个python模块爬虫程序,它解析web页面并使用本机信息创建JSON对象。我的模块爬虫程序的下一步是使用elasticsearch存储本机信息。在

真正的问题是:。 哪种技术更适合我的场合?elasticsearch RESTful API还是用于弹性搜索的PythonAPI(elasticsearch py)?在


Tags: 模块对象程序webrestfuljson分布式页面
2条回答

如果已经有Python代码,那么最自然的方法就是使用^{} client。在

通过pip install elatsicsearch安装了elasticsearch-py库之后,您可以找到一个简单的代码示例:

# import the elasticsearch library
from elasticsearch import Elasticsearch

# get your JSON data
json_page = {...}

# create a new client to connect to ES running on localhost:9200
es = Elasticsearch()

# index your JSON data
es.index(index="webpages", doc_type="webpage", id=1, body=json_page)

您也可以尝试elasticsearch_dsl它是elasticsearch的高级包装器。在

相关问题 更多 >

    热门问题