Python sense-text-extractor包_程序模块 - PyPI

感官的文本

sense-text-extractor的Python项目详细描述

sense-text-extractor

sense-text-extractor是正文抽取客户端库

安装方式(当前版本0.0.1)

pip install sense-text-extractor

使用指南

基于sense-core的settings.ini的label配置调用：

from sense_text_extractor import SenseTextExtractor
extractor = SenseTextExtractor(label='text_extractor')
text = extractor.extract_text("http://sports.sina.com.cn/g/pl/2019-01-11/doc-ihqhqcis5048507.shtml", "穆里尼奥在等待复出")
print(text)

使用host和port的调用：

extractor = SenseTextExtractor('52.83.143.61', '6681')
text = extractor.extract_text("http://sports.sina.com.cn/g/pl/2019-01-11/doc-ihqhqcis5048507.shtml", "穆里尼奥在等待复出")
print(text)

使用说明

extract_text方法可能抛出异常，需要自己捕捉。返回结果是string，如果是''字符串，表示可能没有抽取出正文。如果用于爬虫，extract_text需要传入第三个参数，也就是下载的html源码，否则extractor的sever端因为获取超时而抛出异常，也容易被反爬虫限制。

欢迎加入QQ群-->： 979659372

sense-text-extractor 0.0.5

sense-text-extractor的Python项目详细描述

sense-text-extractor

安装方式(当前版本0.0.1)

使用指南

使用说明

推荐PyPI第三方库

odoo13-addon-mail-server-relay-disallowed

tucuxi

mandos

mapargs

orbis-new

toposis-rishav-101803333

odoo14-addon-date-range

mypy-boto3-dlm

rfc-http-validate

Utilities-fishingCoder

007

pandasql3

qcrop

ventu

opentelemetry-auto-instrumentation

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

sense-text-extractor 0.0.5

sense-text-extractor的Python项目详细描述

sense-text-extractor

安装方式(当前版本0.0.1)

使用指南

使用说明

推荐PyPI第三方库

odoo13-addon-mail-server-relay-disallowed

tucuxi

mandos

mapargs

orbis-new

toposis-rishav-101803333

odoo14-addon-date-range

mypy-boto3-dlm

rfc-http-validate

Utilities-fishingCoder

007

pandasql3

qcrop

ventu

opentelemetry-auto-instrumentation

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签