搜索网站关键字的实用程序
analyze_site的Python项目详细描述
analyze_site是一个python应用程序,用于对网站进行爬网并返回在网站网页中找到的文件中提供的关键字的计数。应用程序还将返回最常用的动词、名词、副词和形容词的计数。
analyze_站点需要python版本3和以下库:
- nltk-带有maxent_treebank_pos_tagger的自然语言工具包
- 用法:analyze\u site.py[-h][-d depth][-r path\u regex][–verbose]
- 关键字文件URL
- 位置参数:
- 关键字文件路径到关键字文件 要爬网的URL
- 可选参数:
-h, --help show this help message and exit -d DEPTH, --depth DEPTH Depth to crawl -r PATH_REGEX, --path_regex PATH_REGEX Regular expression to match URL --verbose Increase logging level