搜索网站关键字的实用程序

analyze_site的Python项目详细描述


analyze_site是一个python应用程序,用于对网站进行爬网并返回在网站网页中找到的文件中提供的关键字的计数。应用程序还将返回最常用的动词、名词、副词和形容词的计数。

analyze_站点需要python版本3和以下库:

  • nltk-带有maxent_treebank_pos_tagger的自然语言工具包
用法:analyze\u site.py[-h][-d depth][-r path\u regex][–verbose]
关键字文件URL
位置参数:
关键字文件路径到关键字文件 要爬网的URL
可选参数:
-h, --helpshow this help message and exit
-d DEPTH, --depth DEPTH
Depth to crawl
-r PATH_REGEX, --path_regex PATH_REGEX
Regular expression to match URL
--verboseIncrease logging level

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
并行处理java。util。同时发生的叉子在游泳池里。常见的并行性准则,用于选择正确的并行度大小   java如何将空白字符追加到指定长度?   安卓应用程序中出现错误,SSLHandshakeException,找不到证书路径的信任锚点   java如何使用JUnit Mockito验证检查方法是否未被调用   java如何使用不同的@RequestMapping解析多个控制器中的静态页面   Selenium中的javascript需要验证搜索结果   访问数据库SQLiteopenHelper方法时java应用程序崩溃(nullpointerexception)   在二叉树中验证最小堆时出现java空指针异常   Java 7的SSL连接失败   java用RestEasyWebTarget替换ProxyFactory不起作用   在Java应用程序中单击“否”按钮后,数组程序冻结(无响应)   数组中的前缀Java初学者前进和   Java HTML解析器,包括脚本标记和LineNumberReader   在java中为长类型数字加前导零   正则表达式无法映射正则表达式java。lang.IllegalArgumentException:模式段中捕获组的数量