如何用Python读取Heritrix爬虫的 .ARC 文件?
我查看了Heritrix的文档网站,他们提到有一个用Python写的 .ARC 文件阅读器。但是我点击进去后,发现页面显示404,找不到这个内容。http://crawler.archive.org/articles/developer_manual/arcs.html
有没有其他人知道有什么用Python写的Heritrix ARC阅读器呢?
(我之前问过这个问题,但因为不准确而关闭了)
我查看了Heritrix的文档网站,他们提到有一个用Python写的 .ARC 文件阅读器。但是我点击进去后,发现页面显示404,找不到这个内容。http://crawler.archive.org/articles/developer_manual/arcs.html
有没有其他人知道有什么用Python写的Heritrix ARC阅读器呢?
(我之前问过这个问题,但因为不准确而关闭了)