Python HTTP/UDP BitTorrent Tracker 抓取库
我有一个包含种子信息哈希值的列表。对于每个信息哈希,我都有一个对应的跟踪器列表。
我想做的是从这个列表中的每个跟踪器上抓取种子数、下载者数和完成数。不过,我不想自己写这个代码,因为我相信网上已经有人实现过了。
有没有人知道有什么Python库可以抓取http://和udp://的跟踪器?
我在这个项目的其他部分使用了libtorrent,但它只能从有效的torrent_handle中抓取跟踪器(而且我不想把这些信息哈希添加到libtorrent会话中,因为那样会开始下载文件,而我并不想下载)。
2 个回答
1
这不是直接回答你问题的内容,而是给你一个关于如何使用libtorrent的建议。
如果你在暂停状态下添加信息哈希,并且不让它自动管理(这可以通过add_torrent_params中的标志来控制),那么libtorrent就不会开始下载这个内容。
需要注意的是,libtorrent目前还不支持从DHT中抓取数据。
12
我不想使用libtorrent,因为它效率不高——我希望能一次性向一个追踪器查询多个信息哈希,而不是一次查询一个。
最后我自己写了一个用Python编写的HTTP/UDP追踪器抓取代码,具体可以看这里:https://github.com/erindru/m2t/blob/master/m2t/scraper.py(欢迎提出改进意见!)