一个基于gevent的简单instagram标签爬虫程序
insta-hashtag-crawler的Python项目详细描述
入门
支持的平台
insta_hashtag_crawler
已经在以下平台上进行了测试:
- OS:Ubuntu 17.04 LTS,Windows 10
- Python:cPython>;=3.6
安装
通过pip
(推荐)
- 当python3是系统上唯一安装的python发行版时:
pip install insta_hashtag_crawler
- ,包含多个版本的python发行版:
(将python3
替换为所需版本)
- 使用
venv
:- 在Linux上
python3 -m venv .venv
source .venv/bin/activate
pip install insta_hashtag_crawler
- 在Windows上
python3 -m venv .venv cd .venv/Scripts activate pip install insta_hashtag_crawler
通过setup.py
git clone https://gitlab.com/point1304/insta_hashtag_crawler.git
cd insta_hashtag_crawler
python3 setup.py bdist
python3 setup.py install
如何
insta_hashtag_crawler
附带了一个非常简单的命令行工具
这就是你要利用的。在
您可以使用以下命令立即开始对shell
进行爬网:
insta-crawl your-hashtag
此命令将在
中生成一系列csv
格式的数据
“当前工作目录”。
csv
文件名为:${hashtag}yyyymmdd(${number}).csv
可选参数
- [--dir][-d]
您可以设置生成爬网结果的目录
通过使用[--dir][-d]选项。
[--dir]选项可以将绝对路径或相对路径作为参数。在
insta-crawl --dir /some/path/to/dir hashtag insta-crawl --dir some/relative/path hashtag
- [--安静][-q]
如果要禁用爬网日志,
默认情况下指向stdout
。 此选项将把所有日志重定向到与操作系统相关的dev/null
。在
- 项目
标签: