一种简单易用的斗印爬行器

douyin-spider的Python项目详细描述


抖音爬虫

抓取抖音App的视频爬虫

环境

Python3

安装配置

首先,你需要安装并配置好Node.js环境,然后bash运行

$ git clone git@github.com:ErisYoung/douyin_spider.git
$ cd douyin_spider
$ pip install -r requirements.txt

或者

pip install douyin-spider

使用方法

第一种方式:选择下载器和处理器,自行编写

你可以按如下方式使用:

fromdouyin_spider.downloaders.videoimportVideoDownloaderfromdouyin_spider.handler.videoimportVideoHandlerfromdouyin_spider.handler.musicimportMusicHandlerfromdouyin_spider.handler.mongodbimportMongoHandlerfromdouyin_spider.enter.hot_topimporthot_top20video_handler=VideoHandler(folder='./videos')music_handler=MusicHandler(folder='./musics')mongo_handler=MongoHandler()downloader=VideoDownloader([video_handler,music_handler,mongo_handler])result=hot_top20()foriteminresult.data:downloader.download(item)print("success")

?注意:如果要使用mongo_handler,则需要提前启动mongodb

结果:

4.jpg5.jpg6.jpg7.jpg

第二种方式:使用命令行参数

首先获取你所需要的share-url

然后把得到的url,输入命令行,默认下载10个视频

cd douyin_spider/douyin_spider
python assign_share_url.py -u "http://v.douyin.com/6Gf7FG/"

?注意:这里要使用"",否则Windows环境下会出现error

更多的参数使用自行help查阅:

python assign_share_url.py --help
?提示:有其他问题可以自行issue

更多的例子和入口

请看 tests

更多的下载器

请看 downloaders

更多的处理器

请看 handler

更新时间

  • 2019-5-13: ?处理_signature 签名参数,实测可行
  • 2019-6-26: ?打包上传至pypi,抖音加密接口未变,测试可行

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何反射地迭代数组字段?   java NamedQuery错误“具有给定标识符的多行:1”   java无法使用单独类中的计时器更新TextView   兼容性什么时候可以很快使用新的Java功能?   java二叉树路径和   java矩形的性能   java我想从同一个子表在主表中添加两个外键   java如何获取基于特定日期的所有数据?   java javafx、OO编程规则和写入变量类型的选择   java使用带枚举的switch语句   java异步任务生成运行时异常   java为什么JLabel不显示下划线字符?   java如何解析具有可变参数号的函数?   带有按钮的java JavaFX自定义列表单元格:未调用处理程序   java Modelmapper无法映射整个模型?   传递给持久化的java分离实体,包含LatLng列表