用于下载具有基于日期和时间的文件名或文件夹结构的文件的小型库。同时使用wget。
datedown的Python项目详细描述
===
日期
==
…图片::https://travis-ci.org/cpaulik/datedown.svg?branch=master
:目标:https://travis ci.org/cpaulik/datedown
…图片::https://coveralls.io/repos/github/cpaulik/datedown/badge.svg?branch=master
:目标:https://coveralls.io/github/cpaulik/datedown?分支=主
…图片::https://badge.fury.io/py/datedown.svg
:目标:http://badge.fury.io/py/datedown
小库,用于下载具有基于日期和时间的文件名或文件夹结构的文件。并行使用wget。
recursive wget可能会很慢,并导致繁琐的本地文件夹结构。
此库根据确切的日期或日期范围下载准确的文件名。
远程和本地文件名和路径是使用“python strftime and strptime format specification”生成的;https://docs.python.org/2/library/datetime.html strftime和strptime behavior>;`
库使用python多处理模块启动多个wget
实例,以便更快地下载。在下载过程结束时,它会确认所有文件都已下载。目前不支持校验和。
或者作为一个独立的命令行程序。
此外,脚本的
递归版本以``datedown_rec``的名称提供。
示例
~~~~~~
……代码:
Datedown 2000-01 2000-01-02 http://localhost:8888 file_%y_%m_%d.txt/home/cpa/--urlsubirs test_U data year_月子文件夹%y%m
这将下载文件
*http://localhost:8888/test_U data/year_月子文件夹/2000/01/file_2000_01.txt
*http://localhost:88888/test-data/yearu-mon月子文件夹/2000/2001/01/file_2000_2000_01_01_01_02.txt
>
*/home/cpa/test-data/yearu-mon月子文件夹/2000/01/file_2000_01_01_01.txt
*/home/cpa/test-data/yearu-mon月子文件夹/2000/01/file_2000_2000_2000_2000_2000_01_01_01_01_01.txt
————
重要功能是
:py:func:`datedown.interface.download_by_dt`或:py:func:`datedown.down.download`。第一个函数接受从python datetime对象生成url的函数,而第二个函数接受url和本地文件名的列表。有关这些功能的详细信息,请参阅
api文档。
|文档状态图像::https://readthedocs.org/projects/datedown/badge/?version=latest
:target:http://datedown.readthedocs.org/
注意
====
此项目是使用pyscaffold 2.5.6设置的。有关pyscaffold的详细信息和用法,请参见http://pyscaffold.readthedocs.org/。
日期
==
…图片::https://travis-ci.org/cpaulik/datedown.svg?branch=master
:目标:https://travis ci.org/cpaulik/datedown
…图片::https://coveralls.io/repos/github/cpaulik/datedown/badge.svg?branch=master
:目标:https://coveralls.io/github/cpaulik/datedown?分支=主
…图片::https://badge.fury.io/py/datedown.svg
:目标:http://badge.fury.io/py/datedown
小库,用于下载具有基于日期和时间的文件名或文件夹结构的文件。并行使用wget。
recursive wget可能会很慢,并导致繁琐的本地文件夹结构。
此库根据确切的日期或日期范围下载准确的文件名。
远程和本地文件名和路径是使用“python strftime and strptime format specification”生成的;https://docs.python.org/2/library/datetime.html strftime和strptime behavior>;`
库使用python多处理模块启动多个wget
实例,以便更快地下载。在下载过程结束时,它会确认所有文件都已下载。目前不支持校验和。
或者作为一个独立的命令行程序。
此外,脚本的
递归版本以``datedown_rec``的名称提供。
示例
~~~~~~
……代码:
Datedown 2000-01 2000-01-02 http://localhost:8888 file_%y_%m_%d.txt/home/cpa/--urlsubirs test_U data year_月子文件夹%y%m
这将下载文件
*http://localhost:8888/test_U data/year_月子文件夹/2000/01/file_2000_01.txt
*http://localhost:88888/test-data/yearu-mon月子文件夹/2000/2001/01/file_2000_2000_01_01_01_02.txt
>
*/home/cpa/test-data/yearu-mon月子文件夹/2000/01/file_2000_01_01_01.txt
*/home/cpa/test-data/yearu-mon月子文件夹/2000/01/file_2000_2000_2000_2000_2000_01_01_01_01_01.txt
————
重要功能是
:py:func:`datedown.interface.download_by_dt`或:py:func:`datedown.down.download`。第一个函数接受从python datetime对象生成url的函数,而第二个函数接受url和本地文件名的列表。有关这些功能的详细信息,请参阅
api文档。
|文档状态图像::https://readthedocs.org/projects/datedown/badge/?version=latest
:target:http://datedown.readthedocs.org/
注意
====
此项目是使用pyscaffold 2.5.6设置的。有关pyscaffold的详细信息和用法,请参见http://pyscaffold.readthedocs.org/。