用于加载和预处理FARS数据库的python包
fars-cleaner的Python项目详细描述
法尔斯清洁剂fars-cleaner
fars-cleaner
是一个用于下载和预处理数据的Python库
来自死亡分析报告系统,自
1975年()。在
安装
首选的安装方法是通过conda
。在
conda install -c conda-forge fars-cleaner
也可以使用pip安装。在
^{pr2}$使用
下载FARS数据
FARSFetcher
类提供了从NHTSA FARS FTP服务器下载和解压缩选定年份的接口。
该类使用pooch
来下载和解压缩所选的文件。默认情况下,文件会解压缩到操作系统的缓存目录中。在
fromfars_cleanerimportFARSFetcher# Prepare for FARS file download, using the OS cache directory. fetcher=FARSFetcher()
建议的用法是将文件下载到当前项目目录中的数据目录中。
默认情况下,传递project_dir
将文件下载到project_dir/data/fars
。这种行为可以是
也被设置cache_path
覆盖。单独设置cache_path
就提供了到目录的直接路径
您要将文件下载到。在
frompathlibimportPathfromfars_cleanerimportFARSFetcherSOME_PATH=Path("/YOUR/PROJECT/PATH")# Prepare to download to /YOUR/PROJECT/PATH/data/fars# This is the recommended usage.fetcher=FARSFetcher(project_dir=SOME_PATH)# Prepare to download to /YOUR/PROJECT/PATH/farscache_path="fars"fetcher=FARSFetcher(project_dir=SOME_PATH,cache_path=cache_path)cache_path=Path("/SOME/TARGET/DIRECTORY")# Prepare to download directly to a specific directory.fetcher=FARSFetcher(cache_path=cache_path)
文件可以全部下载(1975-2018年的数据),可以是单个年份,也可以跨越指定的年份范围。
下载所有数据可能相当耗时。下载将同时解压缩文件夹,并删除
zip文件。每个压缩文件将被解压缩并保存在一个文件夹{YEAR}.unzip
# Fetch all datafetcher.fetch_all()# Fetch a single yearfetcher.fetch_single(1984)# Fetch data in a year range (inclusive).fetcher.fetch_subset(1999,2007)
处理FARS数据
importfars_cleaner#foobar.pluralize('word') # returns 'words'#foobar.pluralize('goose') # returns 'geese'#foobar.singularize('phenomena') # returns 'phenomenon'
贡献
欢迎拉取请求。对于重大变化,请先打开一个问题,讨论您希望更改的内容。在
许可证
- 项目
标签: