一个从忠实站点导出电影信息的包
fideparser的Python项目详细描述
fideparser
fideparser是解析FIDE Ratings website并导出数据的脚本 被评为锦标赛的冠军。
国际象棋联合会 国际公认的国际象棋管理机构。每个月很多 世界各地都有比赛,其中许多比赛的评分是 每月1日公布的国际信用评级表。
国际棋联在网上公布所有国际象棋比赛的评分报告 http://ratings.fide.com但它们不提供任何api或自动化方式 输出或获取这些信息。
所以这个脚本允许您导出那些比赛的所有数据(基于 在国家和评级期),以csv,json和内部pickle为基础的格式。 此脚本不导出每个锦标赛的球员数据,但是 关于锦标赛的元数据:名称、开始和结束日期、格式、玩家编号, 仲裁人和组织者姓名,…
此脚本依赖于screen-scrapping,因此如果fide更改html 脚本将中断:s
我打算至少每年维护一次这个脚本来导出 前一年,所以我会继续关注fide网站,并尝试修复漏洞。
请随意叉开并请求拉动请求。如果发现任何问题,请使用 the issue tracker in GitHub。
依赖关系
这个脚本依赖于BeautifulSoup4一个优秀的html解析器 做屏幕报废任务。脚本提取正确的版本 所以你不需要做任何事情来安装它。
安装
使用pip安装:
$ pip install fideparser
要升级到新版本,只需再次使用pip即可:
$ pip install --upgrade fideparser
使用
帮助中解释了所有选项,您可以运行此功能:
$ export_fide_tournaments -h
示例
以CSV格式导出2013年1月西班牙锦标赛的所有数据:
$ export_fide_tournaments ESP 2013-01-01 2013-january-spain.csv csv
以二进制格式导出2013年7月法国锦标赛的所有数据:
$ export_fide_tournaments FRA 2012-07-01 2012-july.binary binary
使用以前从法国导出的二进制文件创建json文件:
$ export_fide_tournaments FRA 2012-07-01 2012-july.json json --datafile 2012-july.binary
使用以前从法国导出的二进制文件创建csv文件:
$ export_fide_tournaments FRA 2012-07-01 2012-july.csv csv --datafile 2012-july.binary
如果要导出更多仲裁器数据,请附加可选标志–仲裁器数据:
$ export_fide_tournaments ESP 2013-01-01 2013-january-spain.csv csv --arbiter-data
如果要导出报告数据(当前只有玩家数量 在锦标赛报告中,附加可选标志–报告数据:
$ export_fide_tournaments ESP 2013-01-01 2013-january-spain.csv csv --report-data
还提供了一个用于合并csv文件的脚本,用于合并生成的文件 通过导出比赛脚本。它可以如下使用:
$ merge_csv_files outfile.csv 2013-january-spain.csv 2012-july.csv
更改日志
1.0.2(2019-01-10)
- 更多测试 [勘误]
1.0.1(2019-01-03)
- 使用unicodecsv库生成csv文件。 [勘误]
1.0(2019-01-03)
- python 3支持 [勘误]
- 使用travis ci的最小测试设置 [勘误]
0.8.1(2019-01-03)
- 修复分析报表数据时的播放机计数。 [勘误]
0.8(2019-01-02)
- 对fide url使用https。 [勘误]
- 使用黑色格式化代码。 [勘误]
0.7.1(2018-01-07)
- 文档可选标志 [勘误]
- 修复不存在仲裁器数据时的错误 [勘误]
0.7(2018-01-07)
- 报表数据的条件导出(报表中存在播放机计数) [勘误]
- 仲裁数据条件导出 [勘误]
0.6(2018-01-06)
- 使用http [勘误]
- 雷姆ove设置.cfg [勘误]
0.5(2018-01-06)
- 小修 [勘误]
0.4.1(2014-01-01)
- 修复历史记录[勘误]
0.4-(2014-01-01)
- 当指定的仲裁人 在fide站点[勘误表]中没有有效信息
0.3-(2013-01-08)
- 避免导出的csv文件中出现重复的标题[勘误]
- 修复仲裁器解析:以前一些组织者 像仲裁者一样被解析。修正1[勘误]
0.2-(2013-01-06)
- 添加了一个csv文件合并utlity[erral]
- 改进文档[勘误]
0.1-(2013-01-06)
- 初始版本[勘误表]