没有项目描述

PythonHiringTest的Python项目详细描述


##术语
1.**subject**:分组依据的字段;类似于sql的“group by”
子句。
2.**split**:用于限制数据集的过滤器;类似于SQL的“where”
子句。
**vs lhh**:“vs左手击球手”
**vs rhh**:“vs右手击球手”
**vs lhp**:“vs左手投手”
**vs rhp**:“vs右手投手”
3.**stat**:根据聚合数据计算的度量。有四个基本的统计数据需要计算,任何棒球迷都应该熟悉这些数据。
*avg
*obp
*slg
*ops

创建一个gitlab帐户(如果您还没有)。将此存储库克隆到您的计算机。
3.使用“pip install-r requirements.txt”安装它
3。修改run.py以在通过“python run.py”调用时执行以下步骤:
1。读入`./data/raw/pitchdata.csv`
2。从
`./data/reference/combinations.txt`对每个组合执行分组/聚合,以创建表/数据帧。
3。将stat四舍五入到小数点后三位。
4。仅包括pa>;=25.
5的受试者。将每个单独的表/数据帧组合成一个单独的表/数据帧,其
列标题如下:
*subjectd(例如108、119等)
*stat(例如stat“avg”、“obp”等的名称)
*split(例如“vs lhp”、“vs rhh”等)
*subject(例如“hitterid”、“pitcherteind”等)*值(例如stat的值0.350、1.03、0.5等)
6。对前四列的表/数据框进行排序(每列按升序排列)。
7。将csv保存到`./data/processed/output.csv`
4。通过打开命令行运行测试套件,在repo中插入cd,并运行
以下命令:``pytest-v```
5。上传到您自己的gitlab/github/bitbucket帐户下的新存储库。
6。将指向存储库的链接发送到andrew pautz(pautz@inside edge.com)。

等效的sql类似于:

``sql
select
hitterid as subject,
'avg'as stat,
'vs rhp'as split,
'hitterid'as subject,
round(cast(sum(h)as float)/sum(ab),3)as value
from./data/raw/pitchdata.csv
where pitchrside='r'
group by hitterid
having sum(pa)>;=50
```

**准确度**:输出数据必须100%准确。
2.**可读性**:越容易理解越好。
3.**性能**:理想情况下只需1-2秒即可完成。
4.**开发时间**:尽量在一天内提交。
5.**可安装**:通过“pip install-r requirements.txt”使其可安装

我们大量使用熊猫,但如果您更喜欢使用Numpy或其他完全可以随意使用的功能。
*您不需要将修改限制为run.py。您可以添加/编辑回购协议中的任何
其他文件,但以下内容除外:
*。/tests
*。/data/raw
*。/data/reference
*代码通常应符合PEP8。
*不需要文档,但也不会受到反对。
*如果您需要超过80个字符…没问题。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Cassandra复制因子大于节点数   java J2EE JTA事务回滚不适用于OSE Glassfish 4.0(Build 89)   java spring安全预认证用户登录   org的java类文件。反应流。从RxJava编译示例时未找到Publisher?   java在使用dataFormat作为POJO通过Camel调用Web服务时无法设置SOAP标头   Javafx类的java静态实例   java如何防止一个部件在关闭时覆盖另一个部件的位置   sql server无法从我的java代码连接到数据库   java在JList(Swing)中显示带有的ArrayList   从Java中的CXF服务获取WSAddressing数据   使用资产文件夹进行java简单json解析(本地)   java LDAPException未绑定的无效凭据   JavaJSFspring部署到weblogic   JAVA中字符数组中的特定元素排列?   如果脚本位于不同的目录中,则ant不会使用exec标记运行Javashell脚本