净因子数据

data-box的Python项目详细描述


这个项目是为了清理因子数据,并准备回测。

依赖关系

  • Python3.5
  • 熊猫0.22.0
  • 纽比1.14.3
  • 泡菜
  • sklearn 0.19.1(仅限PCA)

示例

from data_box import data_box

db=data_box()\
    .set_lag(freq='d',day_lag=0)\
    .load_adjPrice(price)\ # 'price' is a pd.DataFrame with dates(20190101 int type) as its index and tickers as its column
    .load_indestry(ind)\
    .load_suspend(sus)\
    .load_indexWeight(index_weight)\
    .calc_indweight()\ # calculate industry weight based on index weight and stocks' industry in this index
    .load_cap(cap)\
    .add_factor('f1',factor1)\
    .add_factor('f2',factor2)\
    .add_factor('f3',factor3)\
    .align_data()\
    .factor_pca()\
    .factor_ind_neutral()\
    .factor_size_neutral()\
    .factor_zscore()

print(db.Factor)
print(db.Price)
print(db.Sus)
print(db.Cap)# save and reload
db.save(path)db2=databox().load(path)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
无JPA的纯Hibernate ORM java SpringBoot配置   安卓会生成一组唯一的java数字   java我的自定义阵列列表每次启动时都会崩溃我不确定为什么会一直崩溃   Java继承;将子类传递给超类的抽象方法   java从没有if语句的数组中获取instanceof type   java中使用对象的温度转换   存储库接口的JavaSpringDataMongoDBeanXML配置   java JAXWS为iBM websphere、iBM web服务客户端添加寻址   数组试图返回Java中两个对象的面积之和   apache Spark java:columnNameOfCorruptRecord和badRecordsPath在加载csv时不工作   java无法创建。txt文件   java Hibernate与MySQL插入查询不一致   不考虑java Hazelcast分布式地图的最大大小   bash Java如何在父进程中设置环境变量