面向数据科学家的高级Python工具
Pythagoras的Python项目详细描述
毕达哥拉斯
数据科学家的高级元算法
这是什么?
一个用于研究元算法的SKLearn扩展
如何得到它?
源代码托管在GitHub上: https://github.com/vladlpavlov/Pythagoras
最新发布版本的二进制安装程序可在Python包索引中找到: https://pypi.org/project/Pythagoras
pip install Pythagoras
核心设计原则
- 在
快速实验
在 - 在
普遍使用
在
- 过拟合检测
- 装配
- 防止数据泄漏
- 实用软件工程
- 合理时与SKLearn兼容
- 以熊猫为主要数据载体
- 通过日志记录讲故事
- 通过持久缓存加速
- OOP的一致使用
主要部件
- 在
Learner:一个抽象的基类,可以教授。 实现启用过拟合检测的.val_fit()方法。在
在 - 在
Mapper:一个通用的预测器/转换器,implements.map()方法 作为.predict()和transform()方法的替代方法。在
在 - 在
LeakProofMapper:一个有意识的元学习者。Implements.map()方法 并提供防止数据泄漏的保证。在
在 - 在
LoggableObject:提供支持日志记录的细粒度故事讲述工具的基类。在
在 - 在
PickleCache:与Pandas兼容的持久缓存,可扩展以使用新类。在
在 - 在
FeatureShower:自动数据清理器和特征生成器(即将推出)。在
在 - 在
SimpleGarden:高效回归元算法:增强的特征选择工厂创建 简约估计的集合(即将推出)。在
在 - 在
MagicGarden:自动回归基线创建器。它构建了性能良好的回归模型 不需要数据科学家的手工工作:无需EDA,无需数据清理和功能工程(即将推出)。在
在
教程
- Basic Caching: 如果Python代码可以使用Pandas和内置数据类型,如何加快脚本和笔记本的速度
- Advanced Caching: 如何使毕达哥拉斯PickleCache与自定义类一起工作
依赖性
关键联系人
- Vlad(imir) Pavlov:算法设计与核心开发
- Kai Zhao:质量保证
名字和标志是什么意思?
毕达哥拉斯是古希腊著名的思想家和科学家 他是第一个自称为哲学家(“智慧爱好者”)的人。 他以他的许多数学发现而闻名, 包括毕达哥拉斯定理。在
但不是每个人都知道,在古代,毕达哥拉斯也被认为是重大的天文发现, 比如地球的球形以及早晚恒星与金星的同一性。 我们的标志描绘了毕达哥拉斯这些鲜为人知但同样重要的成就。在
- 项目
标签: