监督学习数据的模拟框架。这些功能的具体设计是为了让用户获得最大的自由度,最终达到研究的目的。此外,可以在本地和全局级别上创建仿真的特征重要性。例如,对于基准特征选择算法来说,这是特别有趣的。

xyp的Python项目详细描述


模拟监督学习数据drawing

使用xypy.Xy()可以方便地模拟有监督的学习数据,例如回归和分类问题。 仿真可以非常具体,因为用户有很多自由度。例如,函数 非线性的形状也是用户定义的。相互作用可以形成和(共同)变化。为了更多 您可以访问我们的blog的具体动机。 我已经从我的r版本改编了这个包,您可以查看here

使用量

您可以在testPYPIGitHub

您可以使用以下命令通过pypi方便地安装包。

pip install xypy

我的GitHub上有一个示例测试脚本,您可以从中开始 在模拟中。

模拟数据

您可以使用交互和用户指定的非线性来模拟回归和分类数据。与 参数stn可以改变模拟的信噪比。我强烈鼓励你 读这个blog post, 我分析了不同信噪比的ols系数。

# load the library
from xypy import Xy
# simulate regression data
my_sim = Xy(n = 1000, 
            numvars = [10,10], 
            catvars = [3, 2], 
            noisevars = 50, 
            stn = 100.0)

# get a glimpse of the simulation
my_sim

# plot the true underlying effects
my_sim.plot()

# extract the data
X, y = my_sim.data

# extract the true underlying model weights
my_sim.coef_

功能选择

您可以提取模拟的特征重要性。例如,对特征选择算法进行基准测试。 你可以阅读我用这个特性做的一个小基准 在我们的blog上。 在python中也可以轻松地执行相同的分析。

# Feature Importance 
my_sim.varimp()
drawing

请随时向我提供意见和想法。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java将Int值传递给另一个类   在使用Sdin(或非交互式)输入| Java时调试奇怪的输入错误   java返回一个文本字符串作为响应struts2   java为什么我们不能在声明局部变量之前初始化它呢?   java从现有XML中读取值并将其填充到Json中   java Spring Boot+Maven:找不到repositoryFactoryBean   java使用regex表示“W o.Rd”。replaceAll(“单词”、“替换”)   java Sub resorce在Jersey REST API框架中不起作用   java在组件启动时,当所述报告存储在Sharepoint中时,是否可以加载预格式化的WebDataRocks报告?   java并发更新列表的最佳方法   servlets Java web应用程序对象调度   应用程序在点击按钮时崩溃,Android Studio(Java)   java如何为掷骰子游戏调用另一个类中的方法?