我有一个长嵌套列表,其中每个嵌入的列表可以有不同的长度或元素。我想把它展平,以便在模型中使用每个变量作为预测因子。嵌套列表如下所示:
[[u'Burgers',u'Bars'],[u'Local Services', u'Dry Cleaning & Laundry'],[u'Shopping', u'Eyewear & Opticians'],[u'Restaurants'],...]
我想实现的是我可以在模型中用作预测因子的东西,特别是在sklearn机器学习中。列表中的元素应该用来预测感兴趣的变量,即分数。期望的转换结果如下
^{pr2}$有人能帮我一把吗?我被困在这里了。非常感谢。在
您可以首先展平列表,然后从平坦的列表为各种类构建分数,并通过嵌套列表理解将
1
分配给给定子列表(称为category
)中找到的值,如果找不到类,则使用嵌套列表理解Y
是要预测的类的原始列表:熊猫的方法是:
可以使用
^{pr2}$.values
获取数组:这假设您在这些字符串中没有
;
,您可以用另一个分隔符来更改它。{但是通常情况下,使用scia2}进行预处理时,也需要先使用scia2}进行编码。在相关问题 更多 >
编程相关推荐