我有一个11行17604列的数据帧。行的数量可以随着集群的变化而变化。你知道吗
B42D2033/26 G02B27/2214 G02F1/133753 G02F1/133707 G02F1/1341 G02F1/1339 G02F1/133371 G02B6/005 C08G73/12 G02F1/1303 ... G06F17/30035 G06F21/629 B65B3/26 E04D13/00 G06F17/30952 G07C9/00912 F02C9/28 G06F17/28 G06F17/30964 G06F21/82
Cluster
C1 0.000000 1.000000 0.000000 0.000000 0.000000 1.000000 0.000000 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C10 0.000000 3.250000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C11 0.020619 1.149485 0.262887 0.829897 0.551546 1.030928 0.082474 1.175258 0.005155 0.216495 ... 0.005155 0.010309 0.005155 0.005155 0.005155 0.005155 0.005155 0.005155 0.005155 0.005155
C2 0.000000 1.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C3 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C4 0.055556 13.500000 8.333333 24.555556 13.166667 26.666667 3.277778 4.222222 0.000000 2.388889 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C5 0.000000 0.750000 0.000000 0.000000 0.000000 0.500000 0.000000 0.250000 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C6 0.032258 3.451613 0.000000 0.000000 0.000000 0.387097 0.000000 0.064516 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C7 0.000000 0.000000 0.250000 0.000000 0.000000 0.250000 0.000000 0.000000 0.000000 1.500000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C8 0.000000 0.076923 0.153846 0.346154 0.000000 0.884615 0.461538 0.192308 0.038462 0.076923 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
C9 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
我想根据列中的值为每个集群生成一个字典或序列。例如,值!=0
可能会以字典形式显示的所有列,如:
{'C1', ['G02B27/2214', 'G02F1/1339']}
如果值等于“某个值”或某个值范围,如何为每个簇行生成一个序列?你知道吗
我确实看过Select rows from a DataFrame based on values in a column in pandas,但这种解决方案并不适用于一行中的所有列。你知道吗
编辑:
我意识到我可以转置df
并执行如下操作:
df_clusters.T[df_clusters.T['C1']>0]
对于“C1”大于0的每一行,返回一个df
。我想我可以删除其他集群列,但我认为这不是最好的解决方案。你知道吗
尝试:
其思想是为每个条件创建值的索引,然后创建新的DataFrame并根据list中的
indices
获取list,然后转换为dict
:另一种解决方案是使用^{} 或^{} 进行整形,按^{} 或^{} 过滤,最后用
dict
创建list
:相关问题 更多 >
编程相关推荐