使用python/scikit/pandas生成dict向量从数组中收集字符串

2条回答

网友

1楼 · 编辑于 2024-05-16 08:58:01

我猜你问的是dict（名字：第一次出现的索引）。如果是这样的话，以下是您可以使用的方法：

>>> import pandas as pd
>>> namesCol = pd.Series(list('abac'))
>>> namesCol
0    a
1    b
2    a
3    c
dtype: object

理想的结论是

^{pr2}$

获取唯一名称：

>>> names = namesCol.unique()
>>> names
array(['a', 'b', 'c'], dtype=object)

现在查找每个名称的第一个匹配项：

>>> corresp = {name: namesCol[namesCol == name].index[0] for name in names}
>>> corresp
{'a': 0, 'c': 3, 'b': 1}

网友

2楼 · 编辑于 2024-05-16 08:58:01

labels, uniques = pd.vectorize(s['Reactant'])

这将返回您拥有的唯一值和该列的标签。。。在

如果你只是需要一本字典，而不是按照你的要求来替换它们或其他任何东西，你可以做以下事情：

^{pr2}$

在唯一值上循环，并为每个值指定一个整数。在