我有熊猫数据帧数据框
import pandas as pd
lst = [23682, 21963, 9711, 21175, 13022,1662,7399, 13679, 17654,4567,23608,2828, 1234]
lst_match = ['[21963]','[21175]', '[1662 7399 13679 ]','[17654 23608]','[2828]','0','0','0','0','0','0', '0','0' ]
df = pd.DataFrame(list(zip(lst, lst_match)),columns=['ID','ID_match'])
测向
^{pr2}$ID_match列中的值也是ID,尽管是字符串格式的列表。在
我想创建一个具有唯一ID的dataframe,这样我的unique ID frame应该包含ID_match列中除0以外的所有ID,以及ID_match列中提到的那些ID。在
因此,我的输出数据帧的唯一ID必须如下所示:
ID
0 23682
1 21963
2 9711
3 21175
4 13022
5 1662
6 7399
7 13679
8 17654
9 23608
10 2828
我怎么能用Python熊猫做到这一点呢?在
这些看起来像列表的字符串表示。因此您可以使用
ast.literal_eval
和itertools.chain
:使用:
说明:
0
值ID
列按^{[ ]
^{} 值并按^{} 调整形状
然后通过^{} 获得第一级}
MultiIndex
,并转换^{s
转换为integer
sDataFrame
构造函数相关问题 更多 >
编程相关推荐