正则表达式从datafram中的一列中提取和拆分文本

2024-04-23 08:34:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个有两列的数据集-一列是日期,另一列是数据,值如下

date                                    data
1-1-2019     [[{'user_id': 1111, 'joining_date': '2011-01-01', 'country': 'EN'}]]

我的问题是如何拆分这个值并创建一个新列(并将前缀作为列名),如下所示?你知道吗

date       userid            joining_date          country
1-1-2019    1111              2011-01-01           EN

Tags: 数据iddatadatecountryenuseriduser
1条回答
网友
1楼 · 发布于 2024-04-23 08:34:41

这应该起作用:

# setup
df = pd.DataFrame({
    "date": ['1-1-2019', '1-1-2019'],
    "data": [[{'user_id': 1111, 'joining_date': '2011-01-01', 'country': 'EN'}],
             [{'user_id': 1234, 'joining_date': '2017-01-01', 'country': 'FR'}]]
})

# core logic
df1 = pd.DataFrame(df['data'].apply(lambda _: _[0]).values.tolist())
df1['date'] = df['date']

输出:

    country joining_date    user_id date
0   EN      2011-01-01      1111    1-1-2019
1   FR      2017-01-01      1234    1-1-2019

相关问题 更多 >