从csv文件中的列获取或编辑字符串

2024-03-29 10:14:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我的列中名为category的行如下所示:

{"id":342,"name":"Web","slug":"technology/web","position":15,"parent_id":16,"color":6526716,"urls":{"web":{"discover":"http://www.kickstarter.com/discover/categories/technology/web"}}}}

我想编辑这个列,这样只有"parent_id":**16**旁边的数字保留在列的每一行中,我怎么能这样做呢?你知道吗

我试图从这个csv文件中获取一个数据科学项目的分类功能,这个数字代表它们。你知道吗

我可以通过以下方式阅读文件和专栏:

import pandas as pd

df = pd.read_csv(r"filepath")
category = df.category

编辑: 我想要的专栏是:

    category
       15
       11
        1
        3
        5

剥离除父标识号以外的所有内容,因为这些数字代表一个类别,如16是技术。列的行数也接近3800


Tags: 文件csvnamewebid编辑df代表
1条回答
网友
1楼 · 发布于 2024-03-29 10:14:16

给你:

import pandas as pd

df = pd.DataFrame(
    {'col1' : [{"id":342,"name":"Web","slug":"technology/web","position":15,"parent_id":16}, 
               {"id":342,"name":"Web","slug":"technology/web","position":15,"parent_id":18}],
     'col2' : ['a', 'b']
    })

pd.concat([df, df['col1'].apply(pd.Series)['parent_id']], axis = 1).drop('col1', axis = 1)

相关问题 更多 >