我是熊猫框架的新手,我已经搜索了足够多的内容来解决我的问题,但在网上没有得到太多帮助
我有一个字符串列,如下所示,我想将其转换为单独的列。我这里的问题是我尝试过拆分它,但它没有按我需要的方式提供输出
*-----------------------------------------------------------------------------*
| Total Visitor |
*-----------------------------------------------------------------------------*
| 2x Adult, 1x Adult + Audio Guide |
| 2x Adult, 2x Youth, 1x Children |
| 5x Adult + Audio Guide, 1x Children + Audio Guide, 1x Senior + Audio Guide |
*-----------------------------------------------------------------------------*
下面是我用来分割字符串但没有给出预期输出的代码
df = data["Total Visitor"].str.split(",", n = 1, expand = True)
拆分字符串后,我的预期输出应如下表所示:
*----------------------------------------------------------------------------------------------------------------*
| Adult | Adult + Audio Guide | Youth | Children | Children + AG | Senior + AG
*----------------------------------------------------------------------------------------------------------------*
| 2x Adult | 1x Adult + Audio Guide | - | - | - | -
|
| 2x Adult | - |2x Youth | 1x Children | - | -
| - | 5x Adult + Audio Guide | - | - |1x Children + Audio Guide| 1x Senior + Audio Guide |
*----------------------------------------------------------------------------------------------------------------*
我该怎么做?任何帮助或指导都会很好
以下是使用pandas方法的一种方法:
输出:
其思想是创建字典列表,其中带有
x
和regex
-^\d+x\s+
(^
是字符串的开头,\d+
是一个或多个整数,\s+
是一个或多个空格),并传递给DataFrame
构造函数:另一个类似的想法是
x
从dict的键中分离列名称:相关问题 更多 >
编程相关推荐