我有一个包含大量数据的数据框,如下所示:
temp_col
matt
joes\crabshack\one23
fail
joe:123,\
12345678,\
92313456,\
12341239123432,\
1321143
john
jacob
joe(x):543,\
9876544123,\
1234
如何将以“,\”结尾的所有数据和没有“,\”结尾的剩余行合并到一行中?你知道吗
预期产量:
temp_col
matt
joes\crabshack\one23
fail
joe:1231234567892313456123412391234321321143
john
jacob
joe(x):54398765441231234
你可以试试这个:
分解:
1)创建一个组变量,当元素不以
,\
结尾时,将在其中生成一个新组:2)定义一个
join
函数,去掉结尾的逗号和反斜杠3)对每个组应用join函数以连接以
,\
结尾的连续行:因为数据是包装的(我假设你在那里看到这个“\”,所以它是同一个单元格的一部分。那就是一个逗号分隔的数字。你知道吗
或者如果“\”是一个实际的字符,而不仅仅用于格式化
我认为在将数据加载到DataFrame之前(或何时)处理这个比较好。但如果你坚持这样做,试试这个:
相关问题 更多 >
编程相关推荐