在一系列Python文本数据中,如何在第一个空白之前修剪字符串?

2024-04-20 03:57:50 发布

您现在位置:Python中文网/ 问答频道 /正文

在这个数据中,我想删去第一个空格之前的代码字符串。还想删除python中“IN”字符后面的字符串。 这里有一个简单的例子。我有一个像这样的熊猫专栏。在

line = ["RCI-AMG-3664 Laboratory Specialist","RCI-VBC-09568 Administrative Assistant in Cary, NC"]

Tags: 数据字符串代码inline字符例子空格
2条回答

我假设你是逐行阅读文本并将每一行保存在一个字符串中?如果您在字符串“a”中保存了一行

a[a.find(' ')+1:]

只返回字符串第一个空格后的部分。在

编辑用户澄清这些线是熊猫系列的。在这种情况下,上述方法仍然有效,但我们需要将其应用于该系列:

^{pr2}$

如果序列可以包含字符串以外的对象,则需要在函数中添加类型检查。在

  • 可以使用regex进行数据预处理。在
  • 您也可以通过pandas apply function在系列中执行移除噪声功能。在

import re

def remove_noise(data):
    ans = re.sub('\s+',' ',data)
    ans = re.sub('\sin\s.*','',data)
    ans = data.split(' ')
    del(data[0])
    ans = ' '.join(map(str, data))
    return ans;

相关问题 更多 >