在对来自dataframe的列表进行迭代时使用re.findall（）时出错

2条回答

网友

1楼 · 编辑于 2024-05-15 04:55:20

问题是，给您错误消息“TypeError:expected string或bytes like object”只存在于第二种方法中。这是因为您将“subsectors”而不是“string”传递给“li.sub”

因此，它应该是：

li = re.compile(r'(?<=[a-z])(?=[A-Z])')
strings = [li.sub(' ', string) for string in subsectors]

完整代码：

import re

subsectors = ['AntibodiesImmunotherapy', 'ProteinsImmunotherapy', 'Wound care', 'Cell therapyImmunotherapy']

strings = [' '.join(re.findall('[A-Z][^A-Z]*', s)) for s in subsectors]
print(strings)

li = re.compile(r'(?<=[a-z])(?=[A-Z])')
strings = [li.sub(' ', string) for string in subsectors]
print(strings)

strings=[]
for i in subsectors:
    strings.append(" ".join(re.findall('[A-Z][^A-Z]*', i)))
print(strings)

网友

2楼 · 编辑于 2024-05-15 04:55:20

让我们试试replace：

df = pd.DataFrame({'subsectors':['BuyMeADrink' ]})

df['subsectors'].str.replace('([A-Z][a-z]*)',r' \1').str.strip()

输出：

0    Buy Me A Drink
Name: subsectors, dtype: object

但是，您的问题本质上是不明确的，例如，您应该如何分割'ElectionInTheUSA'

相关问题更多 >

编程相关推荐

热门问题

热门文章

在对来自dataframe的列表进行迭代时使用re.findall（）时出错

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >