我正在努力清理我的句子,以及我想删除句子中的这些标记(它们是下划线形式,后跟一个单词,例如“h”)。 基本上,我想删除后接下划线的字符串(同时删除下划线本身)
文本:
['hanks_NNS sir_VBP',
'Oh_UH thanks_NNS to_TO remember_VB']
所需输出:
^{pr2}$下面是我尝试的代码:
for i in text:
k= i.split(" ")
print (k)
for z in k:
if "_" in z:
j=z.replace("_",'')
print (j)
电流输出:
ThanksNNS
sirVBP
OhUH
thanksNNS
toTO
rememberVB
RemindVB
使用正则表达式:
你可以用^{} 来做。匹配字符串中所需的子字符串,并将子字符串替换为空字符串:
输出:
^{pr2}$正则表达式:
不带正则表达式:
输出:
^{pr2}$代码有问题:
实际上,您只是想用空字符串替换
'_'
及其后的字符。在相关问题 更多 >
编程相关推荐