我想拆分逗号、分号或连字符(前面有空格)分隔的单词。
原因是我正在使用的网站结构不一致。
到目前为止,我能够用以下代码拆分逗号或分号分隔的单词:
for i in response.xpath('//meta[@name="keywords"]/@content').extract():
if ',' or ';' in i:
for k in i.split(',') or i.split(';'):
keywords.append([k.strip()])
else:
keywords.append([i.strip()])
如果两个词分开,就像:
但有时关键字也存储如下:
关键字1-关键字2-关键字3
我不知道如何正确地拆分它们,因为连字符之间的空格让我头痛:)。非常感谢您的帮助!你知道吗
你可能想看看regular expressions
你试过:
您可能需要使用正则表达式。
re.split('\s*-\s*', mystring)
应该做这项工作。你知道吗相关问题 更多 >
编程相关推荐