http://amz.com/New-Balance-WT910-Trail-Running/dp/B0098FOFCW/ref=zg_bsms_shoes_2
我不需要最后的/ref=zg_bsms_shoes_2
我有urls=[]
中的值
for productlink in products:
self.urls.append(productlink)
def save(self):
self.br.quit()
f=open(self.product_file,"w")
for url in self.urls:
f.write(url+"\n")
f.flush()
怎么脱光它?如果我没有/ref=,也有失败证明?你知道吗
我强烈建议您从
urlparse
开始:在Python3中:
urlparse
将把URL转换成它的所有组成部分,然后您可以用多种方式处理路径,简单的字符串拆分,os.path.split
,regex,任何您喜欢的方式。你知道吗在Python2中只需使用
from urlparse import urlparse
相关问题 更多 >
编程相关推荐