我正在写一个scrapy代码,它获取url,标记,我的数据被从csv文件中存储。我分配给临时变量的标记,如z(有h1)、av(有title)、an(有td)等。当我在xpath中使用该变量时,它不会从该标记中提取任何内容。有人能帮我吗 ? 你知道吗
import pandas as pd
import requests
from scrapy.http import TextResponse
x=pd.read_csv(r'C:\Users\ndewan\Desktop\pattern-swage.csv', encoding="utf-8")
x=x.replace('<','',regex=True).replace('>','',regex=True)
url=str(x.iloc[0,0])
r = requests.get(url)
response = TextResponse(r.url, body=r.text, encoding='utf-8')
z=x.iloc[0,1]
s=x.iloc[0,2]
an=x.iloc[0,3]
av=x.iloc[0,4]
part=response.xpath('//av//text()').extract()
print(part)
print(url)
print(z)
因为您使用的是变量,所以应该用
$
表示它们,并将它们的值作为关键字参数per the docs提供。你知道吗或者,如果愿意,可以使用字符串格式。你知道吗
相关问题 更多 >
编程相关推荐