这件事对我来说比较棘手。我试图用python从google sheets中提取嵌入式表
这是link
我不拥有这张纸,但它是公开的
这是迄今为止我的代码,当我去输出标题时,它显示给我“”。任何帮助都将不胜感激。最终目标是将此表转换为一个表。谢谢各位
import lxml.html as lh
import pandas as pd
url = 'https://docs.google.com/spreadsheets/u/0/d/e/2PACX-1vQ--HR_GTaiv2dxaVwIwWYzY2fXTSJJN0dugyQe_QJnZEpKm7bu5o7eh6javLIk2zj0qtnvjJPOyvu2/pubhtml/sheet?headers=false&gid=1503072727'
page = requests.get(url)
doc = lh.fromstring(page.content)
tr_elements = doc.xpath('//tr')
col = []
i = 0
for t in tr_elements[0]:
i +=1
name = t.text_content()
print('%d:"%s"'%(i,name))
col.append((name,[]))
如果您想将数据放入数据框,可以直接加载:
这将为您提供:
注意
read_html
返回一个列表。在这种情况下,只有 1数据帧,因此我们可以引用第一个也是唯一的索引位置[0]
相关问题 更多 >
编程相关推荐