有一个带有CSV内容的html标记<a>
的字符串值:
href = "data:text/csv;charset=UTF-8,%22csvcontentfollows"
有没有一种方法可以通过标准模块(requests、lxml、pure python)的方法来获取CSV内容而不必这样的meta头data:text/csv;charset=UTF-8
?你知道吗
我不想使用手动文本解析(通过regexp、index/startswith、split/partition)。你知道吗
更新:
谢谢,我知道如何使用html。我的问题是关于这样的元头。我重新制定了计划。你知道吗
这里有三种可能的解决办法。第一种使用本机Pythonurllib.request.urlopen功能。第二个使用第三方库lxml。第二个使用来自本机的HTMLParser类html.parser语法分析器模块。第二个和第三个使用第三方库来解析data URLs,称为python-datauri
输出:
['csvcontentfollows', 'csvcontentfollows', 'csvcontentfollows']
输出:
输出:
相关问题 更多 >
编程相关推荐