使用pandas读取下载的html fi

2条回答

网友

1楼 · 编辑于 2024-05-14 17:50:33

首先安装以下用于分析的软件包
- pip安装美化组4
- pip安装lxml
- pip安装html5lib

然后使用“read_html”读取任何html页面上的html表。

import pandas as pds
pds_df = pds.read_html('C:/age0.html')
pds_df[0]

我希望这会有帮助。

祝你好运！！

网友

2楼 · 编辑于 2024-05-14 17:50:33

我认为您使用了像beautifuldsoup这样的html解析器，这是正确的做法。read_html（）读取的是html表而不是html页。

你会想做这样的事。。。

from bs4 import BeautifulSoup
import pandas as pd

table = BeautifulSoup(open('C:/age0.html','r').read()).find('table')
df = pd.read_html(table) #I think it accepts BeatifulSoup object
                         #otherwise try str(table) as input

编程相关推荐

java如何为ConcurrentHashMap使用并设置适当的并发级别？
java泛型方法，运行时错误，
java在页面上显示加载的图像
java Paypal定期直接支付问题
java如何延迟重新绘制组件
JavaSpringBoot+Hibernate如何维护@Transient字段
java在其方法中获取关于类的信息
在java中将别名添加到枚举
java如何解决向google报告成绩时“需要重新连接客户端”的问题
清晰的java图像背景

更新01

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用pandas读取下载的html fi

更新01

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >