我想从电子邮件中提取表格,在电子邮件客户端中查看邮件时显示表格
这是电子邮件快照
我想处理表,但在python代码中找不到获取它的方法
这里是原始数据的提取
decoded_data = base64.b64decode(data)
正在显示
b'a d g\r\nb e h\r\nc f j\r\na d\r\nb e h\r\nc f j\r\n\r\nBest Regards,\r\nVikrant Pawar\r\n'
而汤给人的感觉是
soup = BeautifulSoup(decoded_data, "lxml")
它表明
<html><body><p>a d g
b e h
c f j
a d
b e h
c f j
Best Regards,
Vikrant Pawar
</p></body></html>
有没有一种方法可以让我获得可以导入到熊猫中的表格数据
您可以从中拆分数据和表格列表:
请注意,如果有额外的
\r
和\n
,则应按data.split('\n\r')
分割。现在你可以得到你需要的组成一个df的部分。比如说,你只想在“致以最良好的祝愿”之前得到一部分。要做到这一点,我们首先需要对列表进行切片,然后拆分每个元素以形成:现在我们需要做的就是形成数据框架:
最终结果如下所示:
相关问题 更多 >
编程相关推荐