将matplotlib图像插入pandas datafram

2024-04-20 06:31:17 发布

您现在位置:Python中文网/ 问答频道 /正文

目的:我目前正在与rdkit合作,根据rdkit.Chem.Draw.SimilarityMaps为我的分子结构着色。现在,我想使用matplotlib imagesSimilarityMaps函数在pandas数据帧中引入它们,并以html文件的形式导出该表。在

代码:我试着用下面的代码做到这一点

import pandas as pd
from rdkit import Chem
from rdkit.Chem import Draw
from rdkit.Chem.Draw import SimilarityMaps
from rdkit.Chem.Draw import IPythonConsole #Needed to show molecules
from rdkit.Chem.Draw.MolDrawing import MolDrawing, DrawingOptions

df = pd.DataFrame({'smiles':['Nc1nc(NC2CC2)c3ncn([C@@H]4C[C@H](CO)C=C4)c3n1','CCCC(=O)Nc1ccc(OCC(O)CNC(C)C)c(c1)C(C)=O','CCN(CC)CCNC(=O)C1=CC=C(C=C1)NC(=O)C','CC(=O)NC1=CC=C(C=C1)O','CC(=O)Nc1sc(nn1)[S](N)(=O)=O']})

def getSim(smi):
    mol = Chem.MolFromSmiles(smi)
    refmol = Chem.MolFromSmiles('c1ccccc1')
    fp = SimilarityMaps.GetMorganFingerprint(mol, fpType='bv')
    fig, maxweight = SimilarityMaps.GetSimilarityMapForFingerprint(refmol, mol, SimilarityMaps.GetMorganFingerprint)
    return fig

df['map'] = df['smiles'].map(getSim)
df.to_html('/.../test.html')

当我打开文件test.html时,map列包含信息“Figure(200x200)”。我检查我的dataframe map列是否包含object:在python中可以,但在html文件中不可以。在

问题:我不知道如何获得带有图像的数据帧,我希望能得到社区的帮助来澄清这个问题。在

提前谢谢


Tags: 文件数据fromimportmappandasdfhtml
1条回答
网友
1楼 · 发布于 2024-04-20 06:31:17

您看到的Figure (200x200)是matplotlib图形类的__repr__字符串。它是python对象的文本表示(与您在执行print(fig)时看到的相同)。在

相反,您需要的是在表中有一个实际的图像。一个简单的选择是将matplotlib图形保存为png图像,创建一个html标记<img src="some.png" />,然后显示该表。在

import pandas as pd
import numpy as np;np.random.seed(1)
import matplotlib.pyplot as plt
import matplotlib.colors

df = pd.DataFrame({"info" : np.random.randint(0,10,10), 
                   "status" : np.random.randint(0,3,10)})

cmap = matplotlib.colors.ListedColormap(["crimson","orange","limegreen"])

def createFigure(i):
    fig, ax = plt.subplots(figsize=(.4,.4))
    fig.subplots_adjust(0,0,1,1)
    ax.axis("off")
    ax.axis([0,1,0,1])
    c = plt.Circle((.5,.5), .4, color=cmap(i))
    ax.add_patch(c)
    ax.text(.5,.5, str(i), ha="center", va="center")
    return fig

def mapping(i):
    fig = createFigure(i)
    fname = "data/map_{}.png".format(i)
    fig.savefig(fname)
    imgstr = '<img src="{}" /> '.format(fname)
    return imgstr


df['image'] = df['status'].map(mapping)
df.to_html('test.html', escape=False)

enter image description here

这样做的缺点是磁盘上保存了很多图像。如果不需要,可以将编码为base64的图像存储在html文件<img src="..." />中。在

^{pr2}$

输出看起来相同,但没有保存到磁盘上的图像。在

这在Jupyter笔记本电脑上也能很好地工作,只需稍作修改

from IPython.display import HTML
# ...
pd.set_option('display.max_colwidth', -1)
HTML(df.to_html(escape=False, formatters=dict(status=mapping)))

enter image description here

相关问题 更多 >