Python Pandas导入Excel文件,遍历每一行,添加新值,并添加到datafram

2024-04-30 07:08:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个Excel文件,其中包含项目代码和需要导入的抽象字段,这样我就可以在摘要上运行一个简单的文本摘要生成器,然后添加到dataframe中。在

我的Excel数据集如下所示:

[Proj_Number] | [Abstract]

JJF-123          | Diabetes is a serious chronic condition.  
JFR-223          | Cardiovascular disease is also a chronic condition. 
JF3-334          | Don't forget about asthma and how much it sucks. 

导入数据后,我希望应用我的文本摘要生成器并获得以下结果:

^{pr2}$

我知道我的代码是错误的,但我不知道如何循环遍历每一行,从抽象中获取抽象关键字,将其添加到数据帧中,然后将其导出。在

from gensim.summarization.summarizer import summarize
from gensim.summarization import keywords
import pandas as pd

dataset = pd.read_excel('abstracts.xlsx',encoding="ISO-8859-1")
df = pd.DataFrame(dataset)
cols = [1,2]
df = df[df.columns[cols]]

for d in df:
d =  keywords(d, ratio=0.15, split=True))
print(d)

Tags: 数据代码from文本importdfiscondition
1条回答
网友
1楼 · 发布于 2024-04-30 07:08:16

您不想用for d in df:遍历df中的每一行

Pandas有一种将函数应用于数据帧的每一行并通过apply函数返回序列的方法

如果您适当地重命名数据帧的列

df['Ab_keywords'] = df['Abstract'].apply(lambda text: keywords(text, ratio=0.15, split=True))

应该行得通。在

这里lambda函数应用于df['Abstract']的每一行,并将每行的值作为其参数。在

相关问题 更多 >