如何访问新数据帧中的单元格?

2024-04-23 17:20:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我根据原始数据帧(df)中的条件创建了一个子数据帧(drama_df)。但是,我无法使用典型的drama_df['summary'][0]访问单元格。相反,我得到了一个KeyError: 0。我很困惑,因为type(drama_df)是一个数据帧。我该怎么办?请注意,df['summary'][0]确实返回字符串。你知道吗

drama_df = df[df['drama'] > 0]

#Now we generate a lump of text from the summaries
drama_txt = ""
i = 0
while (i < len(drama_df)):
    drama_txt = drama_txt + " " + drama_df['summary'][i]
    i += 1

编辑 以下是df的一个示例: enter image description here

下面是一个戏剧的例子: enter image description here


Tags: 数据字符串txtdf原始数据typesummary条件
2条回答

在这里等一下。你在找str.join公司()操作。你知道吗

只需这样做:

drama_txt = ' '.join(drama_df['summary'])

或:

drama_txt = drama_df['summary'].str.cat(sep=' ')

这将为您解决:

drama_df['summary'].iloc[0]

当您创建子数据帧时,您可能会留下索引0。因此需要使用iloc按位置而不是按索引名(0)获取元素。你知道吗

也可以使用.iterrows().itertuples()执行此例程: Itertuples的速度要快得多,但是如果您有很多列,则需要处理的工作量要大一些

for row in drama_df.iterrows():
    drama_txt = drama_txt + " " + row['summary']

要加快速度:

for index, summary in drama_df[['summary']].itertuples():
    drama_txt = drama_txt + " " + summary

相关问题 更多 >