Pandas：按组ID逐行填充NaN值

appended = appended.sort_values(by=['Company','Intro'],na_position='last') appended = appended.reset_index(drop=True) for i in appended.index: if i==0: pass else: if appended.at[i,'Company']==appended.at[i-1,'Company']: appended.fillna(method='ffill',inplace=True) else: pass

Company Intro Categories Headquarters Founded Date Funding Stage Apple xyz Healthcare, Big Data New York 2018 Series A Apple NaN NaN NaN NaN NaN Apple NaN NaN NaN NaN NaN Banana Lier Government Europe 2010 Series B Pear NaN NaN NaN NaN NaN

Expected Result Company Intro Categories Headquarters Founded Date Funding Stage Apple xyz Healthcare, Big Data New York 2018 Series A Apple xyz Healthcare, Big Data New York 2018 Series A Apple xyz Healthcare, Big Data New York 2018 Series A Banana Lier Government Europe 2010 Series B Pear NaN NaN NaN NaN NaN

2条回答

网友

1楼 · 编辑于 2024-06-16 11:26:08

将^{}与^{}一起使用

df.groupby(['Company']).ffill()

  Company Intro            Categories Headquarters  Founded Date Funding Stage
0   Apple   xyz  Healthcare, Big Data     New York        2018.0      Series A
1   Apple   xyz  Healthcare, Big Data     New York        2018.0      Series A
2   Apple   xyz  Healthcare, Big Data     New York        2018.0      Series A
3  Banana  Lier            Government       Europe        2010.0      Series B
4    Pear   NaN                   NaN          NaN           NaN           NaN

网友

2楼 · 编辑于 2024-06-16 11:26:08

import pandas as pd
from io import StringIO

# sample data
df = pd.read_fwf(StringIO("""
Company    Intro                 Categories   Headquarters  Founded_Date   Funding_Stage
 Apple       xyz       Healthcare, Big Data     New York       2018           Series A
 Apple       NaN              NaN                NaN           NaN             NaN
 Apple       NaN              NaN                NaN           NaN             NaN
 Banana     Lier           Government           Europe        2010           Series B
 Pear        NaN              NaN                NaN           NaN             NaN"""), header=1)


# Create the summary level - assumes repeat data comes first
df_summary = df.groupby("Company").head(1)

# Join the result
df_result = df[['Company']].merge(df_summary, on="Company")

#  Company Intro            Categories Headquarters  Founded_Date Funding_Stage
#0   Apple   xyz  Healthcare, Big Data     New York        2018.0      Series A
#1   Apple   xyz  Healthcare, Big Data     New York        2018.0      Series A
#2   Apple   xyz  Healthcare, Big Data     New York        2018.0      Series A
#3  Banana  Lier            Government       Europe        2010.0      Series B
#4    Pear   NaN                   NaN          NaN           NaN           NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章