Python Pandas用以上单元格的单元格值递增地填充NaN

Word Count Team Sex Code 0 develop 9 1 M P45.01 1 Effective 7 NaN M NaN 2 professional 8 NaN M NaN 3 approach 5 NaN M NaN 4 raster 34 NaN M NaN 5 Sad 55 NaN M NaN 6 water 2 NaN M NaN 7 soil 7 NaN M NaN 8 farming 9 NaN M NaN 9 deep 12 NaN M NaN

3条回答

网友

1楼 · 编辑于 2024-05-12 20:42:26

我意识到您也可以执行以下操作之一，因为您在此处更新了dataframe：

设置

import re

def count(n):
    x = 0
    while x < n:
        yield x
        x += 1

def populate(s, step):
    chars = re.split('(\d*)', s)
    number = int(chars[1]) + step
    chars[1] = str(number)
    return ''.join(chars)

number_generator = count(10)
number_generator2 = count(10)

主

^{pr2}$

我们需要注意的一点是，生成器正在动态生成数字，并且只能使用一次；但它确实起作用。在

网友

2楼 · 编辑于 2024-05-12 20:42:26

df.insert(0,'Team',range(1,1+len(df)))

这将适用于现有的1和2

或者

^{pr2}$

或者最终

df=df.reset_index()
df['Team']=df.index+1

还没有测试过，但应该可以用

网友

3楼 · 编辑于 2024-05-12 20:42:26

我相信您可以创建范围并将其添加到第一个值中，因为Sex使用ffill：

r = np.arange(len(df))
df['Team'] = df.loc[0, 'Team'] + r
df['Code'] = df.loc[0, 'Code'] + r
df['Sex'] = df['Sex'].ffill()
print (df)
           Word  Count  Team Sex   Code
0       develop      9   1.0   M  45.01
1     Effective      7   2.0   M  46.01
2  professional      8   3.0   M  47.01
3      approach      5   4.0   M  48.01
4        raster     34   5.0   M  49.01
5           Sad     55   6.0   M  50.01
6         water      2   7.0   M  51.01
7          soil      7   8.0   M  52.01
8       farming      9   9.0   M  53.01
9          deep     12  10.0   M  54.01

更一般的广播：

^{pr2}$

编辑：

如果只有float之前有字符串，则可以将其提取到df1，添加范围和最后添加前缀：

r = np.arange(len(df))
df['Team'] = (df.loc[0, 'Team'] + r).astype(int)
df1 = df.loc[[0], 'Code'].str.extract('(\D+)(\d+\.\d+)', expand=False)
print (df1)
   0      1
0  P  45.01

df['Code'] = float(df1.loc[0, 1]) + r
df['Code'] = df1.loc[0, 0] + df['Code'].astype(str)
df['Sex'] = df['Sex'].ffill()
print (df)

           Word  Count  Team Sex    Code
0       develop      9     1   M  P45.01
1     Effective      7     2   M  P46.01
2  professional      8     3   M  P47.01
3      approach      5     4   M  P48.01
4        raster     34     5   M  P49.01
5           Sad     55     6   M  P50.01
6         water      2     7   M  P51.01
7          soil      7     8   M  P52.01
8       farming      9     9   M  P53.01
9          deep     12    10   M  P54.01

编辑：

错误似乎没有第一个索引值0，而是其他值。也可以使用按位置选择的iloc：

r = np.arange(len(df))
df['Team'] = (df.iloc[0, df.columns.get_loc('Team')] + r).astype(int)
df1 = df.iloc[[0], df.columns.get_loc('Code')].str.extract('(\D+)(\d+\.\d+)', expand=False)

df['Code'] = float(df1.loc[0, 1]) + r
df['Code'] = df1.loc[0, 0] + df['Code'].astype(str)
df['Sex'] = df['Sex'].ffill()
print (df)

           Word  Count  Team Sex    Code
0       develop      9     1   M  P45.01
1     Effective      7     2   M  P46.01
2  professional      8     3   M  P47.01
3      approach      5     4   M  P48.01
4        raster     34     5   M  P49.01
5           Sad     55     6   M  P50.01
6         water      2     7   M  P51.01
7          soil      7     8   M  P52.01
8       farming      9     9   M  P53.01
9          deep     12    10   M  P54.01

设置

主

相关问题更多 >

编程相关推荐

热门问题

热门文章