Python Pandas-不同列的Concat数据帧忽略列名

df_ger index Datum Zahl1 Zahl2 0 1-1-17 1 2 1 2-1-17 3 4 df_uk index Date No1 No2 0 1-1-17 5 6 1 2-1-17 7 8 desired output index Datum Zahl1 Zahl2 0 1-1-17 1 2 1 2-1-17 3 4 2 1-1-17 5 6 3 2-1-17 7 8

3条回答

网友

1楼 · 编辑于 2024-05-19 02:55:35

如果您可以确保两个数据帧的结构保持不变，我将看到两个选项：

保留所选默认语言的数据帧列名（我假设为en_GB），然后复制它们：
```
df_ger.columns = df_uk.columns
df_combined = pd.concat([df_ger, df_uk], axis=0, ignore_index=True)
```
不管列名是什么，都可以。不过，从技术上讲，它仍在更名。

使用numpy.ndarrays从数据帧中提取数据，在numpy中连接它们，然后再次从中生成数据帧：

np_ger_data = df_ger.as_matrix()
np_uk_data = df_uk.as_matrix()
np_combined_data = numpy.concatenate([np_ger_data, np_uk_data], axis=0)
df_combined = pd.DataFrame(np_combined_data, columns=["Date", "No1", "No2"])

这个解决方案需要更多的资源，所以我会选择第一个。

网友

2楼 · 编辑于 2024-05-19 02:55:35

如果列总是以相同的顺序排列，则可以机械地^{}列并执行类似于^{}的操作：

代码：

new_cols = {x: y for x, y in zip(df_uk.columns, df_ger.columns)}
df_out = df_ger.append(df_uk.rename(columns=new_cols))

测试代码：

df_ger = pd.read_fwf(StringIO(
    u"""
        index  Datum   Zahl1   Zahl2
        0      1-1-17  1       2
        1      2-1-17  3       4"""),
    header=1).set_index('index')

df_uk = pd.read_fwf(StringIO(
    u"""
        index  Date    No1     No2
        0      1-1-17  5       6
        1      2-1-17  7       8"""),
    header=1).set_index('index')

print(df_uk)
print(df_ger)

new_cols = {x: y for x, y in zip(df_uk.columns, df_ger.columns)}
df_out = df_ger.append(df_uk.rename(columns=new_cols))

print(df_out)

结果：

         Date  No1  No2
index                  
0      1-1-17    5    6
1      2-1-17    7    8

        Datum  Zahl1  Zahl2
index                      
0      1-1-17      1      2
1      2-1-17      3      4

        Datum  Zahl1  Zahl2
index                      
0      1-1-17      1      2
1      2-1-17      3      4
0      1-1-17      5      6
1      2-1-17      7      8

网友

3楼 · 编辑于 2024-05-19 02:55:35

我不确定这是否会比你想象中的简单，但是如果主要目标是一些一般的东西，那么这应该是一个假设：两个文件中的列匹配例如，如果日期是第一列，翻译版本也将是第一列。

# number of columns
n_columns = len(df_ger.columns)

# save final columns names
columns = df_uk.columns

# rename both columns to numbers
df_ger.columns = range(n_columns)
df_uk.columns = range(n_columns)

# concat columns
df_out = pd.concat([df_ger, df_uk], axis=0, ignore_index=True)

# rename columns in new dataframe
df_out.columns = columns

代码：

测试代码：

结果：

相关问题更多 >

编程相关推荐

热门问题

热门文章