在pandas中结构化和透视损坏的数据帧

import pandas as pd whatIHave = {'countryName': ['','United States','Canada'], 'provinceName': ['','New York','Ontario'], 'productID': ['','35','55'], 'productName': ['', 'Sugar', 'Corn'], 'dateID': ['sourceOfData', 'CommissionAgent1', 'CommissionAgent1'], '2021-09-06': ['productPrice','2.6$','2.6$'], '2021-09-07': ['productPrice','5.5$','5.5$'], '2021-09-08': ['productPrice','3.4$','3.4$'] } df_whatIHave = pd.DataFrame(whatIHave, columns = ['countryName', 'provinceName', 'productID', 'productName', 'dateID', '2021-09-06', '2021-09-07', '2021-09-08']) print(df_whatIHave) whatINeed = {'countryName': ['United States','United States','United States', 'Canada', 'Canada', 'Canada'], 'provinceName': ['New York','New York','New York', 'Ontario', 'Ontario', 'Ontario'], 'productID': ['35','35','35', '55', '55', '55'], 'productName': ['Sugar', 'Sugar', 'Sugar', 'Corn', 'Corn', 'Corn'], 'sourceOfData': ['CommissionAgent1', 'CommissionAgent1', 'CommissionAgent1', 'CommissionAgent1', 'CommissionAgent1', 'CommissionAgent1'], 'dateID': ['2021-09-06', '2021-09-07', '2021-09-08', '2021-09-06', '2021-09-07', '2021-09-08'], 'productPrice': ['2.6$','5.5$','3.4$','2.6$','5.5$','3.4$'] } df_whatINeed = pd.DataFrame(whatINeed, columns = ['countryName', 'provinceName', 'productID', 'productName', 'sourceOfData', 'dateID', 'productPrice']) print(df_whatINeed)

1条回答

网友

1楼 · 发布于 2024-05-16 12:43:38

经过数小时的搜索，我将问题分成若干部分，并将其合并，从而解决了这个问题。如果我们将数据帧视为df_，那么我们有：

df2 = df_whatIHave.iloc[1:, 0:6]
df2 = df2.reset_index()

columnSize = df_whatIHave.shape[1]

df3 = df_whatIHave.iloc[:, 6:columnSize]
df4 = df3.iloc[1:]

我将数据帧分为两部分，并实现了stack（）函数，该函数对于根据日期复制行非常重要：

df4 = df4.stack()
df4 = df4.to_frame().reset_index()

然后我合并了这两个dfs，如下所示：

df_merged= pd.merge(df2, df4, on='index', how='inner')

相关问题更多 >

编程相关推荐

热门问题

热门文章