向Pandas中的现有列添加值问题的回答

向Pandas中的现有列添加值

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我循环到一个目录中的csv文件，并用panda读取它们。对于每个csv文件，我都有一个类别和一个市场。然后我需要从数据库中获取类别的id和市场的id，这对于这个csv文件是有效的。 finalDf是一个包含所有csv文件的所有产品的数据框，我需要将它与当前csv中的数据一起附加。 当前CSV的产品列表将使用以下方法检索： <pre><code>df['PRODUCT'] </code></pre> 我需要将它们附加到finalDf中，我使用： <pre><code>finalDf['PRODUCT'] = finalDf['PRODUCT'].<a href="https://www.cnpython.com/list/append" class="inner-link">append</a>(df['PRODUCT'],ignore_index=True) </code></pre> 这似乎很好，我现在必须插入catid和marketid到finalDf的相应列中。因为catid和marketid在当前csv文件中是一致的，所以我只需要在df数据帧中有行的情况下添加它们，这就是我在下面的代码中要实现的。 <pre><code>finalDf = pd.DataFrame(columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']) finalDf['PRODUCT'] = finalDf.PRODUCT.astype('category') df = pd.read_csv(filename, header=None, names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE', 'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t') finalDf['PRODUCT'] = finalDf['PRODUCT'].append(df['PRODUCT'],ignore_index=True) # Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df catid = 2113 marketid = 13 catids = pd.Series([catid]*len(df.index)) marketids = pd.Series([marketid]*len(df.index)) finalDf['CAT_ID'] = finalDf['CAT_ID'].append(catids, ignore_index=True) finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append(marketids, ignore_index=True) print finalDf.head() PRODUCT CAT_ID MARKET_ID 0 ABC NaN NaN 1 ABB NaN NaN 2 ABE NaN NaN 3 DCB NaN NaN 4 EFT NaN NaN </code></pre> 如您所见，我只是有NaN值而不是实际值。预期产量： <pre><code> PRODUCT CAT_ID MARKET_ID 0 ABC 2113 13 1 ABB 2113 13 2 ABE 2113 13 3 DCB 2113 13 4 EFT 2113 13 </code></pre> 包含多个csv的finalDF如下所示： <pre><code> PRODUCT CAT_ID MARKET_ID 0 ABC 2113 13 1 ABB 2113 13 2 ABE 2113 13 3 DCB 2113 13 4 EFT 2113 13 5 SDD 2114 13 6 ERT 2114 13 7 GHJ 2114 13 8 MOD 2114 13 9 GTR 2114 13 10 WLY 2114 13 11 WLO 2115 13 12 KOP 2115 13 </code></pre> 知道吗？ 谢谢

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

向Pandas中的现有列添加值

1 个回答

相关Python问题