由于单元格A1为blan,数据帧不考虑A列

2024-05-15 21:14:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图将所有的原始数据(csv文件)导入到一个DataFrame中,由于原始数据文件中有一些无用的行,我喜欢通过“drop”删除它们,但是第一列的行是一个空白单元格。我无法删除它,数据帧无法识别该列。在

这是我的代码:

import pandas as pd
import numpy as np   
import glob
import os

#Determine file path for index weighting files
pathwgt=r'//10.27.36.181/etf/Bill/Quant/AxJ_Weight'
filenames = glob.glob(pathwgt + "/*.csv")

#declare data frame
dfwgt=pd.DataFrame()

#consolidate all files into one data frame
for filename in filenames:
    dfwgt=dfwgt.replace('',np.NaN)
    dfwgt=dfwgt.append(pd.read_csv(filename))

dfwgt=dfwgt.drop(['Symbol','Company'])

现在,我在excel中的单元格A1是空白的,B1有一个字符串,我想删除整个第1行。dataFrame形状是[124544行x 6列],其中它假设为[124544行x7列]


Tags: 文件csvimportdataframefor原始数据asnp
1条回答
网友
1楼 · 发布于 2024-05-15 21:14:59

你有一些解决问题的方法:

删除行和标题:

pd.read_csv('data.csv', skiprows=1, header=None)

这将创建一个具有由数字标识的列名的数据帧。(例如从0 -> 3


下拉列:

^{pr2}$

将导致为未命名的列指定名称'Unnamed: 0'您可以通过执行以下操作删除此列:

df = df.drop('Unnamed: 0', axis=1)

更改名称:

^{pr2}$

或者:

df = df.rename(columns={'Unnamed: 0': 'new_name'}

如果以上这些都不能解决你的问题,那么我很难理解你的问题。在

相关问题 更多 >