我在一个目录中有10个文本文件,每个文本文件都有随机文本数据(没有表格形式)。我试图用它创建一个dataframe,每个文本文件的数据应该是行而不是列。你知道吗
我尝试了下图中的代码,但是数据是以多列而不是行的形式加载的。在中指定轴参数读取.csv方法还是不走运。 谁能帮我一下吗。你知道吗
filelist = glob.glob('D:/Annaconda/Project/aclImdb_v1/aclImdb/test/neg1/*.txt')
df_list = [pd.read_csv(file) for file in filelist]
neg_df = pd.concat(df_list, axis=1, sort=False)
test=pd.DataFrame(neg_df)
test_df['label']=0
test_df.head()
应为:所有文件数据应按行追加。你知道吗
实际:所有文件数据都附加在10列中。你知道吗
这里还有两种没有循环的方法
原始数据文件
d1.csv
d2.csv
d3.csv
熊猫基地
使用Dask(installation)
来源
相关问题 更多 >
编程相关推荐