如何合并python中存储在变量中的多个路径中的所有文件
下面,我尝试在一个可验证的文件中获取所有路径:
SUR_INVOICE_FILES = []
listoffolders = []
dir = path_in
inbound = dbutils.fs.ls (dir)
for folder in inbound:
subfolderlist = dbutils.fs.ls(folder.path)
for listoffolders in subfolderlist:
list_of_sources= listoffolders.path
SR = dbutils.fs.ls(list_of_sources)
SUR_INVOICE_FILES.append(listoffolders.path)
root = (''+re.search('(/\w+)+.+',list_of_sources).group())
print(root)
“root”为我提供了文件的所有路径:
/mnt/datalake/**/SurInvoice/2020-08-31_093551/SurInvoice.parquet
/mnt/datalake/**/SurInvoice/2020-08-31_103115/SurInvoice.parquet
/mnt/datalake/**/SurInvoice/2020-09-01_075931/SurInvoice.parquet
/mnt/datalake/**/SurInvoice/2020-09-17_080933/SurInvoice.parquet
现在我想把merge
的所有内容parquet files
放在一个文件中,并以JSON
格式存储在不同的网络目录中。我该怎么做
使用pandas读取,连接数据帧,然后写入json文件。像这样的
将此添加到代码中。看看这是否有效:
相关问题 更多 >
编程相关推荐