使用PySp从名称不包含字符串的文件夹中读取文件

2024-03-29 07:44:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个文件夹,里面的文件类似于-

./env_california_0100.xml
./env_california_0200.xml
./env_california_0300.xml
./env_california_0400.xml
./env_0100.xml
./env_0200.xml
./env_0300.xml
./env_0400.xml

使用pyspark,如果我想读取名称包含字符串“california”的文件,那么我会使用

df=spark.read.format("com.databricks.spark.xml").option("rowTag","someTag").load("/some_folder/*california*.xml")

但是如何读取没有字符串“california”的文件呢?你知道吗


Tags: 文件字符串env文件夹名称comformatdf