递归文件读取火花流

2024-04-27 03:11:54 发布

您现在位置：Python中文网/ 问答频道 /正文

1982

网友

男 | 程序猿一只，喜欢编程写python代码。

流目录是主目录，其中有多个子目录。你知道吗

我想通过spark流来实现这个功能，spark流访问每个子文件夹并从中捕获文件。你知道吗

import os
rootdir = 'C:\user\Data_Sources'

for subdir, dirs, files in os.walk(rootdir):
    for file in files:
        temp = os.path.join(subdir, file)

到目前为止，我已经这样做了，但它只适用于3个子目录。如果我按照子目录增加'*'的数量，那么spark streaming只读取最后两个目录中的文件，而不读取以前的其他目录。你知道吗

 df = spark.readStream.text('file:///home/user/stream1.0/*/*/*', wholetext=True)

Tags：文件 in import 功能目录文件夹 for os

0条回答

目前没有回答

编程相关推荐

java Log4j:运行服务器日志时发出警告
ssl与Java通信到TLSEncypted CUPS打印服务器
Guice Java提供的方法没有已知的依赖关系？
java Android:EditText的默认文本大小是多少？
更正错误字符串的Java异常
string Java如何从来自多个源的数据推断类型
从路径错误创建java文件
java获取不同类安卓中切换按钮的状态
java扩展AnyVal和AnyRef的对象的内存分配有什么不同
java如何从callable（即runnable）获取类名

热门问题

如何使用带Pycharm的萝卜进行自动完成
10 个回答
如何使用带python selenium的电报机器人发送消息
6 个回答
如何使用带Python UnitTest decorator的mock_open？
1 个回答
如何使用带pythonflask的swagger yaml将apikey添加到API（创建自己的API）
7 个回答
如何使用带python的OpenCV访问USB摄像头？
6 个回答
如何使用带python的plotly express将多个图形添加到单个选项卡
5 个回答
如何使用带Python的selenium库在帧之间切换？
11 个回答
如何使用带Python的Socket在internet上发送PyAudio数据？
4 个回答
如何使用带pytorch的张力板？
3 个回答
如何使用带ROS的商用电子稳定控制系统驱动无刷电机？
4 个回答
如何使用带Sphinx的automodule删除静态类变量？
11 个回答
如何使用带tensorflow的相册获得正确的形状尺寸
6 个回答
如何使用带uuid Django的IN运算符？
8 个回答
如何使用带vue的fastapi上载文件？我得到了无法处理的错误422
4 个回答
如何使用带上传功能的短划线按钮
10 个回答
如何使用带两个参数的lambda来查找值最大的元素？
5 个回答
如何使用带代理的urllib2发送HTTP请求
4 个回答
如何使用带位置参数的函数删除字符串上的字母？
9 个回答
如何使用带元组的itertool将关节移动到不同的位置？
7 个回答
如何使用带关键字参数的replace（）方法替换空字符串
11 个回答

递归文件读取火花流

相关问题更多 >

编程相关推荐

热门问题

热门文章

递归文件读取火花流

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >