如何用java代码并行读取拼花地板文件
可以并行读取拼花地板文件吗
我使用的是与这里描述的类似的东西(基于AvroParquetReader):how to read a parquet file, in a standalone java code? 但这是按顺序进行的,而不是并行进行的
干杯
你可以在下面搜索框中键入要查询的问题!
可以并行读取拼花地板文件吗
我使用的是与这里描述的类似的东西(基于AvroParquetReader):how to read a parquet file, in a standalone java code? 但这是按顺序进行的,而不是并行进行的
干杯
# 1 楼答案
我对拼花文件仍然很熟悉,我发现以Spark数据集的形式打开拼花文件以列出并行流会更快:
# 2 楼答案
我找到的唯一方法是有一个执行者池,这个池的每个工作人员都会读一个拼花文件