filemerge:合并小hdfs文件的工具

filemerge的Python项目详细描述


文件合并

filemerge是一个实用程序,用于将大量小hdfs文件合并到 较小数量的大文件。filemerge用于hadoop操作 工程师和Map Reduce应用程序开发人员。

代码的结构很简单。实际的合并是由pig执行的 使用用户提供的参数在运行时创建的脚本。这些参数 控制要合并的文件集。该实用程序由单个文件组成, filemerge.py ,它接受输入参数并调用创建的pig 脚本。因此, pig 命令必须可用,并位于 运行时用户。 用户指定输入路径、输出路径、主题和 要合并为年/月/日格式或特定hdfs目录的文件 或文件中hdfs目录的列表。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
由于测试失败,java testcontainers maven构建失败   java实现jacobi算法实现laplace方程   java中的多线程:如何在不等待所有线程使用ExecutorService完成任务的情况下终止所有线程的执行?   java Hello World不在Android Studio 3中工作   ubuntu Tomcat7的Java版本不正确   java Javafx内存泄漏   对于手动实现的Spring数据存储库方法,我应该使用Java8默认方法吗?   googleappengine中的java添加过滤查询   html当使用JSOUP库在Java中读取标签时,如何保留标签(如<br>、<ul>、<li>、<p>等)的含义?   编码为什么jasper生成的报告在Java中不显示西里尔语(保加利亚语)?   java有没有办法隐藏当前位置和jdk动作?   java找出编译原型文件的版本   有没有办法在运行时更改java方法的访问修饰符?   语法字符串。。。Java中的参数   java数组元素在添加其他元素时会相互覆盖   eclipse中的java GWT项目   java如何为spring rest模板请求将动态json属性名映射到jackson   java无法在Windows 10上找到特定的JDK   在xml字符串和java字符串之间提取正则表达式子字符串