ibm streams hdfs集成

streamsx.hdfs的Python项目详细描述


概述

提供访问HDF上文件的功能。例如,连接到IBM Cloud上的IBM分析引擎

此包将com.ibm.streamsx.hdfs工具包公开为python方法,用于上的流分析服务 IBM Cloud和IBM Streams,包括ibmcloud-Pak for Data

样品

streams应用程序向 给HDFS的文件扫描hdfs上创建的文件并读取内容:

from streamsx.topology.topology import *
from streamsx.topology.schema import CommonSchema, StreamSchema
from streamsx.topology.context import submit
import streamsx.hdfs as hdfs

credentials = json.load(credentials_analytics_engine_service)

topo = Topology('HDFSHelloWorld')

to_hdfs = topo.source(['Hello', 'World!'])
to_hdfs = to_hdfs.as_string()

# Write a stream to HDFS
hdfs.write(to_hdfs, credentials=credentials, file='/sample/hw.txt')

scanned = hdfs.scan(topo, credentials=credentials, directory='/sample', init_delay=10)

# read text file line by line
r = hdfs.read(scanned, credentials=credentials)

# print each line (tuple)
r.print()

submit('STREAMING_ANALYTICS_SERVICE', topo)
# Use for IBM Streams including IBM Cloud Pak for Data
# submit ('DISTRIBUTED', topo)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java New Relic cpu使用情况Heroku应用程序   数学为什么在Java中,两个相同的数字以略微不同的形式书写会产生两种不同的结果   java如何用不同的宽度在彼此内部绘制圆?   键入数组时for循环和for each循环之间的java差异   java选定菜单文本颜色   java CollappingToolbarLayout EnterAlways Collapsed不起作用   java字符串处理中间3个字母   用于生成XML签名的每个元素上的java SOAP头xmlns:ds   java写入文件/大量字节失败   java以编程方式读取队列的参数   java如何使用webdriver在弹出消息中选择元素?   java Json数组对象通过控制器[Spring Boot]传递到模型   java如何创建应用程序。生成EAR文件时代码中的xml?   java我尝试将一些值设置为整数数组,但这些值不会保持不变   java Android Studio:缺少SDK   如何使用java在RESTWeb服务中下载不同类型的文件   Java堆与平衡树   java需要一种在扫雷游戏中随机放置地雷的方法的帮助   java如何在适配器类外部更新RecyclerView适配器