运行实时预测模型的数据聚合管道
blurr-dev的Python项目详细描述
目录
什么是blur?
blur使用名为blur transform spec(bts)的high-level expressive YAML-based language
将结构化的、流式的raw data
转换为features
,用于模型训练和预测。bts将模式和计算模型合并起来进行数据处理。
bts是结构化数据的数据转换定义。bts封装了数据转换的业务逻辑,blur编排了数据转换的执行。Blurr与运行程序无关,因此BTS可以由Spark、Spark Streaming或Flink等事件处理器运行。
布勒适合你吗?
是的,如果:您正沿着ML“启蒙曲线”前进,并且正在考虑如何进行在线评分
游乐场
教程和文档
Coming up with features is difficult, time-consuming, requires expert knowledge. 'Applied machine learning' is basically feature engineering --- Andrew Ng
Streaming BTS Tutorial| Window BTS Tutorial
使用blur为特定用例准备数据:
参与Blur
欢迎来到Blur社区!我们很高兴你能分享我们对建立mlops的热情!
请创建一个new issue以开始讨论。另外,可以自由地选择一个现存的问题!
在发出请求之前,请在Contributor License Agreement上签名。
数据科学“Joel测试”
受(旧学派)Joel Test软件团队的启发,这里是我们的数据科学团队版本。你的分数是多少?
- 数据管道是版本化和可复制的
- 管道(重新)一步建成
- 部署到生产环境需要最少的工程帮助
- 成功的ml是一个漫长的游戏。你演奏得很好
- 改善。实验和迭代是一种生活方式
路线图
Blur目前正在开发者预览中。保持联系!:启动此项目或发送电子邮件hello@blurr.ai
仅限本地转换支持bts中的自定义函数和其他python库火花流道- S3支持数据接收器
- 作为中间存储的dynamodb
- 功能服务器