开源ETL框架
我被要求设计两个ETL框架。需求如下:
- 开源
- 能在Linux上使用
- 有维护支持
- 可以在网页浏览器上查看日志(最好有这个功能)
- 使用Perl、Python、Ruby或Java编写
原始文件可以是任何格式(比如Excel、CSV、HTML页面等)。目标数据库是MySQL。
请不要只是列出名字,还要根据你的经验说明优缺点。
谢谢!
3 个回答
3
另一个选择是 CloverETL。它是用Java编写的,并且有一个开源的、遵循LGPL协议的引擎版本。此外,还有一个免费的图形界面版本,叫做CloverETL Community。
它可以处理各种指定的数据源,并且可以连接到多个数据库,包括MySQL。
7
最受欢迎的基于Java的ETL工具之一是Talend。
Jaspersoft ETL是另一个从Talend扩展出来的工具,它有一个很不错的基于Eclipse的用户界面。
4
我用过Kettle这个工具。它有自己的图形界面(GUI),但如果你更喜欢用程序接口(API)自己来做数据提取、转换和加载(ETL),也是可以的。对我来说,这个工具非常有用,而且已经有一些插件可以使用了。