脚本驱动的Google Refine自动化:Ruby、Python、Perl、Java或其他方式

3 投票
1 回答
1569 浏览
提问于 2025-04-17 08:49

背景:

同事亚当在过去一年里一直在使用Google refine来处理数据库下载,效果非常好。但亚当最近收到了一个新的工作机会,因此他在Google refine上做的所有工作和积累的经验都将不复存在。

本希望亚当能把他在Google refine上做的所有工作整理成一个包,这样办公室里的其他人就可以继续受益于他的成果,而不需要了解如何使用Google refine本身。也就是说,可以把它作为一个批处理程序来运行,只需指定输入文件,最后就能得到“处理过”的输出结果。

问题:

有没有人有过使用Google refine进行无手动操作的批处理的经验?用户只需要指定:1)输入文件;2)转换设置文件(或者Google refine的转换规则)?

问题:

如果没有这样的功能,还有没有其他类似的工具可以实现与Google refine相近的效果?

1 个回答

4

有一个Python的客户端库,可以用来操作Refine服务器,这可能对你想做的事情有帮助。

http://pypi.python.org/pypi/refine-client https://github.com/maxogden/refine-python

撰写回答