如何加快从python对ruby程序(github的语言学家)的重复调用?

2024-04-29 06:36:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用github的linguist来识别未知的源代码文件。在gem install github-linguist之后从命令行运行这个程序非常慢。我正在使用python的subprocess模块对一个ubuntu14安装进行命令行调用。你知道吗

对空文件运行:linguist __init__.py大约需要2秒钟(其他文件的结果类似)。 我假设这完全是从Ruby的启动时间开始的。正如@MartinKonecny所指出的,似乎是语言学家课程本身。你知道吗

有没有什么方法可以加快这个过程——或者把这些调用捆绑在一起?你知道吗


Tags: 模块install文件命令行py程序githubgem
1条回答
网友
1楼 · 发布于 2024-04-29 06:36:29

一种可能是调整linguist程序(https://github.com/github/linguist/blob/master/bin/linguist)以在命令行上采用多个路径。当然,它需要一点Ruby,但是它可以传递多个文件,而不需要每次都有语言学家的启动开销。你知道吗

这么简单的脚本就足够了:

require 'linguist/file_blob'
ARGV.each do |path|
  blob = Linguist::FileBlob.new(path, Dir.pwd)
  # print out blob.name, blob.language, blob.sloc, etc.
end

相关问题 更多 >