在python绑定/clang中解析cpp文件时过滤目录

3 投票
1 回答
864 浏览
提问于 2025-04-17 22:49

我需要写一个Python和Clang结合的解析器,用来返回C++文件中的所有包含的文件。

所以我用了一些类似下面的代码:

def _main():
    from clang.cindex import Index
    from optparse import OptionParser

    filter=['/usr/lib','usr/include']
    p=OptionParser()
    (o,a)=p.parse_args()
    i=Index.create()
    t=i.parse(None,a)
    for i in t.get_includes():
        print i.include

if __name__=='__main__':
    _main()

现在我需要过滤掉一些包含的文件,比如特定的目录:

filter=['/usr/lib','usr/include']

问题1:我想知道怎么实现这个过滤,代码应该怎么改?

问题2:怎么制作一个配置文件,把所有这些过滤的目录放进去,而不是直接在代码里写死?

要运行测试,你需要有一个像这样的C++文件:

  #include<iostream>
  #include"ex1.h"

  int main(){
      return 0;
  }

还有一个*.h文件:

 #include<QMap>

运行:

./python-clang.py ex1.cpp

结果示例:

 /usr/include/pthread.h
 /usr/include/sched.h
 /usr/include/time.h
 /usr/include/bits/sched.h
 /usr/include/time.h
 /usr/include/bits/time.h
 /usr/include/signal.h
 /usr/include/bits/sigset.h
 /usr/include/bits/pthreadtypes.h
 /usr/include/bits/wordsize.h
 /usr/include/bits/setjmp.h
 /usr/include/bits/wordsize.h
 /usr/include/bits/wordsize.h
 /usr/include/unistd.h
 /usr/include/bits/posix_opt.h
 /usr/include/bits/environments.h
 /usr/include/bits/wordsize.h
 /usr/include/bits/confname.h
 /usr/include/getopt.h
 /usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/i486-linux-gnu/bits      /atomic_word.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/bits/locale_classes.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/string
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/bits/allocator.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/i486-linux-gnu/bits/c++allocator.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/ext/new_allocator.h

1 个回答

2

你可以在你的 for 循环里这样做:

...
for i in t.get_includes():
    if not i.include in filter:
        print i.include
...

关于包含排除项的配置文件,你可以这样写:

def _main():
    ...
    with open('/path/to/file/ignore.txt') as f:
        filter = f.readlines()
    ...

然后在 ignore.txt 文件里:

/usr/lib
/usr/include
...

更新

根据你对问题的评论和修改。

def _main():
    ...
    with open('/path/to/file/ignore.txt') as f:
        ignore = map(lambda l: l.strip(), f.readlines())

    for i in t.get_includes():
        if not i.include.startswith(ignore):
            print i.include

这里有几点需要注意:

  1. 我把变量名 filter 改成了 ignore,因为 filter 是一个内置类型。
  2. ignore.txt 文件里的每一行会去掉 \n,并转换成 tuple(元组),而不是 list(列表),这样在读取时可以用 startswith 方法。
  3. 你也可以使用列表推导式把 过滤 后的结果放到一个列表里,以便后续使用。

results = [i.include for i in t.get_includes() if not i.startswith(ignore)]

撰写回答