在python绑定/clang中解析cpp文件时过滤目录
我需要写一个Python和Clang结合的解析器,用来返回C++文件中的所有包含的文件。
所以我用了一些类似下面的代码:
def _main():
from clang.cindex import Index
from optparse import OptionParser
filter=['/usr/lib','usr/include']
p=OptionParser()
(o,a)=p.parse_args()
i=Index.create()
t=i.parse(None,a)
for i in t.get_includes():
print i.include
if __name__=='__main__':
_main()
现在我需要过滤掉一些包含的文件,比如特定的目录:
filter=['/usr/lib','usr/include']
问题1:我想知道怎么实现这个过滤,代码应该怎么改?
问题2:怎么制作一个配置文件,把所有这些过滤的目录放进去,而不是直接在代码里写死?
要运行测试,你需要有一个像这样的C++文件:
#include<iostream>
#include"ex1.h"
int main(){
return 0;
}
还有一个*.h文件:
#include<QMap>
运行:
./python-clang.py ex1.cpp
结果示例:
/usr/include/pthread.h
/usr/include/sched.h
/usr/include/time.h
/usr/include/bits/sched.h
/usr/include/time.h
/usr/include/bits/time.h
/usr/include/signal.h
/usr/include/bits/sigset.h
/usr/include/bits/pthreadtypes.h
/usr/include/bits/wordsize.h
/usr/include/bits/setjmp.h
/usr/include/bits/wordsize.h
/usr/include/bits/wordsize.h
/usr/include/unistd.h
/usr/include/bits/posix_opt.h
/usr/include/bits/environments.h
/usr/include/bits/wordsize.h
/usr/include/bits/confname.h
/usr/include/getopt.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/i486-linux-gnu/bits /atomic_word.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/bits/locale_classes.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/string
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/bits/allocator.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/i486-linux-gnu/bits/c++allocator.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/ext/new_allocator.h
1 个回答
2
你可以在你的 for
循环里这样做:
...
for i in t.get_includes():
if not i.include in filter:
print i.include
...
关于包含排除项的配置文件,你可以这样写:
def _main():
...
with open('/path/to/file/ignore.txt') as f:
filter = f.readlines()
...
然后在 ignore.txt
文件里:
/usr/lib
/usr/include
...
更新
根据你对问题的评论和修改。
def _main():
...
with open('/path/to/file/ignore.txt') as f:
ignore = map(lambda l: l.strip(), f.readlines())
for i in t.get_includes():
if not i.include.startswith(ignore):
print i.include
这里有几点需要注意:
- 我把变量名
filter
改成了ignore
,因为filter
是一个内置类型。 - 在
ignore.txt
文件里的每一行会去掉\n
,并转换成tuple
(元组),而不是list
(列表),这样在读取时可以用startswith
方法。 - 你也可以使用列表推导式把 过滤 后的结果放到一个列表里,以便后续使用。
results = [i.include for i in t.get_includes() if not i.startswith(ignore)]