python.js页面解析

2条回答

网友

1楼 · 编辑于 2024-06-01 02:05:56

您可以编写带有捕获组的regexp模式：

import re
with open('filter.js') as file:
    pattern = r'staffarray\[(?P<first_index>\d+)\]\s*\[(?P<second_index>\d+)\] = "(?P<name>.+)"'
    for line in file:
        match = re.search(pattern, line)
        if match:
            first_index, second_index, name = match.groups()
            # do something with data

网友

2楼 · 编辑于 2024-06-01 02:05:56

如果您对regex有问题，那么使用标准的字符串函数和切片。你知道吗

首先将代码分成行，然后搜索staffarray[和[0]或[1]。最后使用切片。你知道吗

import urllib

req = urllib.urlopen("http://timetable.ait.ie/js/filter.js")
lines = req.read().split('\n')

for x in lines:
    if 'staffarray[' in x:
        if '[0] = ' in x:
            start = x.find('"')+1
            end = -3
            print '0', x[start:end]
        elif '[1] = ' in x:
            start = x.find('"')+1
            end = -3
            print '1', x[start:end]

相关问题更多 >

编程相关推荐

热门问题

热门文章

python.js页面解析

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >