lis中的拆分元素

import re pattern_price = r'\[u\'\$.*?\]' patternx = r"(.*?u.*?)(\d+\,\d+\,\d+|\d+\,\d+)" with open(fpath, "r") as f: for line in f.readlines(): lst = re.findall(pattern_price, line) print len(lst) # I get list with 1 element? newlst = [x.split(patternx) for x in lst] print len(newlst) # I got 1 element again?

1条回答

网友

1楼 · 发布于 2024-05-15 22:30:05

你的代码有几个问题。在

创建一个变量来保存这些值

与您当前的问题无关，但如果您想扩展您的解决方案：

您正在迭代文件的行，但没有保留一个保存已通过的值的变量。在

是的，您正在创建一个列表，但是该列表会在for循环中为每一行重新创建。在

因此，保留最后一行的文件，

要解决此问题，请在循环之前添加一个变量并将其添加到该变量中。在

with open(fpath, "r") as f:
    lst = []
    for line in f.readlines():
        lst.append( ... )

价格模式

你正在捕获持有价格的字符串的全部部分。这就是为什么你只能得到一个匹配，而不是每一个价格一个匹配。在

要仅捕获价格，可以使用以下regex：

^{pr2}$
按正则表达式拆分字符串
您正在尝试按正则表达式拆分字符串：
x.split(patternx)
它的作用是，它接受正则表达式，充当一个分隔符字符串，而不是正则表达式。在
因此，它只是将子字符串与string进行比较，找不到任何匹配项，只返回整个字符串。在
您应该改为使用re.split。在
从字符串中提取数字
最后，剩下的字符串必须转换为数字并添加到列表中。在
为此，必须遍历re.findall返回的列表，去掉逗号并将其转换为int
prices = re.findall(pattern, line) for price in prices: number = int(price.replace(',', '')) lst.append(number)
最终代码
import re pattern = r'\$([\d,]{7,11})' with open(fpath, "r") as f: lst = [] for line in f.readlines(): prices = re.findall(pattern, line) for price in prices: number = int(price.replace(',', '')) lst.append(number) print lst

创建一个变量来保存这些值

价格模式

按正则表达式拆分字符串

从字符串中提取数字

最终代码

相关问题更多 >

编程相关推荐

热门问题

热门文章