Python regex在ex中的列出现问题

2024-04-16 12:00:41 发布

您现在位置:Python中文网/ 问答频道 /正文

你好,我是Python新手,我遇到了一个关于Python脚本的问题。我正在尝试使用regex从excel电子表格中的特定列中提取名称。示例是查找包含st的所有名称。我在查找代码的全名时没有问题,只是在regex部分遇到了问题。你知道吗

import re
wb = openpyxl.load_workbook('NAME.xlsx') 
ex = wb['name']
fc = ex['B'] 

mo = re.compile(r"BL.*")
new = mo.search(str(fc))

因此,我从电子表格中命名了fcB,并尝试搜索以BL开头的B列中的所有项目(一旦我开始工作,我将处理包含任何内容的内容)。我似乎不能让它工作。没有错误,但我无法打印出任何内容。我相信这是一个新手很容易错过的东西,但我一直在试图解决这个问题,但没有成功。你知道吗

任何帮助都将不胜感激


Tags: re脚本名称示例内容excelregexex
1条回答
网友
1楼 · 发布于 2024-04-16 12:00:41

我建议使用熊猫。你知道吗

首先,导入熊猫库:

import pandas as pd

然后调用read\u excel方法将数据读入数据框。指定工作簿中要读取的工作表的名称:

wb = pd.read_excel('NAME.xlsx', sheet_name = 'your_sheet_name_here')

默认情况下,每列的第一行将成为数据帧中的列名。由于我还没有看到你的数据,我将假设感兴趣的列被称为“B”。您可以使用pandas中的extract方法提取列“B”中以“BL”开头的文本。让我们把提取的结果放在数据帧的一个新列中,名为“found\u it”:

wb['found_it'] = wb['B'].str.extract(r'((BL)*)', expand = True)

相关问题 更多 >