如何在Python中对多个术语使用正向和反向前瞻？

df = pd.DataFrame({'person_id': [11,11,11,11,11,11,11,11,11,11], 'text':['inJECTable 1234 Eprex DOSE 4000 units on NONd', 'department 6789 DOSE 8000 units on DIALYSIS days - IV Interm', 'inJECTable 4321 Eprex DOSE - 3 times/wk on NONdialysis day', 'insulin MixTARD 30/70 - inJECTable 46 units', 'insulin ISOPHANE -- InsulaTARD Vial - inJECTable 56 units SC SubCutaneous', '1-alfacalcidol DOSE 1 mcg - 3 times a week - IV Intermittent', 'jevity liquid - FEEDS PO Jevity - 237 mL - 1 times per day', '1-alfacalcidol DOSE 1 mcg - 3 times per week - IV Intermittent', '1-supported DOSE 1 mcg - 1 time/day - IV Intermittent', '1-testpackage DOSE 1 mcg - 1 time a day - IV Intermittent']})

1条回答

网友

1楼 · 发布于 2024-05-16 11:31:23

<>你可以考虑像

这样的模式。

\s*\d+\s*(?:units?|times?(?:\s+(?:a|per)\s+|\s*/\s*)(?:d(?:ay)?|w(?:ee)?k|month|y(?:ea)?r?))

见regex demo

注意：\d+与一个或多个数字匹配。如果您需要匹配任何数字，请考虑使用您期望的格式的其他模式，例如参见{a2}。

图案细节

\s*-零个或多个空格字符
\d+-一个或多个数字
\s*-零个或多个空格
(?:units?|times?(?:\s+(?:a|per)\s+|\s*/\s*)(?:d(?:ay)?|w(?:ee)?k|month|y(?:ea)?r?))-非捕获组匹配：
- units?-unit或units
- |-或
- times?-time或times
- (?:\s+(?:a|per)\s+|\s*/\s*)-a或per用1+空格括起来，或/用0+空格括起来
- (?:d(?:ay)?|w(?:ee)?k|month|y(?:ea)?r?)-{}或{}，或{}或{}，或{}，或{}/{}/{}

如果只需要匹配整个单词，请使用单词边界，\b：

\s*\b\d+\s*(?:units?|times?(?:\s+(?:a|per)\s+|\s*/\s*)(?:d(?:ay)?|w(?:ee)?k|month|y(?:ea)?r?))\b

在熊猫中，使用

df['text'] = df['text'].str.replace(r'\s*\b\d+\s*(?:units?|times?(?:\s+(?:a|per)\s+|\s*/\s*)(?:d(?:ay)?|w(?:ee)?k|month|y(?:ea)?r?))\b', '')

相关问题更多 >

编程相关推荐

热门问题

热门文章