仅从数字分隔符中删除逗号（正则表达式分组）

3条回答

网友

1楼 · 编辑于 2024-05-14 23:35:22

您需要将数字捕获到组(\d+),(\d+)

import re

items = ['Hello, world!', 'Warhammer 40,000', 'Codename 1,337']

for item in items:
  item = re.sub(r'(\d+),(\d+)', r'\1\2', item)
  print(item)

结果:

Hello, world!
Warhammer 40000
Codename 1337

网友

2楼 · 编辑于 2024-05-14 23:35:22

您可以将Pandas str.replace()与正则表达式一起使用：

import pandas as pd

data = [
    "Hello, world!",
    "Warhammer 40,000",
    "Codename 1,337",
    "Total USD 1,27",
    "1,080,000,000 kilometers per hour"
]

df = pd.DataFrame(data, columns=["title"])
df["title"] = df["title"].str.replace(",(\d{3})", "\\1")
df

产生

    title
0   Hello, world!
1   Warhammer 40000
2   Codename 1337
3   Total USD 1,27
4   1080000000 kilometers per hour

网友

3楼 · 编辑于 2024-05-14 23:35:22

使用@uingtea regex，但对于pandas dataframe，可以通过以下方式执行：

import pandas as pd
import re

df = pd.DataFrame({'col':['Hello, world!', 'Warhammer 40,000', 'Codename 1,337']})
df['col'] = df['col'].apply(lambda x: re.sub(r'(\d+),(\d+)', r'\1\2', x))

相关问题更多 >

编程相关推荐

热门问题

热门文章

仅从数字分隔符中删除逗号（正则表达式分组）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >