从csv文件python3.7中删除字母和符号

2024-06-16 12:51:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我得到了一个CSV文件,其中有一个名为activity的列,其数据如下:

instv2-02_00001_20190517235008
instv2 (9)
Insti2(3)
Fbstt1_00001_20190517131933

我只需要从“活动”列中的名称中删除数字和任何其他符号(例如:Β)。 这意味着只需要保留字母。 例如instv3-02_00001_20190517235157instv1-02_00000_20190517234840,instv1(4)…等都需要重命名/替换为instv。如何在Python脚本中执行此操作?在


Tags: 文件csv数据名称字母符号数字activity
2条回答

使用re模块和内置open函数:

import re

with open('Alldata10.csv', 'r') as file_r, open('Alldata10_revised.csv', 'w') as file_w:
    for line in file_r:
        line = line.split(',')
        line[0] = re.sub('[^a-zA-Z]+', '', line[0])
        line = ','.join(line)
        file_w.write(line)

{{cdex>使用replacement^和

请尝试以下代码:

import re
import pandas as pd

df = pd.read_csv('your_file.csv')
df['activity'] = df['activity'].apply(lambda x: re.sub(r'^([a-zA-Z]+).*', r'\1', x))
df.to_csv('output.csv', index=False)

{如果你的问题与你有关,那么} 导入re并将解决方案的最后一行更改为:

^{pr2}$

相关问题 更多 >