替换csv行/列中包含特定字符串的文本

2024-04-25 23:07:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我无法删除csv行中没有以这些特定字符开头的\u和相关文本,即;\u**。你知道吗

代码:

# Removing \u*?
import pandas as pd
reader=pd.read_csv('string_HT.csv', error_bad_lines=False)
for index,row in reader.iterrows(): 
    if  ("\u","\u*?","*?\u") in row['Hashtags'] :
        row['Hashtags'] = " "         

reader.to_csv("string_HT2.csv", index=False)

样本输入数据框:

df=pd.DataFrame({"Hashtags" : ["#DefendTheLand", "#526f\u696d\u7d39\u4ecb", "#30ac\u30f3\u30c0\u30e0", "#leadership" ]})

样本输出:

{"Hashtags" : ["#DefendTheLand", " ", " ", "#leadership"]}

我知道也有人问过类似的问题,我已经检查了其中的大部分,并尝试实现其他用户提供的所有方法,但我仍然无法得到正确的答案。我们将不胜感激。你知道吗

注:

我在我的原始文件中尝试了这段代码来进行初始清理。你知道吗

for index,row in df1.iterrows():
    df1['Hashtags'] =df1['Hashtags'].str.strip("u'  ',").str.strip("u'").str.strip("\u*?]").str.strip("u']").str.strip("',")

Tags: csv代码infalseforstringindexreader