引号内的python分隔符导致错误标记化

2条回答

网友

1楼 · 编辑于 2024-05-28 19:35:19

使用pd.read_csv方法中的可选参数skipinitialspace=True跳过分隔符,后面的空格，这将产生所需的结果：

data = pd.read_csv(
    "Auszug_2020.csv", sep=",", encoding="ISO-8859-1",
    quotechar='"', skipinitialspace=True)

网友

2楼 · 编辑于 2024-05-28 19:35:19

根据您共享的示例数据，您是否可以尝试这样读取它：

df = pd.read_csv("sample.csv", header=None, sep='", "')
df.iloc[:, 0] = df.iloc[:, 0].str.replace('"', '')
df.iloc[:,-1] = df.iloc[:,-1].str.replace('"', '')

我对它进行了如下测试：

创建了一个包含4条记录的示例csv文件：

"4", "mercedes", "BLT254", "Arkis-UDV GmbH, Berlin, Oberweg", "2007"
"5", "bmw", "SUV873", "Meier Auto", "2013"
"4", "mercedes", "BLT254", "Arkis-UDV GmbH, Berlin, Oberweg", "2007"
"5", "bmw", "SUV873", "Meier Auto", "2013"

要测试的代码：

import pandas as pd

df = pd.read_csv("sample.csv", header=None, sep='", "')
df.iloc[:, 0] = df.iloc[:, 0].str.replace('"', '')
df.iloc[:,-1] = df.iloc[:,-1].str.replace('"', '')

print(df)

输出：

   0         1       2                                3     4
0  4  mercedes  BLT254  Arkis-UDV GmbH, Berlin, Oberweg  2007
1  5       bmw  SUV873                       Meier Auto  2013
2  4  mercedes  BLT254  Arkis-UDV GmbH, Berlin, Oberweg  2007
3  5       bmw  SUV873                       Meier Auto  2013

相关问题更多 >

编程相关推荐

热门问题

热门文章

引号内的python分隔符导致错误标记化

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >