如何利用Pandas阅读?

2024-04-25 04:35:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图加载一个CSV文件,但不断得到以下错误

UnicodeDecodeError:'utf-8'编解码器无法解码位置0中的字节0xa1:无效的起始字节

这是我的密码:

import numpy as np dataset = pd.read_csv('refined5.csv', error_bad_lines=False, skiprows=[0])

文件可在以下位置找到: jmp.sh/xKopnNi公司你知道吗

我意识到这是一个unicode转换错误,我希望python加载或跳过这一行,以便加载文件的其余部分。你知道吗


Tags: 文件csvimportnumpy密码字节as错误
3条回答

读取文件时使用encoding = 'latin1'。你知道吗

Downloads$ python3
Python 3.7.0 (default, Jul 23 2018, 20:22:55)
[Clang 9.1.0 (clang-902.0.39.2)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy as np
>>> import pandas as pd
>>> dataset = pd.read_csv('refined5.csv', encoding = 'latin1')
>>> dataset
           human fall flat  1277.33
           0  ¡??æ? ??æª ????        1

尝试在记事本中打开文件并使用UTF-8编码保存它。当我有类似的错误时,它对我有效。你知道吗

检查此项:

我已经加载了您在csv文件(f1.txt)中提到的错误记录:

mayankp@mayank:~/$ cat f1.txt 
¡??ˆæ? ??ˆæª Ÿ??ˆ??,1

In [89]: df = pd.read_csv('f1.txt', header=None)

In [90]: df
Out[90]: 
                     0  1
0  ¡??ˆæ? ??ˆæª Ÿ??ˆ??  1

我能很容易地通过熊猫读懂它。你知道吗

相关问题 更多 >