pandas.errors.ParserError：标记d时出错

WNS 01.20 57039 108.8833 34.0833 445.8 LC 20150322120000 OOBS 00100 ///// ///// ////// /// /// //////// 00160 216.3 003.7 0006.5 100 100 -1.2E+02 00220 258.9 006.7 0006.6 100 100 -1.3E+02 00280 263.9 007.9 0006.6 100 100 -1.3E+02

File "D:\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 655, in parser_f return _read(filepath_or_buffer, kwds) File "D:\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 411, in _read data = parser.read(nrows) File "D:\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1005, in read ret = self._engine.read(nrows) File "D:\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1748, in read data = self._reader.read(nrows) File "pandas/_libs/parsers.pyx", line 890, in pandas._libs.parsers.TextReader.read (pandas\_libs\parsers.c:10862) File "pandas/_libs/parsers.pyx", line 912, in pandas._libs.parsers.TextReader._read_low_memory (pandas\_libs\parsers.c:11138) File "pandas/_libs/parsers.pyx", line 966, in pandas._libs.parsers.TextReader._read_rows (pandas\_libs\parsers.c:11884) File "pandas/_libs/parsers.pyx", line 953, in pandas._libs.parsers.TextReader._tokenize_rows (pandas\_libs\parsers.c:11755) File "pandas/_libs/parsers.pyx", line 2184, in pandas._libs.parsers.raise_parser_error (pandas\_libs\parsers.c:28765) pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 5, saw 7

1条回答

网友

1楼 · 发布于 2024-04-20 13:54:19

在将test.txt文件保存为您复制的文件后，我想出了几个解决方案。在

import pandas as pd
import functools

def main():
    data = pd.read_table( # this will not fail, but doesn't produce NaNs
        'test.txt', delim_whitespace=True, skiprows=range(0,3), header=None,
    )
    print(data)

    # force conversion to numbers on all rows, if it fails fills with NaNs
    data_numeric = data.apply(functools.partial(pd.to_numeric, errors='coerce'))
    print(data_numeric)

    # if you know all values to be read as NaN, you can just pass them...
    # to na_values
    data_with_na = pd.read_table(
        'test.txt', delim_whitespace=True, skiprows=range(0,3), header=None,
        na_values=('/////', '//////', '///', '////////')
    )
    print(data_with_na)


if __name__=='__main__':
    main()

运行中：

^{pr2}$

总之，如果您事先知道要解析为NaN的'/'字符串，那么将它们全部传递给pd.read_table的na_values参数应该是最佳选择。在

apply(pd.to_numeric)解决方案使用了一点暴力，尽管您可以将其限制为仅包含“/”的行以使其更好。在

相关问题更多 >

编程相关推荐

热门问题

热门文章